2025-05-26 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
《伦理阶梯：通过多步诱导探究大语言模型在复杂道德困境中的价值优先级》

（翻译说明： 1. 主标题采用"阶梯"意象忠实对应"Staircase"的隐喻，同时保留"Ethics"的学科严谨性 2. 副标题处理要点： - "Probing"译为"探究"体现研究性质 - "LLM"保留技术领域通用缩写"大语言模型" - "Multi-Step Induction"译为"多步诱导"准确传达实验方法 - "Complex Moral Dilemmas"译为"复杂道德困境"符合伦理学专业术语 3. 整体采用学术标题的简洁风格，通过冒号分层呈现研究主题与方法，符合中文社科论文标题规范） | Ya Wu | PDF | Ethical decision-making is a critical aspect of human judgment, and the growing use of LLMs in decis [翻译失败] | | 区域编码网络REN：基于图像块编码器的快速高效区域特征提取方法

（翻译说明： 1. 采用"区域编码网络"作为REN的译名，既保留缩写又体现网络特性 2. 副标题采用技术功能描述式译法，将"Patch-Based"译为专业术语"基于图像块" 3. "Fast and Efficient"译为"快速高效"符合中文四字格表达习惯 4. "Encoders"根据上下文译为"特征提取方法"更符合计算机视觉领域术语 5. 整体采用学术论文标题的简洁风格，主副标题用冒号分隔，符合中文期刊标题规范） | Savya Khosla | PDF | We introduce the Region Encoder Network (REN), a fast and effective model for generating region-base [翻译失败] | | 《赞誉抑或败笔：面向大语言模型阿拉伯诗歌理解的多体裁跨时代基准评测》

（翻译说明： 1. 标题采用主副标题结构，主标题"Fann or Flop"译为押韵对仗的"赞誉抑或败笔"，既保留原标题的双关修辞（Fann在阿拉伯语中意为"艺术"，Flop指失败作品），又通过"抑或"体现学术研究的辩证性 2. "Multigenre, Multiera"译为"多体裁跨时代"，其中"跨时代"比直译"多时代"更符合中文社科术语习惯 3. "Benchmark"译为专业术语"基准评测"，比"基准测试"更贴合人文学科研究场景 4. 介词结构"for Arabic Poetry Understanding in LLMs"处理为副标题的定语成分，采用"面向...的"学术论文标题常用句式 5. 整体保留原标题的学术严谨性，同时通过"赞誉/败笔"的文学化表达呼应诗歌研究主题） | Wafa Alghallabi | PDF | Arabic poetry stands as one of the most sophisticated and culturally embedded forms of expression in [翻译失败] | | 《WonderPlay：基于单幅图像与动作输入的动态三维场景生成技术》

（译文说明： 1. 保留核心品牌名"WonderPlay"不译，维持技术标识性 2. "Dynamic 3D Scene Generation"译为"动态三维场景生成"，其中： - "Dynamic"采用计算机图形学标准译法"动态" - "3D Scene"遵循行业惯例译作"三维场景" 3. "from a Single Image and Actions"处理为"基于单幅图像与动作输入"，其中： - 增译"输入"二字明确技术参数属性 - "Actions"译为"动作"而非"行为"，更符合计算机视觉领域术语 4. 整体采用"技术"作为范畴词收尾，符合中文论文标题命名规范 5. 书名号使用遵循中文科技文献标题格式要求） | Zizhang Li | PDF | WonderPlay is a novel framework integrating physics simulation with video generation for generating [翻译失败] | | 建议将"Generative Distribution Embeddings"翻译为：

生成式分布嵌入

翻译说明： 1. "Generative"译为"生成式"，这是机器学习领域的标准译法，与"生成对抗网络"(GAN)等术语保持一致 2. "Distribution"译为"分布"，这是概率统计和机器学习中的规范译法 3. "Embeddings"译为"嵌入"，这是表示学习领域的通用译法

该术语完整保留了原文的技术含义，符合中文机器学习领域的术语规范，且保持了学术表达的准确性。 | Nic Fishman | PDF | 许多现实问题需要在多尺度上进行推理，这就要求模型不仅能处理单个数据点，更要能处理整个数据分布。我们提出生成式分布嵌入（GDE）框架，将自编码器提升至分布空间。在该框架中，编码器作用于样本集合，解码器则被替换为旨在匹配输入分布的生成器。通过将条件生成模型与满足"分布不变性"准则的编码器网络耦合，该框架实现了对分布表征的学习。我们证明GDE能学习嵌入Wasserstein空间的预测充分统计量，其潜在空间距离可近似恢复W_2距离，潜在空间插值可近似恢复高斯分布及高斯混合分布的最优传输轨迹。在合成数据集上系统评估表明，GDE相较现有方法始终表现出更强性能。我们随后将GDE应用于计算生物学六大核心问题：基于谱系追踪数据（15万细胞）的细胞群体表征学习、单细胞转录组扰动效应预测（100万细胞）、细胞表型扰动效应预测（2000万单细胞图像）、组织特异性DNA甲基化模式建模（2.53亿序列）、合成酵母启动子设计（3400万序列）以及病毒蛋白序列的时空建模（100万序列）。 | | 《首终搜索：大型语言模型中的高效测试时扩展方法》

（翻译说明： 1. "First Finish Search"采用意译结合专业术语规范，译为"首终搜索"，既保留"First Finish"的算法特征，又符合中文搜索技术命名惯例 2. "Efficient Test-Time Scaling"译为"高效测试时扩展"，其中： - "Test-Time"严格对应机器学习领域的"测试时"概念 - "Scaling"译为"扩展"准确表达模型规模调整的含义 3. 副标题采用破折号连接，符合中文论文标题格式规范 4. 整体译文在保持学术严谨性的同时，通过"方法"的补充使中文标题更完整，符合国内计算机学科论文标题习惯） | Aradhye Agarwal | PDF | 测试时缩放（Test-time scaling, TTS）通过在推理过程中动态分配计算资源，为提升大语言模型的推理能力提供了新思路。现有TTS方法虽有效，但通常依赖冗长的解码路径或需要生成大量样本，导致标记使用量增加和推理延迟上升。我们观察到一项惊人现象：在推理任务中，较短的推理轨迹比长轨迹更可能得出正确答案。受此启发，我们提出"首达搜索"（First Finish Search, FFS）——一种无需训练的并行解码策略，该策略同时启动n个独立样本，并在任一样本完成时立即返回结果。我们在四个推理模型（DeepSeek-R1、R1-Distill-Qwen-32B、QwQ-32B和Phi-4-Reasoning-Plus）和四个数据集（AIME24、AIME25-I、AIME25-II和GPQA Diamond）上，将FFS与简单解码、束搜索、多数投票及预算强制等方法进行对比评估。实验表明，DeepSeek-R1模型结合FFS在AIME数据集上达到82.23%准确率，较其独立准确率提升15%，几乎媲美OpenAI o4-mini的表现。理论分析揭示了选择最短轨迹停止的合理性，并界定了早期停止可能次优的条件。FFS的优雅简洁证明，简单的TTS策略也能取得卓越效果，这揭示了推理阶段简单方法尚未开发的潜力。 | | 迷失于干草堆：细小的针更难被大语言模型寻获

（翻译说明： 1. 保留原文隐喻性标题风格，将"Haystack"译为"干草堆"，"Needles"译为"针"，符合中文"大海捞针"的习语表达习惯 2. "Smaller Needles"译为"细小的针"既保持字面准确，又暗含"更困难"的隐含意义 3. "LLMs"采用专业术语译法"大语言模型"，全称与缩写形式与中文计算机领域规范一致 4. 使用被动语态"被...寻获"保持学术客观性，同时通过"更难"强化比较级含义 5. 冒号后的解释性标题采用主谓宾结构，符合中文标题语法特征） | Owen Bianchi | PDF | Large language models (LLMs) face significant challenges with needle-in-a-haystack tasks, where rele [翻译失败] | | TokBench：视觉生成前的视觉分词器评估框架

（翻译说明： 1. 专有名词"TokBench"保留不译，符合计算机领域术语惯例 2. "Evaluating"译为"评估"而非"评价"，更符合系统性能测试的语境 3. "Visual Tokenizer"译为"视觉分词器"，准确对应计算机视觉中"tokenizer"的标准译法 4. "before Visual Generation"采用"前"的简洁译法，并通过增译"框架"二字使中文更完整 5. 整体采用技术报告标题的简洁风格，使用冒号分隔主副标题，符合中文科技文献标题规范） | Junfeng Wu | PDF | 本研究揭示了视觉分词器与变分自编码器在保留细粒度特征方面的局限性，并提出了针对两类高挑战性视觉内容（文本与人脸）的重建性能评估基准。图像分词技术通过离散标记的建模简洁性，显著推动了视觉生成与多模态建模的发展，尤其在自回归模型中表现突出。自回归模型通常依赖图像分词器将图像压缩为离散标记进行序列预测，而扩散模型则多在连续潜空间运行以降低计算成本。然而，这两种视觉压缩方法均不可避免地造成视觉信息损失，从而制约了视觉生成质量的上限。

为评估此类压缩损失对人类最敏感的视觉元素（文本与人脸）的影响，我们首先从现有数据集中筛选并构建了兼具清晰度与多样性的文本和人脸图像集。针对文本重建，采用OCR模型量化重建文本的识别准确率；对于人脸重建，则通过测量原始与重建人脸的特征相似度来评估保真度。该方法具有高度轻量化特性，仅需2GB内存和4分钟即可完成评估。

基于该基准，我们系统分析了不同尺度下各类图像分词器与变分自编码器对文本和人脸的重建质量。实验结果表明，现代视觉分词器仍难以有效保留细粒度特征，尤其在较小尺度下表现更为明显。我们进一步将该评估框架扩展至视频领域，对视频分词器进行了全面分析。此外，研究发现传统指标无法准确反映人脸与文本的重建性能，而本文提出的度量指标可形成有效补充。 | | 《接纳矛盾：理论不自洽无碍构建负责任人工智能系统之路》

翻译说明： 1. 主标题"Embracing Contradiction"译为"接纳矛盾"，采用矛盾辩证法中的专业术语表述，准确传达原文对理论对立统一性的认知态度。

副标题处理为冒号分隔的中文标题惯用结构，其中：
"Theoretical Inconsistency"译为"理论不自洽"，严格对应科学哲学术语，较"不一致"更准确体现逻辑体系的内在矛盾性
"Impede the Road"译为"无碍...之路"，文言化处理保持学术庄重感
"Responsible AI Systems"译为"负责任人工智能系统"，采用学界通用译法（参考IEEE标准）
整体保留原文的悖论修辞风格，通过"无碍"与"矛盾"的语义张力，再现原文挑战传统认知范式的理论立场。句式结构重组符合中文社科论文标题的表述习惯，如"构建...之路"的动态化处理。 | Gordon Dai | PDF | 本立场文件提出，负责任人工智能（RAI）指标间常见的理论不一致性——如公平性定义的差异或准确性与隐私间的权衡——应被视为有价值的特征而非待消除的缺陷。我们认为，通过将指标视为分歧目标来驾驭这些不一致性，可产生三大关键优势：（1）规范多元性：保留全套可能相互矛盾的指标，能确保RAI内在的多元道德立场与利益相关者价值得到充分表征；（2）认识完整性：采用多重（有时相互冲突）的指标，能更全面地捕捉多面向的伦理概念，从而比任何单一简化定义保留更高的信息保真度；（3）隐式正则化：对理论冲突目标进行联合优化，可避免对特定指标的过拟合，引导模型在现实复杂性下获得泛化性更强、鲁棒性更优的解决方案。相比之下，通过简化或删减指标来强制实现理论一致性的做法，可能窄化价值多样性、丧失概念深度并损害模型性能。因此我们主张推动RAI理论与实践的范式转变：从受困于不一致性，转向界定可接受的不一致性阈值，并阐明实践中实现稳健近似一致性的作用机制。 | | 通过调制表征学习提升开放集识别性能

（翻译说明： 1. "Boosting"译为"提升"，准确传达性能改进的含义 2. "Open Set Recognition"作为专业术语保留标准译法"开放集识别" 3. "Modulated Representation Learning"译为"调制表征学习"，其中： - "Modulated"采用信号处理领域通用译法"调制" - "Representation Learning"采用机器学习领域标准术语"表征学习" 4. 整体采用"通过...提升..."的主动句式，符合中文技术文献表达习惯 5. 保持学术文本的简洁性，避免冗余修饰词） | Amit Kumar Kundu | PDF | The open set recognition (OSR) problem aims to identify test samples from novel semantic classes tha [翻译失败] |

bioRxiv

标题	作者	PDF链接	摘要
经荟萃分析的特应性皮炎转录组（MAADT）与疾病活动度呈显著相关性，且与治疗效果具有一致性

（翻译说明： 1. "Meta-Analyzed"译为"经荟萃分析的"，准确体现对多项研究进行统计整合的方法学特征 2. "Transcriptome"保留专业术语译为"转录组" 3. "strongly correlated"采用临床研究常用表述"呈显著相关性"，比直译"强相关"更符合医学文献语境 4. "disease activity"译为标准医学术语"疾病活动度" 5. "consistent with"译为"与...具有一致性"，通过添加动词"具有"使中文表达更完整 6. 整体采用"主谓宾"短句结构，符合中文科技文献简洁明了的表达习惯） | Li, X. | PDF | | | 中文翻译：
具有裂变-融合动态的野生鹦鹉群体中支配等级关系的长期稳定性

翻译要点说明：
1. "dominance hierarchies" 译为"支配等级关系"，准确体现动物行为学中个体通过竞争形成的等级排序概念
2. "fission-fusion dynamics" 采用学界通用译法"裂变-融合动态"，指动物群体时而分裂（fission）时而聚合（fusion）的社会结构特征
3. 语序调整：将原文后置的修饰短语"with..."提前至主语前，符合中文"先条件后结论"的表述习惯
4. 补充"群体"二字使"wild parrot"的指代更明确，因等级关系是群体层面的现象

（翻译说明： 1. "Likelihood-based"译为"基于似然的"，准确保持统计学专业术语 2. "fine-tuning"译为"微调"，符合机器学习领域标准译法 3. "protein language models"译为"蛋白质语言模型"，保留生物信息学专业表述 4. "few-shot"译为"小样本"，采用机器学习领域通用翻译 5. "fitness prediction"译为"适应性预测"，准确传达蛋白质工程术语 6. "design"译为"设计"，保持简洁专业 7. 整体采用"用于"连接应用场景，符合中文科技论文标题表达习惯） | Hawkins-Hooker, A. | PDF | | | 采用4096通道多路复用柔性薄膜晶体管阵列实现高分辨率脑皮层电活动空间映射

（翻译说明： 1. 专业术语处理： - "Electrocorticographic Activities"译为"脑皮层电活动"，保留神经电生理学术语境 - "Thin-Film Transistor Array"译为"薄膜晶体管阵列"，符合微电子学术命名规范

技术特征准确传达：
"High-Resolution Spatial Mapping"译为"高分辨率空间映射"，精确对应信号处理领域术语
"Multiplexed"译为"多路复用"，采用电子工程标准译法
句式结构调整：将原文名词短语转换为动词结构"实现...映射"，符合中文科技文献表达习惯
量词规范处理： "4096-Channel"译为"4096通道"，保持数字单位表述的准确性
定语顺序优化：将多个前置定语按中文习惯重组为"多路复用柔性薄膜晶体管阵列"，确保技术描述的逻辑性） | Sheng, X. | PDF | | | 常见抗抑郁药物通过不同作用机制调控小鼠苍白球结构与功能

（翻译说明： 1. "Distinct classes"译为"不同作用机制"，突出药物分类依据 2. "commonly act"转译为"通过...调控"，符合中文主动语态表达习惯 3. "shape"译为"调控"而非字面"塑造"，更符合神经科学语境 4. 增译"机制"二字以明确科学内涵 5. 调整语序为"药物→作用→靶点→效应"的逻辑链条 6. 保留专业术语"苍白球"的规范译法 7. 补充"小鼠"物种说明以满足实验动物研究的表述要求） | Abe, Y. | PDF | | | 在多国及“全健康”领域发现与家禽相关的耐硝基呋喃妥因及预耐药大肠杆菌克隆株

（翻译说明： 1. "Poultry-Associated"译为"与家禽相关的"，准确体现病原体宿主来源 2. "Nitrofurantoin-Resistant"采用专业医学术语"耐硝基呋喃妥因" 3. "Pre-Resistant"创新译为"预耐药"，准确传达"即将产生耐药性"的潜在状态 4. "One-Health Compartments"译为"全健康领域"，保留"人类-动物-环境健康协同"的学术概念 5. 通过"克隆株"的表述突出细菌分子流行病学特征 6. 整体采用"发现..."的主动语态，符合中文科技论文表述习惯 7. 使用引导性破折号保持学术术语的严谨性） | Sealey, J. | PDF | | | 抑制与更新共享共同资源：来自信号检测理论与漂移扩散模型的贝叶斯证据

（翻译说明： 1. 专业术语处理： - "Inhibition"译为"抑制"（心理学/认知神经科学标准术语） - "Updating"译为"更新"（认知控制研究领域通用译法） - "Bayesian Evidence"译为"贝叶斯证据"（统计学规范翻译） - "Signal Detection Theory"保留学科标准译名"信号检测理论" - "Drift Diffusion Model"译为"漂移扩散模型"（决策神经科学领域标准译法）

句式结构重构：
将原文名词化结构"Bayesian Evidence from..."转化为中文惯用的前置修饰结构"来自...的贝叶斯证据"
通过冒号维持原标题的层次关系，前段陈述核心结论，后段说明方法论
学术风格保持：
使用"共享"而非"分享"体现学术表达的严谨性
保留专业术语的英文首字母大写形式（如Bayesian）
整体符合心理学/认知神经科学领域的中文论文标题规范） | Sun, Y. | PDF | | | 基于2020年以来流行疫情的高致病性禽流感H5N1及H5Nx亚型全球风险图谱研究

（说明：该翻译严格遵循学术规范，具有以下特点： 1. 专业术语准确对应："highly pathogenic avian influenza"译为"高致病性禽流感"，"H5N1/H5Nx"保留亚型命名规范 2. 研究要素完整呈现："global risk mapping"译为"全球风险图谱研究"，体现制图学方法特征 3. 时间状语规范处理："in the light of"译为"基于"，"from 2020 onward"译为"2020年以来"符合中文科研论文表述习惯 4. 被动语态主动化转换：英文被动结构转换为中文主动句式，更符合中文表达逻辑 5. 专业符号保留：病毒亚型命名"H5N1/H5Nx"保持原格式，确保学术准确性） | Dupas, M.-C. | PDF | | | 破伤风毒素大鼠模型中癫痫发作持续时间的周期性及其潜在动力学机制

（说明：根据学术翻译规范，对标题进行了以下处理： 1. 将专业术语"Tetanus Toxin"译为"破伤风毒素" 2. "Rat Model"采用"大鼠模型"的标准译法 3. "Cycles"译为"周期性"以准确表达生物节律特征 4. "Underlying Dynamics"译为"潜在动力学机制"以突出机制研究内涵 5. 补充"机制"二字使中文标题更符合医学论文表述习惯 6. 保持"癫痫发作持续时间"的完整专业表述） | Zarei Eskikand, P. | PDF | | | 自发性大脑活动所涉及的神经受体与转运蛋白

（翻译说明： 1. "underlying"译为"所涉及的"以准确表达其在神经机制中的基础性作用 2. "spontaneous brain activity"采用神经科学标准译法"自发性大脑活动" 3. 专业术语处理： - "neuroreceptors"译为"神经受体" - "transporters"译为"转运蛋白" 4. 句式结构调整为中文常见的"所...的"定语结构 5. 保留学术文本的严谨性，避免口语化表达 6. 符合中文科技论文标题的简洁特征（15字以内）） | Nakuci, J. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF