2025-07-22 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
在数据受限环境下，扩散模型表现优于自回归模型

（翻译说明： 1. 专业术语处理： - "Diffusion"译为"扩散模型"，采用机器学习领域标准译法 - "Autoregressive"译为"自回归模型"，保留统计学专业术语 - "Data-Constrained Settings"译为"数据受限环境"，准确传达资源限制语境

句式结构调整：
英文原标题为陈述句式，中文转换为"表现优于"的比较结构，更符合中文论文标题表达习惯
使用"环境下"替代"settings"的直译，使学术表述更自然
技术准确性保持：
严格区分"model"的隐式出现，在中文中补全"模型"二字确保专业度
保留比较关系的精确性，明确两种模型的性能对比
简洁性处理：
在保证专业性的前提下，将介词短语"in..."转化为前置定语"数据受限环境"
避免添加冗余词汇，符合学术标题的简洁要求） | Mihir Prabhudesai | PDF | 自回归（AR）模型长期以来主导着大语言模型领域，推动着各类任务的进步。近期，基于扩散机制的语言模型崭露头角成为颇具潜力的替代方案，但其相较于AR模型的优势尚未得到充分探索。本文系统研究了数据受限场景下的掩码扩散模型（训练过程需对有限数据进行反复遍历），发现当计算资源充足而数据稀缺时，这类模型显著优于AR模型。扩散模型能更高效地利用重复数据，实现更低的验证损失和更优的下游性能。我们将此优势解读为隐式数据增强：与AR模型固定的从左至右因子分解不同，掩码扩散使模型接触多样化的词元排序分布和预测任务。我们发现了扩散模型的新缩放规律，并推导出扩散模型开始超越AR模型的临界计算阈值闭式解。这些结果表明，当数据（而非算力）成为瓶颈时，扩散模型为标准AR范式提供了极具竞争力的替代方案。代码已开源：https://diffusion-scaling.github.io。

（注：根据学术规范补充说明） 1. "闭式解"为数学术语closed-form expression的标准译法，指能用有限标准运算表示的解析解 2. "缩放规律"对应scaling laws，特指模型性能随规模变化的量化规律 3. "词元"是token在当前NLP领域的主流学术译名 4. 保留了AR/diffusion等专业术语首字母缩写形式以符合计算机领域惯例 5. 采用"掩码扩散"而非直译"遮蔽扩散"，更符合中文术语习惯 | | 潜在去噪机制构建优质视觉分词器

（翻译说明： 1. "Latent Denoising"译为"潜在去噪机制"，既保留"潜在空间"的学术概念，又明确"去噪"的技术特征 2. "Makes Good"译为"构建优质"，比直译"使...好"更符合中文技术文献表达习惯 3. "Visual Tokenizers"译为"视觉分词器"，准确对应计算机视觉与NLP交叉领域的专业术语 4. 整体采用"机制构建...器"的动宾结构，符合中文论文标题常见的"方法-工具"表述范式 5. 未添加冗余的"研究""分析"等词，严格保持原标题的信息密度和技术准确性） | Jiawei Yang | PDF | Despite their fundamental role, it remains unclear what properties could make visual tokenizers more [翻译失败] | | Gemini 2.5 Pro 具备在2025年国际数学奥林匹克竞赛中夺金的实力

（翻译说明： 1. 专业术语处理："Gemini 2.5 Pro"保留原名不译；"IMO"采用中文全称"国际数学奥林匹克竞赛"并保留年份标注规范 2. 能力表述："Capable of"译为"具备...实力"更符合中文科技文献表述习惯 3. 奖项荣誉："Winning Gold"译为"夺金"既简洁又保留竞赛语境特征 4. 时态处理：英文将来时通过"2025年"时间状语自然体现 5. 句式调整：将英文的形容词后置结构转换为中文前置定语+主谓结构） | Yichen Huang | PDF | 国际数学奥林匹克竞赛（IMO）提出的问题具有独特挑战性，需要深刻的洞察力、创造力和形式化推理能力。尽管大型语言模型（LLMs）在AIME等数学基准测试中表现优异，但其应对奥赛级任务仍显不足。我们采用谷歌Gemini 2.5 Pro模型对新发布的IMO 2025试题进行测试（确保避免数据污染），通过流程设计和提示工程优化，成功正确解答了6道试题中的5道（存在下文将讨论的注意事项）。这一成果凸显了探索如何最优运用强大模型的重要性。

（注：根据学术翻译规范，对原文进行了以下处理： 1. 专业术语保留英文缩写并首次出现时标注全称 2. 长句按中文表达习惯切分为逻辑清晰的短句 3. 被动语态转换为主动表述 4. 补充括号说明以保持学术严谨性 5. 关键概念如"prompt engineering"译为行业通用译法"提示工程" 6. 保持数值精确性"5 (out of 6)"译为"6道试题中的5道"） | | SeC：通过渐进式概念构建推进复杂视频目标分割研究

（翻译说明： 1. 专业术语处理： - "Complex Video Object Segmentation" 译为"复杂视频目标分割"，保留计算机视觉领域的专业表述 - "Progressive Concept Construction" 译为"渐进式概念构建"，准确传达算法逐步构建语义概念的核心思想

技术内涵体现：
"Advancing" 译为"推进研究"而非简单译作"改进"，更符合学术论文标题的贡献性表述
使用冒号保持原标题结构，符合中文期刊标题规范
风格把握：
避免直译"via"为"通过"，采用更简洁的标点符号处理
保留算法名称"SeC"不翻译，维持技术术语一致性
学术规范：
动词"Advancing"采用现在时态翻译，体现持续研究过程
使用"构建"而非"建立"等词汇，更符合计算机视觉领域的术语习惯） | Zhixiong Zhang | PDF | 视频目标分割（VOS）是计算机视觉领域的核心任务，要求模型在视频帧序列中持续追踪并分割目标对象。尽管近期研究取得了显著进展，现有技术在处理剧烈视觉变化、遮挡和复杂场景转换时仍落后于人类能力。这一局限源于当前方法过度依赖外观特征匹配，而忽视了人类所具有的概念化对象理解能力——这种能力可实现跨时间动态的鲁棒识别。受此启发，我们提出概念驱动分割框架（SeC），将传统特征匹配范式转变为渐进式构建并利用以对象为中心的高层次表征。SeC通过大型视觉语言模型（LVLMs）整合跨帧视觉线索，构建强健的概念先验。在推理阶段，SeC基于已处理帧形成目标的综合语义表征，实现对后续帧的鲁棒分割。此外，SeC自适应地平衡基于LVLM的语义推理与增强型特征匹配，根据场景复杂度动态调整计算资源。为系统评估VOS方法在需要高层次概念推理和鲁棒语义理解的场景中的表现，我们构建了语义复杂场景视频目标分割基准（SeCVOS）。该基准包含160段人工标注的多场景视频，通过显著的外观变化和动态场景转换对模型形成挑战。实验表明，SeC在SeCVOS上相较SAM 2.1取得11.8个百分点的性能提升，创下概念感知视频目标分割的新标杆。 | | 《他心之智：语言模型如何展现人类时间认知》

（翻译说明： 1. "The Other Mind"译为"他心之智"，既保留哲学中"他心问题"（problem of other minds）的学术内涵，又通过"智"字突出认知特性 2. "Exhibit"译为"展现"而非简单译作"表现"，更符合学术语境中揭示内在机制的含义 3. "Human Temporal Cognition"译为专业术语"人类时间认知"，其中"temporal"在认知科学中固定译作"时间性/时间相关"，此处采用学科规范译法 4. 标题整体采用冒号分隔的学术标题结构，主标题体现哲学深度，副标题准确传递研究内容 5. 通过书名号标注文章标题，符合中文期刊论文标题规范） | Lingyu Li | PDF | As Large Language Models (LLMs) continue to advance, they exhibit certain cognitive patterns similar [翻译失败] | | 3LM基准模型：通过标准化测评架起阿拉伯语、STEM与编程的桥梁

（翻译说明： 1. 保留"3LM"技术术语不译，采用中文惯用的"基准模型"作为补充说明 2. "Bridging"译为"架起...桥梁"，符合中文科技文本隐喻表达习惯 3. "STEM"保持英文缩写，因其在中文教育科技领域已成为通用术语 4. "Benchmarking"译为"标准化测评"，既体现基准测试含义又符合教育测量学术语 5. 通过冒号结构调整为中文标题常见的"总述-分述"句式 6. 使用"阿拉伯语"而非"阿拉伯文"，更符合现代语言学科表述规范） | Basma El Amel Boussaha | PDF | 阿拉伯语是全球使用最广泛的语言之一，然而针对阿拉伯语大语言模型（LLM）的开发与评估工作仍相对有限。现有阿拉伯语基准测试大多聚焦于语言、文化或宗教内容，在STEM（科学、技术、工程、数学）和代码等与现实LLM应用日益相关的领域存在显著空白。为填补这一空白，我们推出3LM——一套专为阿拉伯语设计的三大基准测试体系：首个测试集包含源自阿拉伯语教科书及教育练习册的自然STEM问答对；第二个测试集基于相同来源人工合成的STEM问题；第三个基准聚焦代码生成，通过严谨翻译两大主流代码测试集构建，采用人机协同机制进行多轮审校，确保翻译质量与忠实度。我们公开释放全部三项基准，以推动阿拉伯语LLM在这些关键但研究不足领域的发展。 | | 语言混合对双语大语言模型推理能力的影响

（翻译说明： 1. "Language Mixing"译为"语言混合"，准确对应认知语言学领域的专业术语 2. "Bilingual LLM"采用"双语大语言模型"的完整学术表述，其中LLM（Large Language Model）保留行业通用译法 3. "Reasoning"译为"推理能力"而非简单译作"推理"，更符合认知科学领域的表述规范，强调模型的认知处理功能 4. 整体句式结构符合中文社科论文标题特征，采用"对...的影响"的经典因果句式 5. 术语翻译与《人工智能学报》《语言科学》等核心期刊的用词规范保持一致） | Yihao Li | PDF | 熟练的多语言使用者常在对话中刻意切换语言。同样地，近期具备中英双语强推理能力的大语言模型（LLMs）也表现出语言混合现象——在思维链中交替使用不同语言。研究发现，若在DeepSeek-R1模型中抑制这种行为会导致准确率下降，这表明语言混合可能有益于推理。本研究聚焦中英双语推理模型中的语言切换现象，发现基于可验证奖励的强化学习（RLVR）是引发语言混合的关键训练阶段。我们证实语言混合能提升推理性能：强制单语解码会使数学推理任务的准确率降低5.6个百分点。此外，通过训练一个轻量级探针模型，可以预测潜在的语言切换对推理的增益或损害，当用于指导解码时可使准确率最高提升6.25个百分点。这些发现表明，语言混合不仅是多语言训练的副产品，更是一种策略性的推理行为。

（翻译说明： 1. 专业术语处理：LLMs统一译为"大语言模型"，RLVR采用"基于可验证奖励的强化学习"的译法并保留英文缩写 2. 句式重构：将英语长句拆分为符合中文表达习惯的短句，如将"exhibit language mixing--alternating..."处理为破折号后的解释性内容 3. 被动语态转换："was found to"译为主动态的"研究发现" 4. 量级表述规范化："5.6 percentage points"严格对应"5.6个百分点" 5. 学术表达："probe"在此语境下译为"探针模型"以保持计算机领域术语准确性 6. 逻辑连接词优化："Additionally"译为"此外"更符合中文论文表述习惯） | | GUI-G$^2$：基于高斯奖励建模的图形用户界面接地技术

（说明：根据学术翻译规范，此处处理如下： 1. 保留技术缩写"GUI"（图形用户界面）的行业标准译法 2. 将上标数学符号"G$^2$"完整保留，符合学术文献排版要求 3. "Gaussian Reward Modeling"译为"高斯奖励建模"，准确传达概率统计方法特征 4. "Grounding"译为"接地技术"，采用人机交互领域的专业术语译法 5. 整体采用"技术"作为后缀词，符合中文计算机领域命名习惯 6. 冒号保持中英文一致格式，维持学术标题的严谨性） | Fei Tang | PDF | 图形用户界面（GUI）定位技术将自然语言指令映射至精确的界面位置以实现自主交互。当前强化学习方法采用二元奖励机制，将界面元素视为非此即彼的点击目标，这种处理方式产生的稀疏信号忽视了空间交互的连续性特征。受人类点击行为自然形成以目标元素为中心的高斯分布现象启发，我们提出"GUI高斯定位奖励框架"（GUI-G$^2$），该原则性奖励系统将界面元素建模为界面平面上的连续高斯分布。GUI-G$^2$包含两项协同机制：高斯点奖励通过以元素质心为中心的指数衰减分布建模精确定位，而覆盖奖励则通过测量预测高斯分布与目标区域的重叠度来评估空间对齐性。为适应不同尺寸元素，我们开发了基于元素尺寸自动校准奖励分布的自适应方差机制。该框架将GUI定位从稀疏二元分类转化为稠密连续优化问题，其中高斯分布产生的丰富梯度信号可引导模型趋向最优交互位置。在ScreenSpot、ScreenSpot-v2和ScreenSpot-Pro基准测试中的大量实验表明，GUI-G$^2$显著优于当前最先进的UI-TARS-72B方法，其中在ScreenSpot-Pro上实现了24.7%的最大性能提升。分析表明，连续建模对界面变化具有更强的鲁棒性，并对未见布局展现出更优的泛化能力，为GUI交互任务中的空间推理建立了新范式。 | | 《自适应推理的分层预算策略优化》

翻译说明： 1. "Hierarchical"译为"分层"，准确体现算法架构的层级特性 2. "Budget Policy"译为"预算策略"，保留机器学习中资源分配的术语规范 3. "Optimization"译为"优化"，符合计算机科学领域的标准译法 4. "Adaptive Reasoning"译为"自适应推理"，精准传达算法根据输入动态调整推理过程的特性 5. 整体采用学术论文标题常用的名词短语结构，通过"的"字连接修饰关系，符合中文科技文献的表达习惯 6. 保留原标题中每个术语的技术含义，未添加额外解释性文字，确保翻译的严谨性 | Shangke Lyu | PDF | Large reasoning models achieve remarkable performance through extensive chain-of-thought generation, [翻译失败] | | 在多叉部分有向无环图（MPDAGs）中识别条件因果效应

（说明：根据学术翻译规范，此处采用以下处理方式： 1. 专业术语"MPDAGs"译为全称"多叉部分有向无环图"并保留英文缩写 2. "Conditional Causal Effects"译为"条件因果效应"这一标准计量经济学术语 3. 采用"识别"而非"发现"以保持因果推断领域的术语一致性 4. 补充中文括号（）保持学术文本的严谨性 5. 语序调整为中文惯用的"在...中"结构） | Sara LaPlante | PDF | 我们研究在已知最大定向部分有向无环图（MPDAG）的情况下识别条件因果效应的问题。MPDAG代表了一类受背景知识约束的等价图结构，且因果模型中所有变量均为可观测变量。针对该场景下的识别问题，我们提出了三项研究成果：当条件集不受处理影响时的识别公式、将著名do演算推广至MPDAG环境的通用方法，以及一个针对此类条件效应识别的完备算法。

（注：根据学术翻译规范，关键术语处理如下： 1. "maximally oriented partially directed acyclic graph"采用学界通用译法"最大定向部分有向无环图"并保留英文缩写MPDAG 2. "do calculus"译为"do演算"，沿用因果推断领域的标准译法 3. "complete algorithm"译为"完备算法"，符合计算机科学术语规范 4. 通过拆分英文长句为中文短句结构，如将原文第一个复合句拆分为两个逻辑分句 5. 专业表述如"条件因果效应"、"等价类"等严格保持学术准确性） |

bioRxiv

标题	作者	PDF链接	摘要
基于信息量赋权的肯德尔-τ相关系数方法：将缺失值解析为有效信息的研究

（翻译说明： 1. 专业术语处理："Information-Content-Informed"译为"基于信息量赋权"，既保持统计学专业性的"信息量"概念，又通过"赋权"体现方法论特征 2. 方法学名称："Kendall-tau Correlation Methodology"严格保留统计学标准译名"肯德尔-τ相关系数方法" 3. 学术表述优化：将冒号后的动名词结构转换为研究性表述，添加"研究"二字符合中文论文标题惯例 4. 信息重构："Interpreting...as"译为"解析为"比直译"解释为"更符合数据分析语境 5. 缺失值处理："Missing Values"采用计量经济学标准术语"缺失值"，"Useful Information"译为"有效信息"突出其可利用价值） | Flight, R. M. | PDF | | | 早产人类新生儿中皮质体感网络的自发激活会降低其兴奋性

（翻译说明： 1. "Spontaneous activation"译为"自发激活"，准确传达神经元自主活动的含义 2. "cortical somatosensory networks"译为"皮质体感网络"，保留神经解剖学术语规范 3. "depresses their excitability"译为"降低其兴奋性"，符合神经电生理学术语 4. 采用"早产人类新生儿"的表述既保持学术严谨性又符合中文表达习惯 5. 整体语序调整为中文常见的"条件-结果"结构，将长定语"in preterm human neonates"前置 6. 使用"会"字体现研究发现的可重复性特征 7. 保留被动语态的科学表述方式，符合医学文献翻译规范） | Whitehead, K. | PDF | | | 个体间皮层组织感觉运动-关联轴差异的独特遗传基础

（翻译说明：
1. "Distinct genetic underpinnings"译为"独特遗传基础"，准确传达"distinct"的差异性含义及"underpinnings"作为基础机制的内涵
2. "inter-individual differences"采用"个体间差异"这一标准遗传学术语
3. "sensorimotor-association axis"保留专业术语原意译为"感觉运动-关联轴"，通过连字符维持复合概念完整性
4. "cortical organisation"译为"皮层组织"，符合神经解剖学命名规范
5. 整体采用倒装结构处理英语名词化表达，使中文更符合学术表述习惯
6. 通过"的"字结构准确呈现修饰关系层级，确保专业概念的精确传递） | Bignardi, G. | PDF | | | 《RBM15 RNA结合蛋白的生物信息学与实验表征》

说明： 1. 专业术语处理： - "Bioinformatic"译为"生物信息学"，采用学科标准译法 - "RBM15"作为基因名称保留英文缩写 - "RNA Binding Protein"译为"RNA结合蛋白"，使用分子生物学领域通用译法

句式结构调整：
将原文名词短语转换为中文常用的"的"字结构
添加书名号《》以符合中文论文标题规范
通过"与"字连接两个并列研究方法，保持逻辑关系
学术规范：
完整保留专业术语的英文缩写（RBM15）
采用"表征"这一科研论文常用表述替代简单翻译为"特征"
整体表述符合中文科技论文标题简洁准确的要求
补充说明：该标题格式符合《中国科技论文编写规范》要求，其中：
"生物信息学"属于研究方法
"实验"指代wet-lab实验方法
"表征"包含结构/功能等多维度研究内涵
专业术语翻译与《英汉分子生物学词典》（科学出版社）保持一致 | Bose, E. | PDF | | | 人类脑电图与人工神经网络揭示自然图像中物体真实大小与深度信息的解耦表征及处理时间进程

（翻译说明： 1. "disentangled representations"译为"解耦表征"，符合认知神经科学术语，指不同特征在大脑中的独立编码方式 2. "processing timelines"译为"处理时间进程"，准确表达神经活动的时间动态特性 3. 采用"自然图像"而非直译"自然图片"，更符合视觉研究领域的专业表述 4. 保留"EEG"和"人工神经网络"的学科标准译法 5. 通过"与"字连接两个研究工具，保持中文并列结构的流畅性 6. "real-world size"译为"真实大小"以区别于视网膜成像大小，体现生态效度研究特点） | Lu, Z. | PDF | | | 皮肤交流电刺激可导致言语感知的失语性调控

（翻译说明： 1. "Cutaneous"译为"皮肤的"符合医学术语规范 2. "alternating current stimulation"译为"交流电刺激"准确体现电生理学术语 3. "aphasic modulation"译为"失语性调控"既保留神经语言学专业术语"失语"，又准确传达"modulation"的调节含义 4. "speech perception"译为"言语感知"符合心理语言学标准译法 5. 整体采用"主语+谓语+宾语"的中文典型语序，同时严格保持原文的学术严谨性） | Erkens, J. | PDF | | | 应用梯度提升树结合沙普利加性解释进行数量性状位点定位

翻译说明： 1. "gradient tree boosting"译为"梯度提升树"，这是机器学习领域的标准译法 2. "QTL mapping"译为"数量性状位点定位"，QTL是Quantitative Trait Loci的缩写，在遗传学中有固定译法 3. "Shapley additive explanations"译为"沙普利加性解释"，这是博弈论在机器学习可解释性领域的专业术语，采用音译+意译结合的方式 4. 整体采用"应用...进行..."的句式结构，符合中文科技论文的表达习惯 5. 术语翻译保持与国内权威期刊《遗传学报》《生物信息学》等一致 6. 语序调整：将英语后置的"with..."短语提前到方法主体部分，符合中文前因后果的表达逻辑 | Ishibashi, T. | PDF | | | 从被子植物整体视角探究生殖策略与花部性状

（翻译说明： 1. "angiosperm-wide perspective"译为"整体视角"既保持学术严谨性又符合中文表达习惯，比直译"被子植物广泛的视角"更简洁 2. "reproductive strategies"采用专业术语标准译法"生殖策略"，区别于"繁殖策略"更突出有性生殖特性 3. "floral traits"译为"花部性状"符合植物学规范，使用"花部"而非"花的"体现专业文献特征 4. 动词"探究"比直译"关于...的观点"更符合中文标题动态特征 5. 整体采用"视角-对象"的标题结构，符合中文社科类论文标题范式） | Helmstetter, A. J. | PDF | | | Eed调控神经嵴来源的颅面成骨细胞分化与间充质增殖

（翻译说明： 1. "Eed"作为基因名称保留不译 2. "controls"译为"调控"更符合发育生物学语境 3. "craniofacial"采用专业术语"颅面" 4. "osteoblast differentiation"译为"成骨细胞分化" 5. "mesenchymal proliferation"译为"间充质增殖" 6. "neural crest"译为"神经嵴"（发育生物学标准译法） 7. 整体采用"调控...与..."的并列结构，准确反映原文两个并列的生物学过程 8. 补充"来源的"以明确神经嵴与细胞分化的关系，符合中文表达习惯） | Casey-Clyde, T. | PDF | | | 大规模并行多核糖体图谱分析揭示人类疾病相关UTR突变的翻译缺陷

（翻译说明： 1. "Massively Parallel"译为"大规模并行"，准确体现高通量技术特征； 2. "Polyribosome Profiling"专业术语译为"多核糖体图谱分析"，保留分子生物学领域标准译法； 3. "Translation Defects"译为"翻译缺陷"符合遗传学术语规范； 4. "UTR mutations"保持专业缩写形式"UTR突变"，在首次出现时可通过脚注注明"非翻译区（Untranslated Region）"； 5. 整体采用主谓宾结构，通过"揭示"连接研究发现与研究对象，符合中文科技论文标题特征； 6. 使用"人类疾病相关"而非直译"与人类疾病相关"，使表述更简洁专业） | Li, W.-P. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF