2025-06-21 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
Nabla-R2D3：基于二维奖励的高效三维扩散对齐方法

（翻译说明： 1. 保留技术术语"Nabla-R2D3"作为专有名词不翻译 2. "Diffusion Alignment"译为"扩散对齐"，准确反映扩散模型的技术概念 3. "2D Rewards"译为"二维奖励"，保持维度描述的准确性 4. 采用"高效"对应"Effective and Efficient"的双重含义，既体现效果优越又强调计算效率 5. 补充"基于"字以明确技术路径，使中文表述更符合学术论文标题规范 6. 整体结构采用"主标题+副标题"形式，与计算机领域论文命名惯例保持一致） | Qingming Liu | PDF | 生成高质量且具有照片级真实感的3D资产始终是三维视觉与计算机图形学领域的长期挑战。尽管扩散模型等前沿生成模型在三维生成领域取得了显著进展，但由于在指令遵循、人类偏好对齐以及生成逼真纹理、几何结构与物理属性等方面存在局限，这些模型往往难以达到人工设计内容的水平。本文提出Nabla-R2D3——一个基于二维奖励信号、针对原生3D扩散模型的高效强化学习对齐框架。该方法以最新提出的Nabla-GFlowNet为基础，通过将得分函数与奖励梯度以原理性方式匹配来实现奖励微调，使得仅需二维奖励信号即可有效优化3D扩散模型。大量实验表明，与难以收敛或陷入奖励破解的基准微调方法不同，Nabla-R2D3能在少量微调步骤内持续获得更高奖励，并显著降低先验知识遗忘。

（注：根据学术翻译规范，对以下术语进行了标准化处理： 1. "photorealistic"译为"照片级真实感"（计算机图形学标准术语） 2. "diffusion models"统一译为"扩散模型"（学界通用译法） 3. "reward hacking"译为"奖励破解"（强化学习领域标准译法） 4. "prior forgetting"译为"先验知识遗忘"（认知科学规范术语）同时保持原文的学术严谨性，将复合长句合理切分为符合中文表达习惯的短句结构。） | | 《幻影猎手：基于家族感知学习的未公开调优大语言模型生成文本检测》

翻译说明： 1. 主标题"PhantomHunter"译为"幻影猎手"，既保留原名的意象特征（phantom指难以察觉的生成文本），又符合中文安全检测工具的命名习惯 2. "Family-Aware Learning"专业术语译为"家族感知学习"，准确表达算法能识别不同LLM变体（模型家族）的特性 3. "Privately-Tuned LLM"译为"未公开调优大语言模型"，其中： - "privately-tuned"采用"未公开调优"的译法，比直译"私有"更符合学术语境 - 保留LLM的标准译法"大语言模型"（学术界通用译名） 4. 整体句式重组为中文论文标题常用的"方法+目标"结构，通过冒号分层，符合《中文核心期刊》标题规范 5. 补充"检测"作为动词，使技术目标更明确（原题隐含detecting的动宾关系） | Yuhui Shi | PDF | 随着大语言模型（LLMs）的普及，错误信息生成和学术不端等负面社会问题日趋严重，使得LLM生成文本检测的重要性达到前所未有的高度。尽管现有方法已取得显著进展，但针对私有化调优LLMs生成文本的新挑战仍研究不足。用户可通过私有语料库微调开源模型轻松获得私有LLMs，这导致现有检测器在实际应用中性能显著下降。为解决该问题，我们提出PhantomHunter检测器——专为识别未知私有化调优LLMs生成文本而设计。其家族感知学习框架能捕捉基础模型及其衍生模型共有的家族级特征，而非记忆个体特性。在LLaMA、Gemma和Mistral三大模型家族数据上的实验表明，该检测器性能优于7个基线模型和3个工业级服务，F1分数超过96%。

（说明：本译文严格遵循学术翻译规范，具有以下特点： 1. 专业术语精准处理："privately-tuned LLMs"译为"私有化调优LLMs"既保持专业又符合中文表达 2. 被动语态转化："have been more severe"译为"日趋严重"符合中文主动表达习惯 3. 长句拆分重组：将原文复合句按中文表达习惯拆分为多个短句，如实验部分处理 4. 概念准确传达："family-aware learning framework"译为"家族感知学习框架"既保留原意又体现技术特征 5. 数据规范呈现：技术指标"F1分数超过96%"严格对应原文数字信息） | | 进化缓存技术加速现成扩散模型性能

（翻译说明： 1. "Evolutionary Caching"译为"进化缓存技术"，既保留"进化"的计算科学内涵，又通过"技术"明确其方法论属性 2. "Off-the-Shelf"采用"现成"的精准对应，准确传达即装即用的商业产品特性 3. 增译"性能"二字，使中文标题更符合技术论文的表达习惯 4. 整体采用"技术+功能+对象"的经典中文论文标题结构 5. 严格保持原标题的学术严谨性，避免过度意译可能带来的信息损耗） | Anirud Aggarwal | PDF | Diffusion-based image generation models excel at producing high-quality synthetic content, but suffe [翻译失败] | | GenRecal：从大型到小型视觉语言模型的再校准后生成

（翻译说明： 1. 保留专业术语"Generation"和"Recalibration"的直译"生成"和"再校准"，通过冒号保持原标题结构 2. "Vision-Language Models"译为专业术语"视觉语言模型"，准确体现跨模态研究领域特征 3. 使用"从大型到小型"的动态表述，准确传达模型规模迁移的研究重点 4. 添加"后"字明确时间逻辑关系，符合中文表达习惯 5. 整体采用学术论文标题的简洁风格，未添加冗余修饰词） | Byung-Kwan Lee | PDF | Recent advancements in vision-language models (VLMs) have leveraged large language models (LLMs) to [翻译失败] | | 基于粒子-网格神经动力学从RGB-D视频学习可变形物体模型的方法

（翻译说明： 1. "Particle-Grid Neural Dynamics"译为"粒子-网格神经动力学"，准确保留了粒子系统与网格方法的双重特征 2. "Learning Deformable Object Models"译为"学习可变形物体模型"，其中"deformable"采用计算机图形学标准译法"可变形" 3. "from RGB-D Videos"译为"从RGB-D视频"，保持RGB-D（彩色深度）这一计算机视觉专业术语的原始表述 4. 整体采用"方法"作为隐性中心词，符合中文论文标题习惯 5. 通过"基于...从..."的句式结构，清晰表达了技术路径（粒子网格方法）与数据来源（RGB-D视频）的逻辑关系） | Kaifeng Zhang | PDF | Modeling the dynamics of deformable objects is challenging due to their diverse physical properties [翻译失败] | | 密集自编码器潜在表征实为特征，而非缺陷

（翻译说明： 1. 专业术语处理："Dense SAE"译为"密集自编码器"，"Latents"译为"潜在表征"符合机器学习领域术语规范 2. 学术修辞保留：采用"实为...而非..."的句式准确传达原文的论证语气 3. 概念准确性："Features"译为"特征"而非"特点"，"Bugs"译为"缺陷"而非"错误"，确保技术含义精确 4. 标题风格：采用学术论文标题常见的名词短语结构，省略系动词 5. 文化适应性：通过"非缺陷"的否定表述，准确反映原文对常见误解的驳斥立场） | Xiaoqing Sun | PDF | 稀疏自编码器（SAEs）通过施加稀疏性约束，旨在从语言模型中提取可解释的特征。理想情况下，训练SAE应能产生兼具稀疏性和语义意义的潜在特征。然而，许多SAE潜在特征频繁激活（即呈现\emph{稠密性}），这引发了人们对它们可能是训练过程中不良产物的担忧。本研究系统性地探究了稠密潜在特征的几何特性、功能属性及形成机制，并证明它们不仅持续存在，而且往往反映模型的有意义表征。

我们首先证实：稠密潜在特征倾向于形成反极对，以重构残差流中的特定方向；若消融其对应子空间，重新训练的SAE中将抑制新稠密特征的出现——这表明高密度特征是残差空间的固有属性。随后我们建立了稠密潜在特征的分类体系，识别出与位置追踪、上下文绑定、熵调节、字母特异性输出信号、词性标注及主成分重构相关的特征类别。最后，我们分析了这些特征在模型各层的演化规律，揭示了从早期层的结构特征，到中间层的语义特征，最终转变为末层输出导向信号的递变过程。研究结果表明，稠密潜在特征在语言模型计算中具有功能性作用，不应被简单视为训练噪声。 | | "具身网络智能体：融合物理与数字领域的集成化智能体技术"

这个翻译版本： 1. 保留了"Embodied"的核心含义"具身"，这是认知科学和人工智能领域的专业术语 2. 将"Web Agents"译为"网络智能体"而非字面的"网络代理"，更符合中文人工智能领域的术语习惯 3. "Bridging Physical-Digital Realms"意译为"融合物理与数字领域"，既准确表达了原文的连接含义，又符合中文表达习惯 4. "Integrated Agent Intelligence"译为"集成化智能体技术"，其中： - "Integrated"译为"集成化"而非简单"集成"，体现技术特性 - 补充"技术"二字使中文更完整通顺 - 保留"Agent"作为"智能体"的专业译法

（说明：该翻译严格遵循学术规范，具有以下特点： 1. 完整保留专业术语"Gender-Neutral"的准确译法"性别中立" 2. 采用"机器翻译"这一学界通用译法对应"Machine Translation" 3. "Strategies in Practice"译为"实践中的策略"符合中文语序习惯 4. 整体采用简洁明了的学术语言风格，避免冗余修饰 5. 通过破折号替代原标题中的连字符，更符合中文标点规范） | Hillary Dawkins | PDF | 性别包容性机器翻译（MT）应保留源文本中的性别模糊性，以避免错误性别指认和表征性伤害。虽然性别模糊性在英语等概念性别语言中常自然存在，但在语法性别语言中保持这种性别中立性仍具挑战性。本研究评估了21个机器翻译系统针对三种不同难度翻译方向中性别模糊性时，对性别中立需求的敏感度。我们对实践中观察到的具体性别中立策略进行了分类与讨论。此外，我们还检验了二元性别刻板印象对性别中立翻译使用的影响。总体而言，研究结果显示当前机器翻译系统在面对性别模糊性时普遍缺乏性别中立翻译方案，这一现状令人失望。不过我们也发现，少数系统会根据目标语言特点，采用特定策略切换至性别中立翻译模式。

（翻译说明： 1. 专业术语处理："notional gender languages"译为"概念性别语言"，"grammatical gender languages"译为"语法性别语言"，"misgendering"译为"错误性别指认"符合语言学规范 2. 句式重构：将原文复合句拆分为符合中文表达习惯的短句，如将"While..."从句处理为转折独立句 3. 学术表达："representational harms"译为"表征性伤害"保持学术严谨性 4. 被动语态转换："are categorized and discussed"译为主动式"进行了分类与讨论" 5. 文化适配："binary gender stereotypes"译为"二元性别刻板印象"准确传达社会学概念 6. 程度副词处理："disappointing absence"译为"令人失望的...缺乏"保留原文评价立场） | | 《Sekai：面向全球探索的视频数据集》

翻译说明： 1. 保留"Sekai"作为专有名词不翻译（日语"世界"的罗马音），符合学术数据集命名惯例 2. "Video Dataset"译为"视频数据集"，采用计算机视觉领域标准术语 3. "World Exploration"译为"全球探索"，其中： - "World"译为"全球"而非字面的"世界"，更符合中文科技文献表达习惯 - "Exploration"译为"探索"，准确传达主动研究性含义 4. 整体采用学术标题的简洁结构，使用冒号分隔主副标题，符合中文论文标题规范 5. 补充书名号《》符合中文文献引用格式要求

（注：如需正式发表，建议在首次出现时补充标注"Sekai（日语'世界'）"的释义） | Zhen Li | PDF | 视频生成技术已取得显著进展，有望成为交互式世界探索的基础。然而，现有视频生成数据集存在若干局限性：场景地点有限、持续时间短、画面静态化，且缺乏关于探索行为与世界属性的标注信息，因而难以适配世界探索任务的训练需求。为此，我们推出Sekai数据集（日语中意为"世界"），这是一个专为世界探索研究设计的高质量第一人称视角全球视频数据集，具有丰富的标注信息。该数据集包含来自750个城市、100多个国家和地区的行走及无人机视角（FPV与UAV）视频，总时长超过5,000小时。我们开发了高效的工具箱，可对视频进行采集、预处理，并标注地理位置、场景类型、天气状况、人群密度、描述文本及相机运动轨迹等信息。实验验证了数据集的质量优势。基于数据子集，我们训练了名为YUME（日语中意为"梦"）的交互式视频世界探索模型。我们相信Sekai数据集将推动视频生成与世界探索领域的发展，并催生具有重要价值的应用成果。

（注：根据学术翻译规范，对原文进行了以下优化处理： 1. 专业术语统一："FPV"保留英文缩写，"UVA"修正为无人机领域标准缩写"UAV" 2. 文化负载词处理：保留日语原词"Sekai/YUME"并附加释义 3. 长句拆分重组：将原文复合句按中文表达习惯分解为多个短句 4. 被动语态转换："are not well-suited"等被动结构转为主动表述 5. 逻辑显化：添加"为此"等连接词强化段落衔接 6. 术语补充："标注信息"后补充具体标注维度以明确内涵） | | 《思维泄露：大型推理模型并非隐秘思考者》

（翻译说明： 1. 标题采用主副标题结构，符合中文论文标题规范 2. "Leaky Thoughts"译为"思维泄露"，准确传达"思想隐私外泄"的核心概念 3. 副标题采用判断句式，突出研究结论 4. "Large Reasoning Models"译为"大型推理模型"，保留技术术语准确性 5. "Private Thinkers"译为"隐秘思考者"，通过"隐秘"对应隐私性，"思考者"拟人化表达更符合中文认知 6. 整体翻译在保持学术严谨性的同时，通过四字格"思维泄露"增强标题感染力） | Tommaso Green | PDF | 我们研究了作为个人智能体的大型推理模型在思维轨迹中的隐私泄露问题。与最终输出不同，思维轨迹通常被假定为内部数据且安全无虞。我们通过实证表明，这些推理轨迹往往包含敏感用户数据——既可能通过提示词注入被提取，也可能意外泄露至输出结果——从而挑战了这一固有认知。通过探测性测试与智能体评估，我们证实测试时计算策略（特别是增加推理步骤）会加剧此类泄露。虽然增加这些测试时计算策略的预算会使模型在最终回答时更为谨慎，但同时也会导致其推理过程更加冗长，在自主思考中泄露更多信息。这揭示了一个核心矛盾：增强推理能力虽提升效用，却扩大了隐私攻击面。我们主张安全防护必须延伸至模型的内部思考过程，而非仅关注其输出结果。

（翻译说明： 1. 专业术语处理："reasoning traces"译为"思维轨迹"符合认知科学术语，"prompt injections"保留技术领域通用译法"提示词注入" 2. 句式重构：将英语长句拆解为符合中文表达习惯的短句，如将"which"引导的定语从句转换为破折号补充说明 3. 概念对等："test-time compute approaches"译为"测试时计算策略"准确传达技术含义 4. 学术风格：使用"无虞""固有认知""实证表明"等符合学术论文语体的表达 5. 矛盾表述："tension"译为"矛盾"而非字面"张力"，更符合中文论述习惯 6. 动词处理："amplify"译为"加剧"精准体现程度变化） |

bioRxiv

标题	作者	PDF链接	摘要
听觉流中的感知聚类

（翻译说明： 1. "Perceptual clustering"译为"感知聚类"，准确对应了认知心理学中关于感知组织的专业术语 2. "auditory streaming"采用专业领域通用译法"听觉流"，指听觉系统对连续声音信号的感知组织过程 3. 介词"in"译为"中的"以符合中文表达习惯 4. 整体采用"定语+中心词"结构，既保持学术严谨性又确保中文流畅性 5. 该译文与Bregman的听觉场景分析理论术语体系保持一致，符合《心理学名词》规范） | Larigaldie, N. | PDF | | | 思维字幕生成：基于人脑活动演化心理内容的描述性文本

（翻译说明： 1. 专业术语处理： - "Mind Captioning"译为"思维字幕生成"，既保留"captioning"的字幕/描述含义，又体现认知科学领域特色 - "mental content"采用心理学标准译法"心理内容" - "brain activity"译为"脑活动"符合神经科学术语规范

句式重构：
将现在分词结构"Evolving..."转换为前置定语"演化的"，符合中文表达习惯
被动语态转换为主动式"基于..."，增强可读性
概念准确性：
"descriptive text"译为"描述性文本"而非直译"描述文本"，保持学术严谨性
"human brain activity"简化为"人脑活动"符合中文科技文献表达惯例
整体效果：在保持原文精确性的前提下，通过术语标准化和句式本土化处理，使译文既符合中文神经科学论文的表达规范，又具备技术文档的清晰度。） | Horikawa, T. | PDF | | | 联合抑制FACT与BET的染色质重塑可破坏弥漫性中线胶质瘤的致癌转录

（翻译说明： 1. "Chromatin remodeling"译为"染色质重塑"，保留专业术语 2. "combined FACT and BET inhibition"处理为"联合抑制FACT与BET"，采用生物医学领域惯用的"联合抑制"表述 3. "Diffuse Midline Glioma"使用规范译名"弥漫性中线胶质瘤"，符合WHO中枢神经系统肿瘤分类标准 4. "disrupts oncogenic transcription"译为"破坏致癌转录"，准确传达阻断肿瘤发生相关基因转录的生物学含义 5. 整体采用主动语态，符合中文科技论文表达习惯，同时保持与原文结构的对应性） | Holliday, H. | PDF | | | 全新蛋白质通过古老的蛋白质靶向与降解途径整合细胞系统

（翻译说明： 1. "De novo proteins"译为"全新蛋白质"，准确体现其新合成、非源自已有蛋白质的特性 2. "integrate cellular systems"译为"整合细胞系统"，保留生物学系统观 3. "ancient"译为"古老的"，强调进化保守性 4. "targeting and degradation pathways"译为"靶向与降解途径"，专业术语统一 5. 整体采用主谓宾结构，符合中文表达习惯 6. 使用"通过"连接方式，清晰呈现作用机制 7. 保留学术文本的简洁性与精确性） | Houghton, C. J. | PDF | | | 整合性基因共表达网络分析揭示与阿尔茨海默病病理相关的蛋白质编码基因及长链非编码RNA基因

翻译说明： 1. "Integrative"译为"整合性"，体现综合分析多种数据的特点 2. "Gene Co-expression Network Analysis"译为"基因共表达网络分析"，保留专业术语 3. "Reveals"译为"揭示"，符合学术论文表述习惯 4. "Protein-Coding and lncRNA genes"译为"蛋白质编码基因及长链非编码RNA基因"，完整保留专业术语 5. "Alzheimer's Disease Pathology"译为"阿尔茨海默病病理"，使用医学规范译名 6. 整体采用主谓宾结构，符合中文科技论文标题特征 7. 使用"及"连接并列成分，保持学术严谨性 8. 标题长度控制在合理范围（28字），符合中文标题习惯 | Zebardast, F. | PDF | | | 由膜几何结构通过相互作用价态与体积调控的突触后致密区多相分离

（翻译说明： 1. "Multiphase separation"译为"多相分离"，准确体现相分离现象的复杂性 2. "postsynaptic density"采用神经科学标准术语"突触后致密区" 3. "regulated by membrane geometry"译为"由膜几何结构调控"，保留生物物理学特征 4. "interaction valency"译为"相互作用价态"，准确表达分子结合位点数概念 5. "volume"译为"体积"，保持物理量纲的准确性 6. 整体采用"由...通过...调控的..."句式结构，严格遵循原文的因果逻辑关系 7. 专业术语均采用《神经科学名词》《生物物理学名词》等国家标准译法） | Yamada, R. | PDF | | | MgtE镁离子通道的生物信息学分类及其新型亚类稳定性的从头蛋白质设计

（翻译说明： 1. 专业术语处理： - "Bioinformatics classification"译为"生物信息学分类"，保留学科专有名词 - "MgtE Mg2+ channel"译为"MgtE镁离子通道"，其中"MgtE"为保留基因名称的规范译法 - "de novo protein design"译为"从头蛋白质设计"，采用结构生物学领域标准译法

句式结构调整：
将原文名词短语转换为中文常见的"研究对象+研究内容"结构
使用"及其"连接两个并列研究内容，符合中文论文标题表达习惯
专业表达规范：
"novel subclass"译为"新型亚类"而非字面的"新子类"，更符合通道蛋白分类的学术表述
"stabilization"译为"稳定性"而非"稳定化"，采用名词化处理更贴合学术语境
标题要素完整性：
完整保留原标题的所有科学要素（研究对象、方法学、研究目标）
通过"的"字结构实现逻辑关系的准确传达） | Zhao, Z. | PDF | | | 多模态验证人类胎儿小脑中过渡性小脑前体细胞的存在

（翻译说明： 1. "Multimodal"译为"多模态"，指采用多种技术方法进行验证，符合生物医学领域术语规范 2. "Transitional Cerebellar Progenitors"译为"过渡性小脑前体细胞"，准确反映发育生物学中progenitor cell作为特定阶段前体细胞的专有名词 3. 采用"人类胎儿小脑"的表述，既保持学术严谨性又符合中文语序 4. 整体采用"的"字结构处理英语介词短语嵌套关系，符合中文学术论文标题特征 5. 保留原文的验证性研究性质，使用"存在"对应"existence"的学术表述） | Luo, Z. | PDF | | | 生物群落特异性基因组目录揭示浅层测序的功能潜力

（翻译说明： 1. "Biome-specific"译为"生物群落特异性"，准确表达针对特定生态系统的含义 2. "genome catalogues"采用"基因组目录"这一标准学术译法 3. "functional potential"译为"功能潜力"，符合分子生物学领域术语 4. "shallow sequencing"译为专业术语"浅层测序"，指低覆盖度的基因组测序技术 5. 整体采用倒装结构，符合中文科技论文标题习惯，同时保留原标题的揭示性语气 6. 通过"揭示"一词准确传达"reveal"的科学发现含义 7. 严格保持学术文本的简洁性和专业性，未添加冗余修饰语） | Escobar-Zepeda, A. | PDF | | | 抗VHL缺失诱导的遗传与药理学脆弱性的耐药机制

翻译说明： 1. "Mechanisms of resistance" 译为"耐药机制"，符合医学/肿瘤学领域对药物抵抗性的专业表述 2. "VHL loss-induced" 采用"VHL缺失诱导的"的译法，准确传达抑癌基因VHL功能缺失的病理状态 3. 并列结构"genetic and pharmacological vulnerabilities" 处理为"遗传与药理学脆弱性"，其中： - "genetic vulnerabilities" 译为"遗传脆弱性"（指基因缺陷导致的治疗靶点） - "pharmacological vulnerabilities" 译为"药理学脆弱性"（指药物作用靶点） 4. 整体语序调整为中文习惯的偏正结构，通过"抗...的"连接短语，保持学术文本的严谨性 5. 保留专业缩写"VHL"（von Hippel-Lindau肿瘤抑制基因）不翻译，符合医学文献惯例 | Ge, J. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF