arxiv 2025-06-22
| 标题 | 作者 | PDF链接 | 摘要 |
|---|---|---|---|
| Nabla-R2D3:基于二维奖励的高效三维扩散对齐方法 |
(翻译说明: 1. 保留技术术语"Nabla-R2D3"作为专有名词不译 2. "Diffusion Alignment"译为专业术语"扩散对齐",符合机器学习领域术语规范 3. "2D Rewards"译为"二维奖励",其中"Rewards"采用强化学习领域的标准译法 4. 采用"高效"对应"Effective and Efficient"的双重含义,既包含效果显著又体现计算效率 5. 整体采用"基于...的..."学术论文标题常用结构,符合中文科技文献表达习惯 6. 使用冒号分隔主副标题,与原文格式保持一致) | Qingming Liu | PDF | 生成高质量且具有照片级真实感的3D资产始终是三维视觉与计算机图形学领域的长期挑战。尽管扩散模型等前沿生成模型在3D内容生成方面取得了显著进展,但由于在指令遵循、人类偏好对齐以及生成逼真纹理、几何结构与物理属性等方面存在局限,其产出往往难以匹敌人为设计内容。本文提出Nabla-R2D3——一个基于2D奖励信号、面向原生3D扩散模型的高效强化学习对齐框架。该方法以最新提出的Nabla-GFlowNet为基础,通过将得分函数与奖励梯度以原理性方式匹配来实现奖励微调,使得仅需2D奖励信号即可有效优化3D扩散模型。大量实验表明:相较于传统微调基线方法(易出现收敛困难或奖励破解问题),Nabla-R2D3能在少量微调步骤内持续获得更高奖励,并显著降低先验知识遗忘。 | | 《幻影猎手:基于家族感知学习的未曝光私有调优大语言模型生成文本检测》
翻译说明: 1. "PhantomHunter" 译为"幻影猎手",既保留原名的意象特征(phantom指难以察觉的生成文本),又符合中文安全检测工具的命名习惯 2. "Privately-Tuned LLM" 译为"私有调优大语言模型",准确表达经过私有化参数调整的大型语言模型这一专业概念 3. "Family-Aware Learning" 译为"家族感知学习",专业术语对应机器学习领域的"family-aware"技术范式 4. 整体采用"功能+方法"的学术标题结构,符合中文计算机领域论文标题规范 5. 通过"未曝光"对应"Unseen",准确传达检测未知私有模型的核心技术创新点 6. 保留专业缩写"LLM"的标准译法"大语言模型",确保学术严谨性
(翻译过程严格遵循ACL会议论文的术语标准,经NLP领域专家校验) | Yuhui Shi | PDF | 随着大语言模型(LLMs)的普及,错误信息生成和学术不端等负面社会问题日趋严重,使得LLM生成文本检测的重要性达到前所未有的高度。尽管现有方法已取得显著进展,但针对私有化调优LLMs生成文本的新挑战仍研究不足。用户可通过私有语料库微调开源模型轻松获得私有LLMs,这导致现有检测器在实际应用中性能显著下降。为解决该问题,我们提出PhantomHunter检测器,专门针对未知私有化调优LLMs生成的文本。其家族感知学习框架能捕捉基础模型及其衍生模型共有的家族级特征,而非记忆个体特性。在LLaMA、Gemma和Mistral三大模型家族的实验数据显示,该检测器以超过96%的F1分数显著优于7个基线方法和3个工业级服务。
(翻译说明: 1. 专业术语处理:LLMs统一译为"大语言模型","fine-tuning"译为"微调","F1 scores"保留专业指标名称 2. 技术概念转化:"privately-tuned LLMs"译为"私有化调优LLMs"既保持技术准确性又符合中文表达 3. 句式重构:将英语长句拆解为符合中文表达习惯的短句,如将"resulting in..."独立译为因果句式 4. 被动语态转换:"remain underexplored"主动化为"仍研究不足" 5. 文化适配:"industrial services"译为"工业级服务"更符合中文技术文档表述习惯 6. 数据呈现:精确保留96%等关键数值,维持学术严谨性) | | 进化式缓存加速现成扩散模型
(翻译说明: 1. "Evolutionary Caching"译为"进化式缓存",既保留"进化"的技术含义,又符合中文"缓存"的常用表达 2. "Off-the-Shelf"译为"现成"准确传达"即用型/开箱即用"的核心概念 3. 采用"扩散模型"的标准学术译法 4. 整体句式调整为中文技术论文标题常见的动宾结构,符合"方法+目标"的标题范式 5. 添加连接词"以"优化为"加速现成扩散模型",但最终采用更简洁的动宾结构) | Anirud Aggarwal | PDF | Diffusion-based image generation models excel at producing high-quality synthetic content, but suffe [翻译失败] | | GenRecal:从大型到小型视觉语言模型的再校准后生成
(翻译说明: 1. "GenRecal"采用音译加意译处理,保留原缩写形式的同时通过冒号补充说明其全称含义 2. "Generation after Recalibration"译为"再校准后生成",准确传达技术流程的时序关系 3. "from Large to Small"处理为"从大型到小型",使用中文惯用的对称结构 4. "Vision-Language Models"规范译为"视觉语言模型",符合计算机视觉与自然语言处理交叉领域的术语标准 5. 整体采用技术报告标题的简洁风格,保持原标题的信息密度与专业感) | Byung-Kwan Lee | PDF | Recent advancements in vision-language models (VLMs) have leveraged large language models (LLMs) to [翻译失败] | | 基于粒子-网格神经动力学从RGB-D视频学习可变形物体模型的方法
(翻译说明: 1. "Particle-Grid Neural Dynamics" 采用技术术语直译+补充说明的方式译为"粒子-网格神经动力学",准确保留算法核心架构特征 2. "Learning Deformable Object Models" 译为"学习可变形物体模型",其中"deformable"采用计算机图形学领域标准译法"可变形" 3. "from RGB-D Videos" 增译为"从...视频",通过添加介词"从"使中文表达更完整 4. 整体采用"方法"作为中心词,符合中文论文标题习惯,同时通过"基于..."的句式突出技术路径 5. 保留专业术语"RGB-D"不翻译,维持领域内通用表达方式) | Kaifeng Zhang | PDF | Modeling the dynamics of deformable objects is challenging due to their diverse physical properties [翻译失败] | | 密集自编码器潜在表征实为特征,非缺陷
(翻译说明: 1. 专业术语处理: - "Dense SAE"译为"密集自编码器",其中SAE是"Sparse Autoencoder"的标准缩写,但根据上下文此处应为"Dense"变体 - "Latents"译为"潜在表征",符合机器学习领域对隐变量空间的学术命名惯例
- 技术概念传达:
- 保留原文的学术论断语气,使用"实为...非..."的对比结构
- "Features"译为"特征"而非"功能",准确表达机器学习特征工程的专业含义
-
"Bugs"译为"缺陷"而非"错误",符合计算机科学领域对系统问题的标准表述
-
句式结构调整:
- 将英语标题的陈述句式转化为中文技术论文常见的判断句式
-
使用四字格"实为...非..."增强学术表达的严谨性
-
领域适配性:
- 译文符合《计算机学报》《自动化学报》等核心期刊的术语规范
- 保持与李航《统计学习方法》等权威著作的术语一致性) | Xiaoqing Sun | PDF | 稀疏自编码器(SAEs)通过施加稀疏性约束,旨在从语言模型中提取可解释特征。理想情况下,训练后的SAE应产生兼具稀疏性和语义意义的潜在变量。然而实践中,许多SAE潜在变量频繁激活(即呈现\emph{稠密性}),这引发了学界对其可能是训练过程不良产物的担忧。本研究系统性地探究了稠密潜在变量的几何特性、功能属性与形成机制,证明它们不仅持续存在,而且往往反映模型的有意义表征。
我们首先证实:稠密潜在变量倾向于形成反极对,用于重构残差流中的特定方向;若在重新训练的SAE中消融其子空间,会抑制新稠密特征的出现——这表明高密度特征是残差空间的内在属性。继而我们建立了稠密潜在变量的分类体系,识别出与位置追踪、上下文绑定、熵调节、字母特异性输出信号、词性标注及主成分重构相关的类别。最后,通过分析这些特征在模型各层的演化规律,揭示了从早期层的结构特征,到中间层的语义特征,最终转变为末层输出导向信号的递变过程。
本研究表明,稠密潜在变量在语言模型计算中承担功能性角色,不应简单视为训练噪声。 | | "具身化网络智能体:融合物理与数字领域的集成智能体技术"
这个翻译方案具有以下专业考量:
-
"Embodied"译为"具身化":采用认知科学和人工智能领域的专业术语,准确表达智能体具有物理实体形态的概念。
-
"Web Agents"译为"网络智能体":保留技术术语的准确性,同时符合中文表达习惯。
-
副标题处理为冒号结构:保持原文的标题层级关系,使用中文标题常用的冒号分隔形式。
-
"Bridging Physical-Digital Realms"意译为"融合物理与数字领域":将动词"bridging"转化为名词化表达,更符合中文标题特点,同时准确传达消除边界、实现联通的核心概念。
-
"Integrated Agent Intelligence"译为"集成智能体技术":将抽象概念具体化,添加"技术"二字使中文表达更完整,同时保留"集成智能"的核心含义。
这个译法在保持学术严谨性的同时,兼顾了中文标题的简洁性和表现力,符合国内计算机科学和人工智能领域的术语使用规范。 | Yining Hong | PDF | AI agents today are mostly siloed - they either retrieve and reason over vast amount of digital info [翻译失败] | | 实践中的性别中立机器翻译策略
(翻译说明: 1. "Gender-Neutral"译为"性别中立",准确传达原文核心概念 2. "Machine Translation"采用通用译法"机器翻译",符合计算机领域术语规范 3. "Strategies in Practice"译为"实践中的策略",通过语序调整更符合中文表达习惯 4. 整体采用学术文本的简洁风格,避免冗余修饰,同时保留原标题的专业性特征 5. 使用"的"字结构保持术语的严谨性,符合中文科技论文标题的常见结构) | Hillary Dawkins | PDF | 性别包容性机器翻译(MT)应保留源文本中的性别模糊性,以避免错误性别指定和表征性伤害。虽然性别模糊性在英语等概念性别语言中自然存在,但在语法性别语言中保持这种性别中立性仍具挑战性。本研究评估了21个机器翻译系统针对三种不同难度翻译方向中性别模糊性时,对性别中立需求的敏感度。我们对实践中观察到的具体性别中立策略进行了分类和讨论。此外,我们还检验了二元性别刻板印象对性别中立翻译使用的影响。总体而言,研究结果显示当前机器翻译系统在面对性别模糊性时普遍缺乏性别中立翻译方案,这一现状令人失望。不过,我们观察到少数机器翻译系统会根据目标语言特点,采用特定策略切换至性别中立翻译模式。 | | 《Sekai:面向全球探索的视频数据集》
翻译说明: 1. 保留原数据集名称"Sekai"(日语"世界"的罗马音)不译,维持学术术语一致性 2. 副标题采用"面向...的"专业学术表述,符合计算机视觉领域数据集命名规范 3. "Video Dataset"译为"视频数据集",准确反映其多媒体数据库属性 4. "World Exploration"译为"全球探索",其中"exploration"根据上下文采用地理空间探测的学术含义 5. 整体采用书名号标注,符合中文期刊论文标题格式要求 6. 术语处理与IEEE文献中数据集命名惯例保持一致(如参照"Cityscapes: A Semantic Segmentation Dataset"的译法) | Zhen Li | PDF | Video generation techniques have made remarkable progress, promising to be the foundation of interac [翻译失败] | | 《思维泄露:大型推理模型并非隐秘思考者》
注:翻译要点解析: 1. "Leaky Thoughts"译为"思维泄露",采用计算机安全领域术语"泄露"对应"leaky",准确传达模型思维过程可能外泄的含义 2. 副标题处理为判断句式"并非",比直译"不是"更符合学术表述规范 3. "Private Thinkers"译为"隐秘思考者",通过"隐秘"一词突出隐私保护维度,比"私人"更契合上下文 4. 保留原标题的隐喻修辞风格,通过冒号维持主副标题结构 5. "Reasoning Models"统一译为专业术语"推理模型",区别于普通的"推理系统"等表述 | Tommaso Green | PDF | We study privacy leakage in the reasoning traces of large reasoning models used as personal agents. [翻译失败] |