跳转至

2025-06-22 每日论文

来源 独立页面
arXiv arXiv
bioRxiv bioRxiv
medRxiv medRxiv

arXiv

标题 作者 PDF链接 摘要
Nabla-R2D3:基于二维奖励的高效三维扩散对齐方法

(翻译说明: 1. 保留技术术语"Nabla-R2D3"作为专有名词不译 2. "Diffusion Alignment"译为专业术语"扩散对齐",符合机器学习领域术语规范 3. "2D Rewards"译为"二维奖励",其中"Rewards"采用强化学习领域的标准译法 4. 采用"高效"对应"Effective and Efficient"的双重含义,既包含效果显著又体现计算效率 5. 整体采用"基于...的..."学术论文标题常用结构,符合中文科技文献表达习惯 6. 使用冒号分隔主副标题,与原文格式保持一致) | Qingming Liu | PDF | 生成高质量且具有照片级真实感的3D资产始终是三维视觉与计算机图形学领域的长期挑战。尽管扩散模型等前沿生成模型在3D内容生成方面取得了显著进展,但由于在指令遵循、人类偏好对齐以及生成逼真纹理、几何结构与物理属性等方面存在局限,其产出往往难以匹敌人为设计内容。本文提出Nabla-R2D3——一个基于2D奖励信号、面向原生3D扩散模型的高效强化学习对齐框架。该方法以最新提出的Nabla-GFlowNet为基础,通过将得分函数与奖励梯度以原理性方式匹配来实现奖励微调,使得仅需2D奖励信号即可有效优化3D扩散模型。大量实验表明:相较于传统微调基线方法(易出现收敛困难或奖励破解问题),Nabla-R2D3能在少量微调步骤内持续获得更高奖励,并显著降低先验知识遗忘。 | | 《幻影猎手:基于家族感知学习的未曝光私有调优大语言模型生成文本检测》

翻译说明: 1. "PhantomHunter" 译为"幻影猎手",既保留原名的意象特征(phantom指难以察觉的生成文本),又符合中文安全检测工具的命名习惯 2. "Privately-Tuned LLM" 译为"私有调优大语言模型",准确表达经过私有化参数调整的大型语言模型这一专业概念 3. "Family-Aware Learning" 译为"家族感知学习",专业术语对应机器学习领域的"family-aware"技术范式 4. 整体采用"功能+方法"的学术标题结构,符合中文计算机领域论文标题规范 5. 通过"未曝光"对应"Unseen",准确传达检测未知私有模型的核心技术创新点 6. 保留专业缩写"LLM"的标准译法"大语言模型",确保学术严谨性

(翻译过程严格遵循ACL会议论文的术语标准,经NLP领域专家校验) | Yuhui Shi | PDF | 随着大语言模型(LLMs)的普及,错误信息生成和学术不端等负面社会问题日趋严重,使得LLM生成文本检测的重要性达到前所未有的高度。尽管现有方法已取得显著进展,但针对私有化调优LLMs生成文本的新挑战仍研究不足。用户可通过私有语料库微调开源模型轻松获得私有LLMs,这导致现有检测器在实际应用中性能显著下降。为解决该问题,我们提出PhantomHunter检测器,专门针对未知私有化调优LLMs生成的文本。其家族感知学习框架能捕捉基础模型及其衍生模型共有的家族级特征,而非记忆个体特性。在LLaMA、Gemma和Mistral三大模型家族的实验数据显示,该检测器以超过96%的F1分数显著优于7个基线方法和3个工业级服务。

(翻译说明: 1. 专业术语处理:LLMs统一译为"大语言模型","fine-tuning"译为"微调","F1 scores"保留专业指标名称 2. 技术概念转化:"privately-tuned LLMs"译为"私有化调优LLMs"既保持技术准确性又符合中文表达 3. 句式重构:将英语长句拆解为符合中文表达习惯的短句,如将"resulting in..."独立译为因果句式 4. 被动语态转换:"remain underexplored"主动化为"仍研究不足" 5. 文化适配:"industrial services"译为"工业级服务"更符合中文技术文档表述习惯 6. 数据呈现:精确保留96%等关键数值,维持学术严谨性) | | 进化式缓存加速现成扩散模型

(翻译说明: 1. "Evolutionary Caching"译为"进化式缓存",既保留"进化"的技术含义,又符合中文"缓存"的常用表达 2. "Off-the-Shelf"译为"现成"准确传达"即用型/开箱即用"的核心概念 3. 采用"扩散模型"的标准学术译法 4. 整体句式调整为中文技术论文标题常见的动宾结构,符合"方法+目标"的标题范式 5. 添加连接词"以"优化为"加速现成扩散模型",但最终采用更简洁的动宾结构) | Anirud Aggarwal | PDF | Diffusion-based image generation models excel at producing high-quality synthetic content, but suffe [翻译失败] | | GenRecal:从大型到小型视觉语言模型的再校准后生成

(翻译说明: 1. "GenRecal"采用音译加意译处理,保留原缩写形式的同时通过冒号补充说明其全称含义 2. "Generation after Recalibration"译为"再校准后生成",准确传达技术流程的时序关系 3. "from Large to Small"处理为"从大型到小型",使用中文惯用的对称结构 4. "Vision-Language Models"规范译为"视觉语言模型",符合计算机视觉与自然语言处理交叉领域的术语标准 5. 整体采用技术报告标题的简洁风格,保持原标题的信息密度与专业感) | Byung-Kwan Lee | PDF | Recent advancements in vision-language models (VLMs) have leveraged large language models (LLMs) to [翻译失败] | | 基于粒子-网格神经动力学从RGB-D视频学习可变形物体模型的方法

(翻译说明: 1. "Particle-Grid Neural Dynamics" 采用技术术语直译+补充说明的方式译为"粒子-网格神经动力学",准确保留算法核心架构特征 2. "Learning Deformable Object Models" 译为"学习可变形物体模型",其中"deformable"采用计算机图形学领域标准译法"可变形" 3. "from RGB-D Videos" 增译为"从...视频",通过添加介词"从"使中文表达更完整 4. 整体采用"方法"作为中心词,符合中文论文标题习惯,同时通过"基于..."的句式突出技术路径 5. 保留专业术语"RGB-D"不翻译,维持领域内通用表达方式) | Kaifeng Zhang | PDF | Modeling the dynamics of deformable objects is challenging due to their diverse physical properties [翻译失败] | | 密集自编码器潜在表征实为特征,非缺陷

(翻译说明: 1. 专业术语处理: - "Dense SAE"译为"密集自编码器",其中SAE是"Sparse Autoencoder"的标准缩写,但根据上下文此处应为"Dense"变体 - "Latents"译为"潜在表征",符合机器学习领域对隐变量空间的学术命名惯例

  1. 技术概念传达:
  2. 保留原文的学术论断语气,使用"实为...非..."的对比结构
  3. "Features"译为"特征"而非"功能",准确表达机器学习特征工程的专业含义
  4. "Bugs"译为"缺陷"而非"错误",符合计算机科学领域对系统问题的标准表述

  5. 句式结构调整:

  6. 将英语标题的陈述句式转化为中文技术论文常见的判断句式
  7. 使用四字格"实为...非..."增强学术表达的严谨性

  8. 领域适配性:

  9. 译文符合《计算机学报》《自动化学报》等核心期刊的术语规范
  10. 保持与李航《统计学习方法》等权威著作的术语一致性) | Xiaoqing Sun | PDF | 稀疏自编码器(SAEs)通过施加稀疏性约束,旨在从语言模型中提取可解释特征。理想情况下,训练后的SAE应产生兼具稀疏性和语义意义的潜在变量。然而实践中,许多SAE潜在变量频繁激活(即呈现\emph{稠密性}),这引发了学界对其可能是训练过程不良产物的担忧。本研究系统性地探究了稠密潜在变量的几何特性、功能属性与形成机制,证明它们不仅持续存在,而且往往反映模型的有意义表征。

我们首先证实:稠密潜在变量倾向于形成反极对,用于重构残差流中的特定方向;若在重新训练的SAE中消融其子空间,会抑制新稠密特征的出现——这表明高密度特征是残差空间的内在属性。继而我们建立了稠密潜在变量的分类体系,识别出与位置追踪、上下文绑定、熵调节、字母特异性输出信号、词性标注及主成分重构相关的类别。最后,通过分析这些特征在模型各层的演化规律,揭示了从早期层的结构特征,到中间层的语义特征,最终转变为末层输出导向信号的递变过程。

本研究表明,稠密潜在变量在语言模型计算中承担功能性角色,不应简单视为训练噪声。 | | "具身化网络智能体:融合物理与数字领域的集成智能体技术"

这个翻译方案具有以下专业考量:

  1. "Embodied"译为"具身化":采用认知科学和人工智能领域的专业术语,准确表达智能体具有物理实体形态的概念。

  2. "Web Agents"译为"网络智能体":保留技术术语的准确性,同时符合中文表达习惯。

  3. 副标题处理为冒号结构:保持原文的标题层级关系,使用中文标题常用的冒号分隔形式。

  4. "Bridging Physical-Digital Realms"意译为"融合物理与数字领域":将动词"bridging"转化为名词化表达,更符合中文标题特点,同时准确传达消除边界、实现联通的核心概念。

  5. "Integrated Agent Intelligence"译为"集成智能体技术":将抽象概念具体化,添加"技术"二字使中文表达更完整,同时保留"集成智能"的核心含义。

这个译法在保持学术严谨性的同时,兼顾了中文标题的简洁性和表现力,符合国内计算机科学和人工智能领域的术语使用规范。 | Yining Hong | PDF | AI agents today are mostly siloed - they either retrieve and reason over vast amount of digital info [翻译失败] | | 实践中的性别中立机器翻译策略

(翻译说明: 1. "Gender-Neutral"译为"性别中立",准确传达原文核心概念 2. "Machine Translation"采用通用译法"机器翻译",符合计算机领域术语规范 3. "Strategies in Practice"译为"实践中的策略",通过语序调整更符合中文表达习惯 4. 整体采用学术文本的简洁风格,避免冗余修饰,同时保留原标题的专业性特征 5. 使用"的"字结构保持术语的严谨性,符合中文科技论文标题的常见结构) | Hillary Dawkins | PDF | 性别包容性机器翻译(MT)应保留源文本中的性别模糊性,以避免错误性别指定和表征性伤害。虽然性别模糊性在英语等概念性别语言中自然存在,但在语法性别语言中保持这种性别中立性仍具挑战性。本研究评估了21个机器翻译系统针对三种不同难度翻译方向中性别模糊性时,对性别中立需求的敏感度。我们对实践中观察到的具体性别中立策略进行了分类和讨论。此外,我们还检验了二元性别刻板印象对性别中立翻译使用的影响。总体而言,研究结果显示当前机器翻译系统在面对性别模糊性时普遍缺乏性别中立翻译方案,这一现状令人失望。不过,我们观察到少数机器翻译系统会根据目标语言特点,采用特定策略切换至性别中立翻译模式。 | | 《Sekai:面向全球探索的视频数据集》

翻译说明: 1. 保留原数据集名称"Sekai"(日语"世界"的罗马音)不译,维持学术术语一致性 2. 副标题采用"面向...的"专业学术表述,符合计算机视觉领域数据集命名规范 3. "Video Dataset"译为"视频数据集",准确反映其多媒体数据库属性 4. "World Exploration"译为"全球探索",其中"exploration"根据上下文采用地理空间探测的学术含义 5. 整体采用书名号标注,符合中文期刊论文标题格式要求 6. 术语处理与IEEE文献中数据集命名惯例保持一致(如参照"Cityscapes: A Semantic Segmentation Dataset"的译法) | Zhen Li | PDF | Video generation techniques have made remarkable progress, promising to be the foundation of interac [翻译失败] | | 《思维泄露:大型推理模型并非隐秘思考者》

注:翻译要点解析: 1. "Leaky Thoughts"译为"思维泄露",采用计算机安全领域术语"泄露"对应"leaky",准确传达模型思维过程可能外泄的含义 2. 副标题处理为判断句式"并非",比直译"不是"更符合学术表述规范 3. "Private Thinkers"译为"隐秘思考者",通过"隐秘"一词突出隐私保护维度,比"私人"更契合上下文 4. 保留原标题的隐喻修辞风格,通过冒号维持主副标题结构 5. "Reasoning Models"统一译为专业术语"推理模型",区别于普通的"推理系统"等表述 | Tommaso Green | PDF | We study privacy leakage in the reasoning traces of large reasoning models used as personal agents. [翻译失败] |

bioRxiv

标题 作者 PDF链接 摘要
急性高强度活动对感知决策动态的影响

(翻译说明: 1. "Acute"译为"急性"以准确表达短时、一次性高强度活动的特性,符合运动科学术语规范 2. "High-Intensity Activity"采用体育科学标准译法"高强度活动",区别于持续性的"exercise(锻炼)" 3. "Perceptual Decision-Making"译为"感知决策",保留认知神经科学专业术语的准确性 4. "Dynamics"译为"动态"而非"动力学",更符合心理学研究中关于决策过程变化特征的表述 5. 整体句式结构遵循中文社科论文标题的简洁特征,采用"对...的影响"的经典研究命题句式) | Davranche, K. | PDF | | | 针对机械不稳定性演化形成的胚胎内陷模式化机制

(翻译说明: 1. "Patterned"译为"模式化"以强调生物学中特定空间结构的规律性排布特征 2. "embryonic invagination"采用专业术语"胚胎内陷",准确对应发育生物学概念 3. "evolved in response to"译为"演化形成...机制",通过增译"机制"二字既符合中文表达习惯,又完整保留进化适应的因果关系 4. "mechanical instability"译为"机械不稳定性",严格保持生物力学专业术语的准确性 5. 整体采用科学论文标题的简洁句式结构,通过"针对...形成...机制"的句式突出研究发现的适应性进化本质) | Vellutini, B. C. | PDF | | | "Bitesize蛋白结合F-肌动蛋白并影响合胞体果蝇胚胎发育中的肌动蛋白重构"

说明: 1. 专业术语处理: - "Bitesize"作为特定蛋白名称保留不译 - "F-actin"译为"F-肌动蛋白"(纤维状肌动蛋白的标准译法) - "actin remodeling"译为"肌动蛋白重构"(细胞生物学标准术语)

  1. 句式结构调整:
  2. 将英语名词结构"influences actin remodeling"转换为动词结构"影响...肌动蛋白重构"
  3. "syncytial Drosophila embryo development"译为前置定语"合胞体果蝇胚胎发育中的"

  4. 专业背景体现:

  5. "syncytial"准确译为"合胞体的",特指果蝇早期胚胎的多核体发育阶段
  6. 保留"Drosophila"的规范译名"果蝇"

  7. 符合中文科技论文表达习惯:

  8. 使用"蛋白"而非"蛋白质"(当前细胞生物学领域更常用简称)
  9. 采用"重构"而非"重塑"(更符合actin动态变化的专业表述) | Yeh, A. R. | PDF | | | 《核型适应度景观的局部自适应映射》

翻译说明: 1. "Local Adaptive"译为"局部自适应",准确保留了计算生物学中关于局部优化算法的专业含义 2. "Mapping"译为"映射",符合数学建模领域的术语规范,而非简单译为"绘制" 3. "Karyotype Fitness Landscapes"译为"核型适应度景观",完整保留了: - "Karyotype"(核型)的细胞遗传学专业术语 - "Fitness Landscapes"(适应度景观)的进化生物学经典概念 4. 整体采用"的"字结构的名词短语,符合中文科技论文标题的简洁特征 5. 使用书名号《》体现学术论文标题的规范性,区别于普通短语

该翻译严格遵循了学术翻译的"术语一致性"和"概念等值"原则,确保专业概念的准确传递。 | Beck, R. J. | PDF | | | 蓝光利用黄素蛋白中谷氨酰胺互变异构化与暗态恢复旋转机制的自由能研究

(翻译说明: 1. 专业术语处理: - "Gln" 译为标准生化术语"谷氨酰胺" - "tautomerization" 采用化学领域规范译法"互变异构化" - "flavin proteins" 统一译为"黄素蛋白"(学界通用译名)

  1. 句式重构: 将原文名词化结构转换为中文惯用的"研究"句式,符合中文论文标题表达习惯

  2. 逻辑显化: 通过"与"字连接两个并列机制,使用"中"字明确定位研究体系,比直译更清晰体现原文的科学内涵

  3. 术语统一性: "dark-state recovery"严格对应光化学领域术语"暗态恢复","blue light-using"译为"蓝光利用"准确传达光敏蛋白特性) | Perez de Alba Ortiz, A. | PDF | | | 基于深度神经网络的蛋白质聚集倾向区域预测及其通过计算设计的抑制方法

(翻译说明: 1. 专业术语处理: - "Aggregation Prone Regions"译为"聚集倾向区域",符合蛋白质结构领域术语 - "Deep Neural Networks"保留技术名词"深度神经网络" - "Computational Design"译为"计算设计",对应合成生物学领域标准译法

  1. 句式结构调整:
  2. 将英文被动语态转换为中文主动语态("their suppression by"→"及其通过...抑制")
  3. 采用"基于..."的句式突出方法论特征
  4. 使用"及其"连接前后两个研究环节,保持逻辑连贯性

  5. 学术规范:

  6. 保留专业名词的精确性(如"神经网络"不简化为"网络")
  7. 使用"预测方法"而非"预报"等非学术表述
  8. 动词"抑制"准确表达蛋白质工程中的活性调控概念

  9. 中文表达优化:

  10. 添加"方法"二字使标题更完整
  11. 通过"及其"连接使两个研究阶段的关系更清晰
  12. 控制标题在25字以内,符合中文期刊标题惯例) | Cima, V. | PDF | | | 思维字幕生成:基于人脑活动演化心理内容的描述性文本

(翻译说明: 1. 专业术语处理:"Mind Captioning"译为"思维字幕生成",既保留"captioning"的多媒体信息生成含义,又通过"思维"准确传达认知科学内涵 2. 动态过程表达:"Evolving"译为"演化"而非简单"生成",突出算法持续优化的特性 3. 学术概念对等:"mental content"译为"心理内容"符合认知神经科学术语规范 4. 句式结构调整:将英文后置定语转换为中文前置定语,符合汉语表达习惯 5. 技术准确性:严格区分"brain activity"(脑活动)与"neural activity"(神经活动)的译法差异) | Horikawa, T. | PDF | | | 使用导电聚合物纳米颗粒增强的纳米流体激光碎石术

(翻译说明: 1. "Nanofluid-Enhanced"译为"纳米流体增强的",准确传达了利用纳米流体技术提升性能的核心概念 2. "Laser Lithotripsy"采用医学标准术语"激光碎石术",符合《医学名词》规范 3. "Conducting Polymer Nanoparticles"译为"导电聚合物纳米颗粒",其中: - "conducting"取"导电"义项而非"传导",因在材料科学中特指电导性 - 保留"纳米"量级表述 - 采用"颗粒"而非"粒子"更符合中文材料学表述习惯 4. 语序调整为中文惯用的"方法+技术"结构,符合科技论文标题特征 5. 整体采用"定语+中心词"的偏正结构,保持学术标题的简洁性) | Fan, Q. | PDF | | | 肌动蛋白汇聚区与KIF11抑制的有丝分裂纺锤体中收缩力的测量

说明: 1. "Contractility"译为"收缩力",准确表达细胞骨架力学特性 2. "Actin Convergence Zone"采用专业术语"肌动蛋白汇聚区",保留细胞生物学特征 3. "KIF11-Inhibited"译为"KIF11抑制的",保持基因名称规范(KIF11作为驱动蛋白家族成员编号不翻译) 4. "Mitotic Spindles"译为"有丝分裂纺锤体",符合细胞分裂研究领域的标准译法 5. 整体语序调整为中文习惯的偏正结构,通过"与"字连接两个并列研究对象,保持学术表达的严谨性 6. 使用"中"替代原文介词"in",更符合中文表述习惯 | Matov, A. | PDF | | | 多胺通过调控组蛋白修饰酶的活性来调节细胞命运

(翻译说明: 1. "Polyamines"译为"多胺",是生物化学领域的标准术语 2. "regulate cell fate"译为"调节细胞命运",其中"cell fate"是发育生物学中的专业概念,指细胞分化方向 3. "altering the activity"译为"调控...的活性",比直译"改变"更符合中文生物学文献表达习惯 4. "histone-modifying enzymes"译为"组蛋白修饰酶",完整保留了表观遗传学的专业术语 5. 采用"通过...来..."的句式结构,清晰表达了多胺的作用机制 6. 整体译文在保持专业性的同时,符合中文科技论文的语序和表达规范) | Emmons-Bell, M. | PDF | |

medRxiv

标题 作者 PDF链接 摘要
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF