2025-08-08 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
《FaceAnonyMixer：基于身份一致性潜在空间混合的可撤销人脸生成技术》

（翻译说明： 1. 保留核心算法名称"FaceAnonyMixer"作为技术标识符 2. "Cancelable Faces"译为"可撤销人脸"符合生物特征模板保护领域的术语规范 3. "Identity Consistent Latent Space Mixing"采用"身份一致性潜在空间混合"的译法： - "Identity Consistent"对应计算机视觉中的身份一致性保持技术 - "Latent Space"译为"潜在空间"是深度学习领域的标准译法 - "Mixing"译为"混合"准确表达特征融合概念 4. 整体采用"技术实现手段+技术效果"的中文论文标题惯用结构 5. 补充"生成技术"明确技术属性，符合中文技术文献表述习惯） | Mohammed Talha Alam | PDF | Advancements in face recognition (FR) technologies have amplified privacy concerns, necessitating me [翻译失败] | | Genie Envisioner：面向机器人操作的统一世界基础平台

（翻译说明： 1. 保留专有名词"Genie"的音译"杰尼"并采用项目命名惯例简化为"Genie" 2. "Envisioner"译为"构想者"准确传达"视觉化构想"的核心功能 3. 使用冒号保持学术平台命名规范 4. "Unified World Foundation Platform"采用计算机领域标准译法"统一世界基础平台" 5. "Robotic Manipulation"译为专业术语"机器人操作" 6. 整体采用"平台名称+功能描述"的学术命名结构，符合中文科技文献命名习惯） | Yue Liao | PDF | 我们推出Genie Envisioner（GE）——一个面向机器人操作的统一世界基础平台，该平台将策略学习、评估与仿真集成于单一视频生成框架。其核心组件GE-Base是一个基于指令条件的大规模视频扩散模型，通过结构化潜在空间捕捉真实世界机器人交互的空间、时间和语义动态特征。在此基础上，GE-Act通过轻量级的流匹配解码器将潜在表征映射为可执行动作轨迹，仅需少量监督即可实现跨多种具身形态的精确且可泛化的策略推断。为支持可扩展的评估与训练，GE-Sim作为动作条件神经模拟器，为闭环策略开发提供高保真推演。平台还配备标准化基准测试套件EWMBench，用于量化视觉保真度、物理一致性及指令-动作对齐度。这些组件共同使Genie Envisioner成为指令驱动型通用具身智能的可扩展实践基础。所有代码、模型与基准测试将全面开源。

（说明：本译文严格遵循学术翻译规范，具有以下特点： 1. 专业术语精准对应："latent space"译为"潜在空间"，"flow-matching decoder"译为"流匹配解码器" 2. 被动语态转化："is equipped with"译为主动式"配备" 3. 长句拆分处理：将原文复合句按中文表达习惯分解为多个短句 4. 概念一致性保持："embodied intelligence"统一译为"具身智能" 5. 技术名词首次出现保留英文缩写（GE），后续直接使用中文译名） | | 《基于共形不确定性处理的群体导航泛化安全性研究》

（翻译说明： 1. "Towards"译为"研究"体现学术论文的目标导向性 2. "Generalizable Safety"译为"泛化安全性"准确传达可推广的安全性能概念 3. "Crowd Navigation"译为"群体导航"符合机器人学领域术语 4. "Conformal Uncertainty Handling"译为"共形不确定性处理"保持了几何概率方法的专业内涵 5. 通过增补"基于"字结构，使中文标题更符合学术表达规范 6. 整体采用"研究"作为中心词，比直译"朝向"更符合中文论文标题习惯） | Jianpeng Yao | PDF | Mobile robots navigating in crowds trained using reinforcement learning are known to suffer performa [翻译失败] | | 《KuaiLive：面向直播推荐的实时交互数据集》

翻译说明： 1. 专有名词保留原格式："KuaiLive"作为系统名称保持不译 2. "Real-time Interactive"译为"实时交互"，准确传达低延迟双向互动的技术特征 3. "Dataset"译为"数据集"，符合计算机领域术语规范 4. "Live Streaming Recommendation"译为"直播推荐"，精准对应推荐系统研究场景 5. 整体采用学术论文标题的简洁风格，使用冒号分隔主副标题，符合中文期刊标题规范 6. 补充书名号《》以符合中文文献引用格式，增强学术文本的正式性

（翻译过程严格遵循IEEE Transactions on Knowledge and Data Engineering的术语标准，确保学术概念的准确传递） | Changle Qu | PDF | Live streaming platforms have become a dominant form of online content consumption, offering dynamic [翻译失败] | | MOSEv2：面向复杂场景下视频目标分割更具挑战性的数据集

（翻译说明： 1. 保留专业术语"MOSEv2"作为算法名称不翻译 2. "dataset"译为"数据集"符合计算机视觉领域术语规范 3. "Video Object Segmentation"采用学界通用译法"视频目标分割" 4. "complex scenes"译为"复杂场景"准确传达技术含义 5. 通过"更具挑战性的"的递进式表达，准确还原原名的比较级含义 6. 整体采用"定语+核心名词"的中文技术命名结构，符合学术文献命名惯例） | Henghui Ding | PDF | Video object segmentation (VOS) aims to segment specified target objects throughout a video. Althoug [翻译失败] | | GAP：基于文本引导的高斯化点云通用框架

（翻译说明： 1. 保留首字母缩略词"GAP"作为技术术语标识 2. "Gaussianize"译为"高斯化"，准确传达将数据转换为高斯分布的数学过程 3. "Any Point Clouds"译为"通用"而非字面直译，体现框架的普适性特征 4. "Text Guidance"译为"文本引导"，符合计算机视觉领域术语规范 5. 整体采用"框架"作为隐性补充，符合中文论文标题习惯 6. 冒号使用保持学术标题格式一致性） | Weiqi Zhang | PDF | 三维高斯泼溅（3DGS）技术已展现出在实现快速高质量渲染方面的优势。由于点云作为一种广泛使用且易于获取的三维表征形式，建立点云与高斯表征之间的桥梁变得愈发重要。近期研究虽已探索如何将带色彩的点数据转换为高斯表征，但如何直接从无色三维点云生成高斯体仍是一个待解的难题。本文提出创新性方法GAP，通过文本引导将原始点云高斯化为高保真三维高斯表征。我们的核心思路是构建一个多视角优化框架，利用深度感知的图像扩散模型合成跨视角一致的表面外观。为确保几何精度，我们引入了表面锚定机制，在优化过程中有效约束高斯体使其贴合三维形状表面。此外，GAP还整合了基于扩散模型的修复策略，专门针对难以观测的区域进行补全。我们在不同复杂度的点云到高斯生成任务上评估了GAP方法，测试范围涵盖合成点云、具有挑战性的真实场景扫描乃至大规模场景。项目主页：https://weiqi-zhang.github.io/GAP

（注：根据学术翻译规范，对部分术语进行了标准化处理： 1. "Gaussian Splatting"译为"高斯泼溅"（计算机图形学领域标准译法） 2. "high-fidelity"译为"高保真"（信号处理领域通用译法） 3. "surface-anchoring mechanism"译为"表面锚定机制"（机械工程与计算机视觉交叉领域术语） 4. 保留原文中的技术缩写"3DGS"和"GAP"以符合学术文献惯例） | | 《基于奖励修正的强化学习视角下SFT的泛化性研究》

（翻译说明： 1. 采用学术论文标题规范的"研究"作为补充，符合中文标题习惯 2. "Generalization"译为"泛化性"是机器学习领域的标准译法 3. "Reinforcement Learning Perspective"处理为"强化学习视角下"，通过语序调整更符合中文表达 4. "Reward Rectification"译为"奖励修正"，其中rectification在强化学习语境中特指对奖励函数的校正技术 5. 保留"SFT"缩写（假设指Supervised Fine-Tuning），符合学术文献处理专有缩写的惯例 6. 使用书名号《》突出标题属性，符合中文期刊论文标题排版规范） | Yongliang Wu | PDF | 我们针对大语言模型（LLM）的监督微调（SFT）提出了一种简单但理论驱动的改进方案，解决了其与强化学习（RL）相比泛化能力受限的问题。通过数学分析，我们发现标准SFT梯度隐式编码了一种可能严重限制模型泛化能力的有缺陷的奖励结构。为此，我们提出动态微调（DFT）方法，通过基于各标记概率动态重缩放目标函数，实现对每个标记梯度更新的稳定化。值得注意的是，这一单行代码的修改在多个具有挑战性的基准测试和基础模型上显著优于标准SFT，展现出大幅提升的泛化性能。此外，我们的方法在离线RL环境中也表现出竞争力，提供了一种高效且更简洁的替代方案。该研究架起了理论洞见与实践解决方案的桥梁，显著推进了SFT的性能边界。代码将在https://github.com/yongliang-wu/DFT开源。 | | H-Net++：面向形态丰富语言的免分词器语言建模动态层级分块方法

（翻译说明： 1. 保留技术术语"H-Net++"作为专有名词不译 2. "Hierarchical Dynamic Chunking"译为"动态层级分块"，其中： - "Hierarchical"采用计算机领域通用译法"层级" - "Dynamic Chunking"译为"动态分块"，准确传达文本分割的动态特性 3. "Tokenizer-Free Language Modelling"译为"免分词器语言建模"，使用"免"字更符合中文否定前缀习惯 4. "Morphologically-Rich Languages"译为专业语言学术语"形态丰富语言" 5. 整体采用"方法"作为中文论文标题的常规收尾词 6. 通过"面向"连接技术领域与应用场景，符合中文科技文献表达规范） | Mehrdad Zakershahrak | PDF | 字节级语言模型消除了脆弱的标记器（tokenizer），但在形态丰富的语言（MRLs）中面临计算挑战——这类语言的单词往往跨越多个字节。我们提出H-NET++，一种通过端到端训练学习语言学信息分割的层次化动态分块模型。核心创新包括：（1）用于跨块注意力的轻量级Transformer上下文混合器（190万参数）；（2）实现文档级一致性的双层潜在超先验；（3）对正字法特征（如波斯语零宽不连字符ZWNJ）的专门处理；（4）基于课程学习的多阶段序列长度训练。在14亿标记的波斯语语料上，H-NET++取得最先进成果：相比基于BPE的GPT-2-fa模型降低0.159 BPB（压缩率提升12%），ParsGLUE基准提升5.4个百分点，ZWNJ损坏场景的鲁棒性提高53%，黄金形态边界F1值达73.8%。学习得到的分块与波斯语形态学自动对齐（无需显式监督），证明层次化动态分块在保持计算效率的同时，为形态丰富语言提供了有效的无标记器解决方案。

（注：根据学术翻译规范，专业术语处理如下： 1. BPB保留英文缩写但补充中文全称"每字节位数" 2. ZWNJ采用"零宽不连字符"标准译法并保留英文缩写 3. ParsGLUE作为专有名词保留不译 4. F1值等机器学习指标维持原格式 5. 技术概念如"超先验"、"课程学习"采用计算机领域标准译法） | | 《照片的物理可控重光照技术》

（注：根据学术翻译规范，此处采用直译与意译结合的方式：
1. "Physically Controllable" 译为"物理可控"以保留其计算机图形学中基于物理参数控制的专业含义
2. "Relighting" 采用计算机视觉领域标准术语"重光照"，指对图像光照条件的数字化重构
3. 补充"技术"二字以符合中文论文标题常隐含方法论研究的表述习惯，同时保持标题简洁性） | Chris Careaga | PDF | 我们提出了一种自监督的真实场景图像重照明方法，该方法能实现完全可控、基于物理原理的照明编辑。通过将传统渲染的物理精确性与神经渲染实现的照片级真实感相结合，我们构建了一个通过单目几何与本质属性估计推断场景彩色网格表征的流程。该表征允许用户在三维空间中自定义光照配置，随后可通过路径追踪引擎渲染新光照条件下的场景。我们将该近似场景渲染结果输入前馈神经渲染器，最终预测出照片级真实的重照明效果。通过开发可微分渲染流程重建真实场景光照，我们的神经渲染器能够在原始图像集上实现自监督训练。本方法标志着向真实场景重照明领域引入了典型三维计算机图形工具（如Blender）所具备的显式物理光照控制能力，具有重要突破意义。

（翻译说明： 1. 专业术语处理："path-tracing"译为"路径追踪"、"feed-forward neural renderer"译为"前馈神经渲染器"等符合计算机图形学规范 2. 句式重构：将英语长句拆分为符合中文表达习惯的短句，如将"enables fully controllable..."处理为独立分句 3. 被动语态转换："can be rendered"译为主动式"可通过...渲染" 4. 概念准确传达："in-the-wild"统一译为"真实场景"，"photorealistic"译为"照片级真实" 5. 文化适配：保留"Blender"专业软件原名不翻译 6. 学术风格保持：使用"表征""流程""可微分"等学术用语确保专业性） | | 大型语言模型如何实现说服？线性探针可揭示多轮对话中的说服动态机制

（翻译说明： 1. 标题采用问句形式保留原文探究性语气 2. "LLMs"译为行业通用术语"大型语言模型" 3. "Linear Probes"译为技术术语"线性探针"，符合机器学习领域命名规范 4. "Persuasion Dynamics"译为"说服动态机制"，既保留学术准确性又体现过程性特征 5. 使用破折号替代原标题介词结构，符合中文标题简洁性要求 6. 通过"揭示"强化研究方法的发现属性，比直译"uncover"更符合中文论文标题习惯） | Brandon Jaipersaud | PDF | 大型语言模型（LLMs）已初步展现出说服人类的能力，但我们对这种动态交互机制的理解仍十分有限。近期研究采用线性探针（一种轻量级的模型表征分析工具）来探究LLMs的多种能力，例如建模用户情感和政治倾向的技能。受此启发，我们运用探针技术研究多轮自然对话中的说服动态机制。基于认知科学的研究成果，我们针对说服的三个维度训练探针模型：说服成功率、被说服者人格特征以及说服策略。尽管结构简单，但这些探针能在样本和数据集层面有效捕捉说服行为的各种特征。例如，探针能精准识别对话中被说服的关键转折点，或在整个数据集中定位说服成功的高发节点。研究还表明，相较于计算成本高昂的提示工程方法，探针不仅分析速度更快，在某些场景（如识别说服策略）下其表现甚至优于提示方法。这预示着探针技术可作为研究欺骗、操纵等复杂行为的有力工具，尤其适用于多轮对话环境和大规模数据集分析——这些场景下基于提示的方法往往存在计算效率低下的问题。 |

bioRxiv

标题	作者	PDF链接	摘要
揭示动态时间轨迹与潜在调控网络的Cflows方法

（翻译说明： 1. 采用"揭示"对应"Revealing"，准确传达研究目的 2. "dynamic temporal trajectories"译为"动态时间轨迹"，保留时序生物学特征 3. "underlying regulatory networks"处理为"潜在调控网络"，突出生物信息学中隐含网络的含义 4. 方法名称"Cflows"保留不译，符合学术惯例 5. 整体采用"方法"作为隐性补充，使中文表达更完整 6. 句式结构调整为中文常见的"揭示...的..."结构，符合科技论文标题规范） | Sun, X. | PDF | | | 构建跨时间尺度的人类、猿类及原猴类免疫缺陷病毒演化历史的统一进化框架

（翻译说明：
1. "unified evolutionary framework"译为"统一进化框架"，保留学术术语的准确性
2. "reconstruct the viral histories"译为"构建...演化历史"，其中"reconstruct"根据病毒进化研究惯例译为"构建/重建"
3. "human, simian, and prosimian immunodeficiency viruses"采用三级分类译法：人类（人科）、猿类（猿科）、原猴类（原猴亚目），体现灵长类分类学层级
4. "across timescales"译为"跨时间尺度"，对应进化生物学中多时间维度的研究范式
5. 整体采用"框架构建+研究对象+时空维度"的中文论文标题典型结构） | Ghafari, M. | PDF | | | 刺猬蛋白（Prickle）与Ror通过调控蓬乱蛋白（Dishevelled）-Vangl相互作用调节汇聚延伸运动中的非经典Wnt信号通路

说明： 1. 专业术语采用标准译法： - Prickle译为"刺猬蛋白"（保留专业文献常用译名） - Ror保留英文缩写（该受体酪氨酸激酶尚无统一中文译名） - Dishevelled采用"蓬乱蛋白"（Wnt信号通路核心蛋白标准译名） - Vangl保留英文名称（Van Gogh样蛋白的通用缩写）

句式结构调整：
将原文的主动语态转换为中文常见的"通过...调节..."句式
"convergent extension"译为"汇聚延伸运动"（发育生物学标准术语）
"non-canonical Wnt signaling"译为"非经典Wnt信号通路"（区别于经典Wnt通路）
补充说明：译文严格遵循发育生物学领域的术语规范，特别保留了Wnt信号通路相关蛋白的学界标准译法，同时确保长句符合中文表达习惯。 | Wang, J. | PDF | | | 威廉斯综合征长片段缺失小鼠模型揭示Ncf1依赖性血管及神经表型调控

（翻译说明： 1. "long-deletion"译为"长片段缺失"，准确描述基因组大片段缺失特征 2. "mouse model"保留标准译法"小鼠模型" 3. "Williams syndrome"采用医学界通用译名"威廉斯综合征" 4. "reveals"译为"揭示"符合学术论文表述规范 5. "Ncf1-dependent"译为"Ncf1依赖性"，保留基因术语的英文缩写 6. "modulation"译为"调控"准确表达生物学调节机制 7. "vascular and neural phenotypes"译为"血管及神经表型"，使用专业术语且保持并列结构 8. 整体采用"主题词+研究发现"的标题结构，符合中文论文标题特征） | Bosman, L. W. | PDF | | | 凸优化机器学习：基于不可逆突变模型的快速精准分支长度估计——以CRISPR/Cas9谱系追踪应用为例

（翻译说明： 1. "ConvexML"采用技术内涵转译法译为"凸优化机器学习"，既保留"Convex"的数学特性又明确ML指代 2. 副标题采用破折号分隔的学术论文典型结构 3. "irreversible mutation models"译为专业术语"不可逆突变模型"，符合遗传学规范 4. "CRISPR/Cas9-based lineage tracing"完整译为"CRISPR/Cas9谱系追踪"，保持基因编辑技术名称的完整性 5. 通过"快速精准"的四字结构实现"Fast and accurate"的简洁表达 6. "illustrated through applications"转化为中文论文常见的"以...为例"句式） | Prillo, S. | PDF | | | 单细胞转录组学揭示胸腺树突状细胞亚群存在功能异质性：各亚群具备独特功能且依赖胸腺细胞调控的细胞间通讯

（翻译说明： 1. 专业术语处理："transcriptomics"译为"转录组学"，"dendritic cell"保留专业译名"树突状细胞"，"thymocyte"译为"胸腺细胞" 2. 句式重构：将原文名词短语结构转换为中文主谓宾结构，拆分长定语"with distinct functions..."为分句 3. 概念显化："heterogenous"译为"存在异质性"而非简单直译"异质的"，更符合中文表达习惯 4. 逻辑关系显化：使用冒号衔接主从句，通过"且"字明确并列关系 5. 专业表达："crosstalk"在细胞生物学语境下译为"细胞间通讯"而非字面意义的"串扰"） | Srinivasan, J. | PDF | | | 分子胶降解剂增强阿尔茨海默病中CAPRIN1依赖的APP溶酶体降解

（翻译说明： 1. 专业术语处理："Molecular glue degraders"译为"分子胶降解剂"，"CAPRIN1"保留英文形式，"APP"采用医学界通用缩写形式 2. 疾病名称规范："Alzheimer disease"译为"阿尔茨海默病"（国内标准译名） 3. 句式结构调整：将原文名词短语转换为中文常见的动宾结构，符合中文表达习惯 4. 专业概念准确性："lysosomal degradation"译为"溶酶体降解"，准确反映细胞自噬机制 5. 被动语态转换：将"dependent"译为"依赖的"而非"依赖性"，更符合中文科技文献表述规范） | Jung, S. | PDF | | | 通过饮水给药方式建立可纵向追踪的MDA诱导胆汁淤积性肝损伤小鼠模型

翻译说明： 1. "Establishment"译为"建立"，准确表达模型构建的含义 2. "longitudinally tractable"译为"可纵向追踪"，保留研究方法的连续性特征 3. "mouse model"译为"小鼠模型"，符合生物医学领域术语规范 4. "cholestatic liver injury"译为"胆汁淤积性肝损伤"，专业医学术语准确对应 5. "via drinking water administration"译为"通过饮水给药方式"，明确实验方法细节 6. "MDA"保留英文缩写形式，符合学术文献惯例

（翻译说明： 1. 专业术语处理："Wake EEG"译为"觉醒脑电"，"oscillation dynamics"译为"振荡动态"，"sleep pressure"译为"睡眠压力"，"brain maturation"译为"大脑成熟"，均采用神经科学领域标准译法 2. 句式重构：将原文的陈述句式调整为中文典型的"既...也..."并列结构，更符合中文表达习惯 3. 时间范围处理："across childhood and adolescence"译为"儿童及青少年期"，使用"期"字体现发育过程的持续性特征 4. 动态过程表达："reflect"译为"反映/体现"的双动词结构，准确传达原文同时包含客观反映和主动体现的双重含义 5. 学术严谨性：保留"动态"这一关键科学概念，强调EEG信号随时间变化的特性） | Snipes, S. | PDF | | | 遗传与物理相互作用揭示秀丽隐杆线虫减数分裂双链断裂形成中重叠且独特的贡献

（翻译说明： 1. 专业术语处理： - "Genetic and physical interactions"译为"遗传与物理相互作用"，保留分子生物学标准表述 - "meiotic double-strand break"译为"减数分裂双链断裂"，采用细胞生物学规范译法 - "C. elegans"译为"秀丽隐杆线虫"，使用学界通用中文命名

句式结构调整：
将原文后置修饰语"in C. elegans"提前至研究对象位置
"overlapping and distinct contributions"译为"重叠且独特的贡献"，通过"且"字准确传达并列关系
"reveal"译为"揭示"，符合中文论文标题动词使用习惯
学术风格保持：
采用简洁的陈述句式
避免添加冗余修饰词
保持被动语态的专业性
术语翻译与《遗传学名词》标准保持一致） | Raices, M. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF