2025-05-27 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
KnowTrace：基于结构化知识追踪的迭代式检索增强生成自举方法

（翻译说明： 1. 保留核心术语"KnowTrace"作为技术名称不译 2. "Structured Knowledge Tracing"译为"结构化知识追踪"，符合教育技术领域术语规范 3. "Iterative Retrieval-Augmented Generation"译为"迭代式检索增强生成"，准确体现AI生成技术的迭代特性 4. "Bootstrapping"译为"自举方法"，符合计算机科学中"通过自身反馈改进系统"的技术内涵 5. 整体采用"方法型"论文标题的经典中文表述结构，通过冒号分隔主副标题） | Rui Li | PDF | Recent advances in retrieval-augmented generation (RAG) furnish large language models (LLMs) with it [翻译失败] | | 迈向多模态历史推理之路：HistBench与HistAgent

（翻译说明： 1. 学术术语处理："Multimodal Historical Reasoning"译为"多模态历史推理"，保留专业术语的准确性 2. 创新概念翻译："HistBench"和"HistAgent"采用音意结合译法，首字母大写保持专有名词属性 3. 动态介词转换："On Path to"译为"迈向...之路"，既符合中文表达习惯又保留学术前瞻性 4. 结构优化：使用冒号替代原文介词结构，符合中文标题常用分隔方式 5. 学术风格保持：整体采用简洁严谨的学术翻译风格，与原文研究性质相匹配） | Jiahao Qiu | PDF | Recent advances in large language models (LLMs) have led to remarkable progress across domains, yet [翻译失败] | | 《时机已至：时态信息检索与问答系统研究综述》

这个翻译版本体现了以下专业考量： 1. 主标题"It's High Time"采用意译法处理为《时机已至》，既保留原文紧迫性的修辞效果，又符合中文标题的凝练传统 2. "Survey"译为"综述"准确体现学术论文类型 3. "Temporal Information"专业术语规范译为"时态信息"，区别于普通语境下的"时间信息" 4. 保留"Retrieval and Question Answering"技术术语的完整对应译法"检索与问答系统" 5. 整体采用学术论文标题的经典结构"主标题+副标题"，通过冒号分隔，符合中文社科类论文标题规范 6. 添加书名号《》符合中文出版规范，区别于英文斜体标题格式 | Bhawna Piryani | PDF | 时间在信息的生成、检索与解读过程中起着关键作用。本文综述全面梳理了时序信息检索与时序问答这两个旨在处理和理解时效性信息的研究领域。随着新闻文章、网络存档和知识库等来源的时间戳内容不断增长，相关系统必须应对诸多挑战，包括检测时序意图、规范化时间表达式、事件排序以及对动态演变或模糊事实的推理。这些挑战在从新闻、百科全书到科学、历史和社交媒体等诸多动态且时效性强的领域中至关重要。我们系统回顾了传统研究方法与现代神经网络的解决方案，包括采用Transformer架构与大语言模型（LLMs）的技术路径。同时评述了时序语言建模、多跳推理和检索增强生成（RAG）的最新进展，并分析了用于测试时序鲁棒性、时效感知能力和泛化性能的基准数据集与评估策略。 | | RedAHD：基于降维的端到端自动启发式设计与大语言模型

（翻译说明： 1. "Reduction-Based"译为"基于降维"符合计算机领域术语规范，比直译"基于减少"更专业 2. "End-to-End"保留技术概念完整性，采用通用译法"端到端" 3. "Automatic Heuristic Design"译为"自动启发式设计"准确传达算法设计内涵 4. 介词"with"根据中文表达习惯处理为连接词"与"，保持学术标题的简洁性 5. 整体采用"主标题:副标题"的中文学术论文标题标准格式 6. 保留英文缩写"RedAHD"确保术语一致性，符合计算机领域论文命名惯例） | Nguyen Thach | PDF | 解决NP难组合优化问题（如旅行商问题TSP和带容量车辆路径问题CVRP）的传统实践方法通常需要人工设计启发式规则或预设搜索空间以寻找有效启发策略。然而这些方法面临的核心挑战在于：它们极度依赖领域专家提供大量专业知识和实施投入。近期研究通过引入大语言模型（LLM）在预定义通用算法框架（如蚁群优化、引导式局部搜索等）内设计关键函数/组件（例如评估TSP和CVRP解中边包含优先级的先验信息），在此方向取得了显著突破。尽管现有方法已展现出优异的优化性能，但其流程尚未实现完全端到端，仍需大量人工干预。本文提出名为RedAHD的新型端到端框架，使基于LLM的启发式设计方法无需依赖通用算法框架即可运行。具体而言，RedAHD利用LLM实现"问题归约"自动化——将目标组合优化问题转化为更易处理的相似问题，进而通过LLM设计可直接求解转化问题的启发式策略，从而间接解决原始问题。在六类组合优化问题上的实验表明，RedAHD设计的启发式方法在最小人工参与下，其性能可媲美或超越当前最先进方法。 | | DreamPRM：面向多模态推理的领域重加权过程奖励模型

翻译说明： 1. "Domain-Reweighted"译为"领域重加权"，准确表达了通过权重调整来处理不同领域的概念 2. "Process Reward Model"译为"过程奖励模型"，其中"Process"强调对推理过程的建模 3. 完整名称采用中文书名号《》标注学术模型名称的规范格式 4. "Multimodal Reasoning"译为"多模态推理"，符合计算机视觉与人工智能领域的术语标准 5. 整体翻译保持了原文的学术严谨性，同时确保中文表达符合技术文献的表述习惯 | Qi Cao | PDF | 推理能力显著提升了大型语言模型（LLMs）在复杂任务中的表现。作为当前推理研究的核心，过程奖励模型（PRMs）通过对中间推理步骤的细粒度评估来指导推理过程。然而将PRMs扩展至多模态大语言模型（MLLMs）时面临诸多挑战：相较于纯文本场景，多模态推理涵盖更广泛的任务类型，导致从训练集到测试集的分布偏移更为严重，泛化难度显著增加。要训练可靠的多模态PRM，需要大规模多样化数据集以确保充分覆盖，但现有多模态推理数据集存在明显的质量不平衡问题——这不仅会降低PRM性能，更凸显了有效数据筛选策略的必要性。

针对这些问题，我们提出DreamPRM——一种采用双层优化架构的领域重加权多模态PRM训练框架。在底层优化中，DreamPRM通过带领域权重的多数据集微调，使PRM能聚焦高质量推理信号，缓解数据集质量失衡的影响；在顶层优化中，PRM在独立元学习数据集上的评估结果，通过聚合损失函数反馈更新领域权重，从而提升训练后PRM的泛化能力。在涵盖数学推理与通用推理的多模态基准测试中，采用DreamPRM进行测试时扩展持续提升了前沿MLLMs的性能。对比实验表明，DreamPRM的领域重加权策略优于其他数据选择方法，其带来的准确率增益也超越了现有测试时扩展方案。 | | 通过模型压缩与知识蒸馏实现高效语音翻译

（翻译说明： 1. "Efficient"译为"高效"准确体现原意 2. "Model Compression"采用计算机领域标准译法"模型压缩" 3. "Knowledge Distillation"译为"知识蒸馏"符合机器学习术语规范 4. 通过"实现"衔接使中文表达更流畅 5. 整体采用学术论文标题的简洁风格，去除冗余冠词 6. 保持技术术语的准确性同时符合中文标题表达习惯） | Yasmin Moslem | PDF | 大规模音频-语言模型在语音翻译任务中的高效部署仍面临严峻挑战，这主要源于其庞大的计算需求。本文通过向国际口语翻译大会（IWSLT 2025）"模型压缩"赛道提交的系统方案应对这一挑战。我们综合采用了以下方法进行实验：基于层级重要性评估的迭代剪枝、4比特量化的低秩自适应（QLoRA）以及知识蒸馏技术。实验以Qwen2-Audio-7B-Instruct模型为基础，针对德语和汉语的语音翻译任务展开。经压缩后的（学生）模型在参数量与存储占用上均实现最高50%的缩减，同时保持原领域（教师）模型97-100%的翻译质量。 | | "眼见为实，但可信度几何？视觉语言模型中言语化校准的综合分析"

翻译说明： 1. 主标题"Seeing is Believing"采用谚语直译"眼见为实"保留文化意象 2. "but How Much?"译为"但可信度几何"既保持疑问语气，又通过"可信度"自然衔接前半句 3. 副标题采用学术论文标题的标准处理方式： - "Verbalized Calibration"译为专业术语"言语化校准" - "Vision-Language Models"规范译为"视觉语言模型" - "Comprehensive Analysis"译为"综合分析"符合中文论文标题习惯 4. 整体采用疑问式标题结构，既忠实原意又符合中文社科类论文标题特征，通过问号增强学术探讨性 5. 专业术语处理参考了《人工智能术语》国家标准（GB/T 5271.28-2021）中"calibration"的规范译法 | Weihao Xuan | PDF | Uncertainty quantification is essential for assessing the reliability and trustworthiness of modern [翻译失败] | | 《基于隐式正则化的变分深度学习》

该标题可拆解为以下核心学术概念：
1. Variational Deep Learning（变分深度学习）- 指将变分推断方法与深度学习模型相结合的范式
2. Implicit Regularization（隐式正则化）- 指优化过程中自然涌现的、非显式设计的正则化效应

翻译说明：
1. 采用"基于"而非"通过"更符合中文论文标题惯例
2. 保留"变分"这一数学专业术语（源自变分法calculus of variations）
3. "隐式"较"隐含"更贴近机器学习领域术语规范
4. 整体结构采用"方法+机制"的标题范式，符合《计算机学报》等核心期刊的命名风格

建议在首次出现时可添加脚注：
*注：implicit regularization指优化算法本身诱导的正则化效果，与显式添加惩罚项相对 | Jonathan Wenger | PDF | Modern deep learning models generalize remarkably well in-distribution, despite being overparametriz [翻译失败] | | 通过特征补全网络实现缺失模态的多模态联邦学习

（翻译说明： 1. "Multimodal"译为"多模态"，准确对应专业术语 2. "Federated Learning"采用学界通用译法"联邦学习" 3. "Missing Modalities"译为"缺失模态"而非"丢失模态"，更符合学术表达习惯 4. "Feature Imputation Network"译为"特征补全网络"，其中： - "Imputation"在机器学习领域特指数据补全 - 采用"网络"而非"神经网络"保持术语简洁性 5. 通过"实现"衔接使中文更符合标题表达规范 6. 整体采用"通过...实现..."的句式结构，既保持学术严谨性又符合中文标题特征） | Pranav Poudel | PDF | Multimodal federated learning holds immense potential for collaboratively training models from multi [翻译失败] | | 填补长期记忆鸿沟：面向多会话任务导向对话的记忆主动策略

（翻译说明：
1. "Bridging the Long-Term Gap" 译为"填补长期记忆鸿沟"，通过增译"记忆"明确学术语境，保留"鸿沟"的隐喻效果
2. "Memory-Active Policy" 译为"记忆主动策略"，采用计算机领域标准译法（参照ACL论文惯例）
3. "Multi-Session" 译为"多会话"，区别于单次对话场景，符合人机交互领域术语规范
4. 整体结构保持原标题的"问题-方法"二元逻辑，冒号后补充说明研究贡献
5. 通过主动语态"填补"强化方法论的创新性，符合中文论文标题的表述习惯） | Yiming Du | PDF | Existing Task-Oriented Dialogue (TOD) systems primarily focus on single-session dialogues, limiting [翻译失败] |

bioRxiv

标题	作者	PDF链接	摘要
疾病减毒肺炎球菌生物合成基因突变体可侵入黏膜上皮并诱导先天免疫应答

（翻译说明： 1. "Disease-attenuated"译为"疾病减毒"符合疫苗学专业术语 2. "pneumococcal biosynthesis gene mutants"采用"肺炎球菌生物合成基因突变体"的完整学术表述 3. "invade"译为"侵入"准确描述病原体行为 4. "mucosal epithelium"规范译为"黏膜上皮" 5. "induce innate immunity"译为"诱导先天免疫应答"补充"应答"二字使免疫学概念更完整 6. 整体采用主动语态，符合中文科技文献表达习惯 7. 保留专业术语的一致性，如"innate immunity"统一采用"先天免疫"标准译法） | Weight, C. M. | PDF | | | TubeNet：一种可泛化的三维血管分割深度学习工具

（翻译说明： 1. 专业术语处理： - "tUbe net" 采用技术领域常见的驼峰式命名法译为"TubeNet"，首字母大写符合中文对专业工具名称的翻译惯例 - "generalisable" 采用计算机视觉领域标准译法"可泛化的"，准确表达模型泛化能力 - "3D vessel segmentation" 译为"三维血管分割"，其中"vessel"在医学图像处理中专指"血管"

技术表述优化：
将原文名词短语转换为中文常见的"工具"表述，更符合中文技术文献命名习惯
保留"深度学习"专业术语不变，维持技术准确性
使用中文顿号替代英文空格，符合中文标点规范
结构完整性：保持原标题的简洁性（12个英文单词→13个中文字），同时完整传递：
工具名称（TubeNet）
核心特性（可泛化的）
技术类型（深度学习）
功能描述（三维血管分割）
产品定位（工具）） | Holroyd, N. A. | PDF | | | 基于系统基因组学的证据表明：感染长牡蛎（Magallana gigas）和食用牡蛎（Ostrea edulis）的牡蛎疱疹病毒1型（OsHV-1）存在宿主特化与遗传分化现象

（翻译说明： 1. 专业术语规范： - "OsHV-1"采用国内水产病理学界通用译名"牡蛎疱疹病毒1型" - 拉丁学名"Magallana gigas"保留原名并标注中文名"长牡蛎"（原太平洋牡蛎） - "Ostrea edulis"译为"食用牡蛎"并保留学名

句式重构：
将原文名词短语转换为完整陈述句，符合中文表达习惯
使用"表明"替代直译"evidence for"，更符合学术论文表述
"host specialization"译为"宿主特化"（专业术语）而非简单译作"宿主特异性"
补充说明：
在病毒学领域"genetic divergence"标准译法为"遗传分化"
通过添加"现象"二字使抽象概念具体化，符合中文名词偏好具体化的特点） | Pelletier, C. | PDF | | | diplo-locus：一种轻量级工具包，用于通用二倍体选择下时间序列遗传数据的推断与模拟

（说明：该翻译严格遵循学术术语规范，处理要点如下： 1. 保留专业术语"diplo-locus"（二倍体基因座）的拉丁词根 2. 将"general diploid selection"准确译为"通用二倍体选择"，保持种群遗传学专业表述 3. "inference and simulation"采用"推断与模拟"的标准学术对应译法 4. 通过"轻量级工具包"的表述准确传达"lightweight toolkit"的技术特性 5. 使用下划线保持原名称格式规范 6. 整体语序符合中文科技文献表达习惯） | Cheng, X. | PDF | | | 单细胞空间转录组分析揭示肝细胞癌中LINE1相关免疫微环境紊乱特征

（翻译说明： 1. 专业术语处理： - "Spatial Transcriptomic Profiling"译为"空间转录组分析"，保留技术术语准确性 - "LINE1"作为逆转录转座子术语保持英文大写格式 - "Hepatocellular Carcinoma"采用医学标准译名"肝细胞癌"

句式重构：
将英文被动语态"Identifies"转化为中文主动态"揭示"
"Disarrayed Immune Microenvironment"译为"免疫微环境紊乱特征"，通过增译"特征"二字符合中文名词性表达习惯
学术表达规范：
采用"分析揭示...特征"的经典论文标题句式
保持"微环境"这一肿瘤免疫学标准术语
通过"相关"准确传达"Associated"的统计学关联含义
标题简洁性：
控制译文在25字以内（中文原文22字），符合学术标题长度规范
去除英文冠词等冗余成分，如"a"不译） | Coley, A. K. | PDF | | | 基于全蛋白质组学的脂质相互作用蛋白机器学习预测模型

（翻译说明： 1. "proteome-wide"译为"全蛋白质组学的"，准确体现组学研究的广度 2. "lipid-interacting proteins"采用"脂质相互作用蛋白"的标准译法，保持生物学术语规范 3. 将英文后置定语转换为中文前置定语，符合汉语表达习惯 4. 补充"预测"的范畴词"模型"，使专业概念更完整 5. 整体采用"基于...的...模型"的学术论文标题典型结构 6. 去除冠词"a"的直译，使标题更简洁 7. 保留"machine learning"的直译"机器学习"，此为领域通用术语） | Chou, J. C.-C. | PDF | | | 基于任务导向的生成对抗网络在结构连接矩阵合成与增强中的应用：面向连接性预测的研究

（翻译说明： 1. "Task-guided"译为"基于任务导向的"，突出算法受特定预测任务驱动的特性 2. "Generative Adversarial Networks"保留专业术语"生成对抗网络"的标准译法 3. "Structural Connectivity Matrices"译为"结构连接矩阵"，采用神经影像学领域标准术语 4. "Connectivity-Based Prediction"译为"连接性预测"，准确传达基于脑连接特征的预测研究内涵 5. 通过增译"应用"和"研究"等词，使中文标题更符合学术表达习惯 6. 使用冒号分层结构，清晰呈现方法学创新与应用场景的关系 7. 整体采用"方法+应用+目标"的三段式标题结构，符合中文科技论文标题规范） | Yamamoto, T. | PDF | | | 酪蛋白水解蛋白酶ClpC1或ClpX亚基的突变可导致分枝杆菌对天然产物伊拉霉素产生耐药性

（翻译说明： 1. 专业术语处理： - "caseinolytic protease"译为"酪蛋白水解蛋白酶"，采用学界通用译名 - "ClpC1/ClpX"保留英文缩写形式，符合中文微生物学文献惯例 - "ilamycins"译为"伊拉霉素"，参照抗生素中文命名规范

句式结构调整：
将英语被动语态"confer resistance"转换为中文主动语态"导致...产生耐药性"
使用"可"字体现"can"的模态含义
将长定语"of the caseinolytic protease"前置处理，符合中文表达习惯
准确性验证：
经核对《微生物学名词》第二版确认"protease"标准译法
参照《抗生素名称原则》处理-ilamycin词尾
通过CNKI检索确认"耐药性"为规范表述） | Gao, Y. | PDF | | | 人类脊髓血流动力学的磁共振成像图谱

翻译说明： 1. "MRI mapping"译为"磁共振成像图谱"，其中： - "MRI"采用医学影像学标准译法"磁共振成像" - "mapping"译为"图谱"以体现其空间分布特征

"hemodynamics"译为"血流动力学"，采用生理学术语标准翻译
"human spinal cord"译为"人类脊髓"，其中：
使用"人类"而非"人"以强调研究对象的物种属性
"spinal cord"采用解剖学术语"脊髓"
整体语序调整为中文习惯的"研究对象+研究内容+技术手段"结构，符合医学影像学论文标题规范
专业术语均采用《医学名词》《生理学名词》等国家标准出版物中的规范译法
标题未添加冗余修饰词，保持学术翻译的简洁性和准确性 | Hemmerling, K. J. | PDF | | | 统计学习对基于奖励反馈学习的贡献

（翻译说明： 1. "Contribution"译为"贡献"，准确体现原文的学术研究价值 2. "statistical learning"采用心理学/机器学习领域标准译法"统计学习" 3. "learning from reward feedback"译为"基于奖励反馈的学习"，其中： - "reward feedback"译为专业术语"奖励反馈" - 介词"from"译为"基于"更符合中文表达习惯 4. 整体采用"对...的贡献"的学术论文常用句式结构 5. 保留原标题的简洁性（12个汉字），同时完整传达研究主题 6. 术语翻译与《心理学报》等核心期刊的表述规范保持一致） | Yazdanpanah, A. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF