2025-06-16 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
EMLoC：基于模拟器的内存高效微调与LoRA校正

（翻译说明： 1. 保留首字母缩略词"EMLoC"和"LoRA"的英文形式，符合技术术语惯例 2. "Emulator-based"译为"基于模拟器的"，准确传达技术实现方式 3. "Memory-efficient"译为"内存高效"，符合计算机领域术语规范 4. "Fine-tuning"译为"微调"，采用深度学习领域标准译法 5. "Correction"译为"校正"，准确表达算法改进的核心功能 6. 整体采用"主标题：副标题"的中文学术论文标题常见结构 7. 保持技术表述的精确性，同时符合中文表达习惯） | Hsi-Che Lin | PDF | 开源基础模型近年来得到快速普及和发展，使其在多样化领域展现出强大的通用能力。然而，由于微调过程需要远超推理阶段的内存开销，针对特定领域或个性化任务的大型基础模型微调对多数用户而言仍存在难以逾越的成本障碍。本文提出EMLoc框架——一种基于模拟器的内存高效微调方案，通过LoRA修正技术实现仅需推理级别内存预算的模型微调。该框架首先利用下游小规模校准数据集，采用激活感知的奇异值分解（SVD）技术构建任务特定的轻量化模拟器，随后在模拟器上执行基于LoRA的微调。针对原始模型与压缩模拟器间的表征偏差问题，我们创新性地提出补偿算法来修正微调后的LoRA模块，使其能够无缝集成至原始模型进行推理。EMLoc支持灵活压缩比和标准训练流程，可适配多样化应用场景。大量实验表明，该方法在跨数据集、跨模态场景下均优于现有基线方案。尤为突出的是，在不采用量化技术的前提下，EMLoc首次实现在24GB消费级GPU上对380亿参数模型进行微调，为个体用户提供了切实可行的高效模型适配方案。 | | 代码重构：大型语言模型对编程的影响

（翻译说明： 1. "code_transformed"译为"代码重构"既保留了技术准确性，又符合中文表达习惯 2. "Large Language Models"采用学界通用译法"大型语言模型"未作简化 3. 主副标题结构转换为中文惯用的冒号分隔形式 4. 添加"对...的影响"的显性表达，使研究主题更清晰 5. 整体保持学术文本的严谨性，同时确保中文可读性 6. 术语翻译与《人工智能标准化白皮书》等权威文献保持一致） | Yuliang Xu | PDF | 编码始终是人类与机器交互的最基本模式之一。随着大语言模型（LLMs）的快速发展，代码生成能力已开始显著重塑编程实践。这一发展引发了一个核心问题：LLMs是否改变了代码风格？这种改变又该如何界定？本文通过开创性研究，首次系统考察了LLMs对代码风格的影响，重点聚焦命名规范、复杂度、可维护性及相似性等维度。通过分析2020至2025年间arXiv论文关联的19,000余个GitHub仓库代码，我们发现了与LLM生成代码特征相吻合的编码风格演变趋势。例如Python代码中snake_case变量命名比例从2023年第一季度的47%上升至2025年第一季度的51%。此外，我们通过解析LLMs的推理过程，探究了其解决算法问题的路径。鉴于LLMs的多样性、使用场景差异等因素，精确估算LLMs生成或辅助代码的比例存在极大困难甚至不可能。我们的实验结果首次提供了LLMs影响现实世界编程风格的大规模实证依据。 | | 运用策略博弈追踪大语言模型推理过程：一种面向规划、修正与资源受限决策的框架

（翻译说明： 1. 专业术语处理："LLM"译为行业通用简称"大语言模型"，"Strategic Games"译为"策略博弈"符合博弈论术语规范 2. 结构优化：将原文名词短语转换为动词结构，更符合中文标题表达习惯 3. 逻辑显化：通过冒号分层明确框架属性，使用"面向"突出研究导向性 4. 术语一致性："Resource-Constrained Decision Making"译为"资源受限决策"保持约束性决策研究的术语标准 5. 学术风格：保留"框架"等学术用语，整体符合计算机领域论文标题的简洁严谨特征） | Xiaopeng Yuan | PDF | 大型语言模型（LLMs）正日益应用于需要复杂推理的任务中。当前多数基准测试仅关注最终结果，却忽视了中间推理步骤——例如在资源约束条件下的规划、修正和决策过程。我们认为，测量这些内部认知过程对于理解模型行为及提升可靠性至关重要。为此，我们提出将策略性游戏作为天然评估环境：这类封闭式、基于规则的系统具有明确状态、有限资源和自动反馈机制。我们构建了一个三维评估框架，从规划能力、修正能力和资源约束决策能力三个核心维度对LLMs进行系统评测。

为实现量化分析，我们定义了超越胜率的创新指标：包括过度修正风险率（81.6%）、修正成功率（78.6%）、改进斜率（0.041）和超预算比率。在对12个主流模型进行的4320轮对抗测试中，ChatGPT-o3-mini以74.7%的胜率获得最高综合评分，其修正成功率78.6%与改进斜率0.041表现突出。相比之下，Qwen-Plus虽具有81.6%的过度修正风险率，却仅取得25.6%的胜率——主要归因于资源过度消耗。我们还发现过度修正风险率与修正成功率呈负相关（Pearson r = -0.51, p = 0.093），表明频繁修改未必能提升最终效果。

本研究证实：评估大型语言模型不仅要关注其决策结果，更需解析其决策形成机制。这种过程导向的评估方法为模型行为理解提供了新的研究范式，特别在资源受限场景下的动态调整能力方面具有重要启示意义。 | | Affogato：基于大规模自动化数据生成的开源词汇可供性基础学习

（翻译说明： 1. "Affogato"作为专有名词保留不译，符合机器学习领域对算法名称的处理惯例 2. "Open-Vocabulary"译为"开源词汇"，准确传达开放词汇表的核心概念 3. "Affordance Grounding"译为"可供性基础"，采用人机交互领域的专业术语 4. "Automated Data Generation at Scale"译为"大规模自动化数据生成"，其中"at Scale"通过"大规模"准确体现 5. 整体采用"基于..."的学术论文标题句式，符合中文计算机领域论文命名规范 6. 保留原文的层级关系："学习方法"作为核心，"数据生成"作为实现手段） | Junha Lee | PDF | Affordance grounding-localizing object regions based on natural language descriptions of interaction [翻译失败] | | 《舞蹈重构：舞者与人工智能的实时音乐共创》

（翻译说明： 1. "Reimagining"译为"重构"既保留"重新构想"的本义，又符合艺术领域的专业术语习惯 2. "Real-time"采用行业通用译法"实时"，确保技术准确性 3. "Co-creation"译为"共创"精准对应人机协作概念，比"共同创作"更简洁 4. 主副标题结构通过冒号分隔，完全保留原文的学术论文标题格式 5. 使用书名号符合中文出版物标题规范 6. "AI"统一译为"人工智能"而非缩写，确保学术文本的严谨性） | Olga Vechtomova | PDF | 传统舞蹈表演遵循单向关系模式，即动作对音乐作出响应。尽管人工智能已在多个创意领域取得进展，但其在舞蹈中的应用主要集中于从音乐输入生成编舞。我们开发了一个创新系统，使舞者能够通过肢体动作动态塑造音乐环境。该多模态架构通过智能组合预录音乐片段以响应舞蹈动作，从而构建出连贯的音乐作品，建立起舞者同时作为表演者与作曲者的双向创作伙伴关系。通过对表演数据的相关性分析，我们揭示了动作特性与音频特征之间涌现的交互模式。这种方法重新定义了人工智能在表演艺术中的角色——作为响应式协作伙伴，不仅为专业舞蹈表演，更为广泛人群的即兴艺术表达开辟了新的可能性。

（翻译说明： 1. 专业术语处理："multi-modal architecture"译为"多模态架构"，"correlation analysis"译为"相关性分析"，保持学术严谨性 2. 句式重构：将英语长句拆分为符合中文表达习惯的短句，如原文最后一句分译为两个层次 3. 概念对等："emergent communication patterns"译为"涌现的交互模式"，准确传达复杂系统特性 4. 文化适配："responsive collaborator"译为"响应式协作伙伴"，既保留技术含义又符合艺术语境 5. 被动语态转换：将"where dancers function as..."主动化为"舞者同时作为..."，符合中文表达习惯） | | SIMSHIFT：面向神经代理模型分布迁移适应性的基准测试

（翻译说明： 1. 专业术语处理： - "Neural Surrogates"译为"神经代理模型"，准确体现其作为替代模型的本质 - "Distribution Shifts"译为"分布迁移"，符合机器学习领域对数据分布变化的专业表述

技术内涵传达：
"Benchmark"译为"基准测试"，强调其评估标准的属性
"Adapting"译为"适应性"，突出模型适应能力的研究重点
标题结构优化：
使用冒号保持原标题的层次结构
"面向..."的句式更符合中文论文标题的表达习惯
通过增译"模型"使专业概念更完整
学术风格保持：
避免口语化表达
术语翻译与国内计算机学报等核心期刊保持一致
整体表述严谨规范，符合学术论文标题特征） | Paul Setinek | PDF | Neural surrogates for Partial Differential Equations (PDEs) often suffer significant performance deg [翻译失败] | | crossMoDA挑战赛：2021至2023年前庭神经鞘瘤及耳蜗分割跨模态域适应技术演进

（翻译说明： 1. 专业术语处理： - "Vestibular Schwannoma"译为"前庭神经鞘瘤"（医学标准术语） - "Cochlea"译为"耳蜗"（解剖学规范译名） - "Domain Adaptation"译为"域适应"（计算机视觉领域通用译法）

技术表述优化：
"Cross-Modality"译为"跨模态"（医学影像分析领域标准表述）
"Segmentation"保留"分割"译法（图像处理专业术语）
结构重组：
将时间状语"from 2021 to 2023"调整为中文惯用的"2021至2023年"前置表达
使用"技术演进"替代直译"evolution"，更符合中文科技文献表述习惯
学术规范：
挑战赛名称"crossMoDA"保留英文原名+中文说明的学术惯例
采用"及"连接两个解剖结构，符合医学文献的严谨表述要求） | Navodini Wijethilake | PDF | 跨模态域适应挑战赛（crossMoDA）系列始于2021年，与国际医学图像计算和计算机辅助干预会议（MICCAI）同期举办，专注于无监督跨模态分割研究——从对比增强T1（ceT1）磁共振成像学习并迁移至T2序列。该任务作为领域偏移的极端案例被设计成具有示范意义的基准测试。从临床应用视角看，其目标是通过自动化T2扫描中的前庭神经鞘瘤（VS）与耳蜗分割，实现更具成本效益的VS诊疗管理。随着时间推移，挑战赛目标持续演进以强化临床相关性：从2021年使用单机构数据和基础分割，到2022年引入多机构数据和Koos分级，直至2023年整合异构常规数据及肿瘤内听道/外听道成分的精细分割。本文系统报告了2022与2023两届赛事的研究发现，并对历年挑战赛发展进行回溯性分析。连续参赛成果表明：随着数据集规模扩大，异常值数量呈下降趋势——这一现象尤为值得关注，因为数据采集协议的多样性在同期持续增加。2023年优胜方案在2021-2022年测试数据上的异常值减少，证明增强数据异质性反而能提升对同质数据的分割性能。但2023年耳蜗Dice评分有所下降，可能源于肿瘤亚区标注新增的复杂度影响了整体分割效果。虽然VS分割距临床实用标准仍有提升空间，但性能增长趋于平缓的现状提示：设计更具挑战性的跨模态任务或将成为未来基准测试的更优选择。 | | 升级还是切换：物联网AI代理是否需要全新的注册架构？

（翻译说明： 1. 标题采用疑问句式保留原文设问语气 2. "Registry Architecture"译为"注册架构"符合计算机领域术语规范 3. "Internet of AI Agents"译为"物联网AI代理"既体现IoT技术特征又准确传达智能体概念 4. 冒号前使用"升级/切换"的对比结构，与原文"Upgrade/Switch"形成精准对应 5. 整体句式结构遵循中文标题简洁特征，同时完整保留学术论文标题的技术严谨性） | Ramesh Raskar | PDF | 新兴的AI智能体互联网对现有为人类尺度反应式交互设计的网络基础设施提出了挑战。与传统网络资源不同，自主AI智能体具有主动行为发起、持久状态维持、子智能体孵化及对等协商等特征，这要求基础设施实现毫秒级服务发现、即时凭证撤销以及超越现有DNS/PKI体系的密码学行为验证机制。本文系统分析了是升级现有基础设施还是为自主智能体构建专用注册架构这一关键抉择，揭示出三大核心失效点：DNS传播延迟（24-48小时 vs 所需毫秒级响应）、无法扩展至万亿级实体的证书撤销机制，以及IPv4/IPv6寻址方案对智能体规模路由的适配不足。我们评估了三种技术路径：(1)渐进式升级方案，(2)架构切换方案，(3)混合注册体系。通过类比拨号上网到宽带网络的转型历程，研究发现智能体的需求本质上是质的变革而非量的改进。虽然升级方案具有兼容性和快速部署优势，但新建架构能提供更优性能却需更长采纳周期。分析表明混合方案将成为主流趋势——关键智能体采用中心化注册，而垂直应用场景则采用联邦化网状架构。 | | 基于预测与上下文建模的深度神经网络检查点高效压缩方法

（翻译说明： 1. 专业术语处理： - "Deep Neural Network"译为"深度神经网络"，保留专业缩写"DNN" - "Checkpoints"译为"检查点"，符合计算机领域术语 - "Context Modeling"译为"上下文建模"，采用自然语言处理领域标准译法

技术概念传达：
"Prediction"译为"预测"，准确表达算法中的预测机制
"Efficient Compression"译为"高效压缩"，突出方法的核心优势
句式结构调整：
将英文被动语态转换为中文主动表述
采用"基于...的...方法"的学术论文标题常用结构
保持原标题的精确性和简洁性
领域适配性：译文符合计算机科学/人工智能领域的术语使用规范，与IEEE/ACM等国际期刊的中文标题风格一致） | Yuriy Kim | PDF | 本文致力于对神经网络训练过程中不同阶段获得的权重及优化器状态（称为检查点）进行高效压缩。首先，我们提出一种基于预测的压缩方法，该方法利用先前保存的检查点数值作为算术编码的上下文建模依据。其次，为提升压缩性能，我们还提出对检查点数值实施剪枝与量化处理。实验结果表明，该方法能显著降低比特体积，同时通过还原的检查点可实现近乎无损的训练恢复，在保持模型性能的前提下，使其适用于存储受限的环境。

（翻译说明： 1. 专业术语处理："checkpoints"统一译为"检查点"，"pruning and quantization"译为"剪枝与量化"，"arithmetic coding"译为"算术编码"等 2. 被动语态转换：将"are used for"等被动结构转换为"利用...作为"的主动表达 3. 长句拆分：将原文复合句拆分为符合中文表达习惯的短句结构 4. 概念准确性："near-lossless training recovery"译为"近乎无损的训练恢复"既保留技术含义又符合中文表达 5. 学术风格保持：使用"致力于"、"提出"、"结果表明"等学术论文标准表述） | | 面向推荐系统的基础模型生成式表征学习研究

（翻译说明： 1. "Generative Representational Learning"译为"生成式表征学习"，准确对应生成式AI与表征学习的专业术语 2. "Foundation Models"采用学界通用译法"基础模型"，特指大规模预训练模型 3. 通过增译"研究"二字符合中文论文标题习惯 4. "for Recommendation"处理为"面向推荐系统"的介词结构，比直译"用于推荐"更符合学术语境 5. 整体采用"定语+中心词"的中文标题结构，保持学术严谨性的同时确保可读性） | Zheli Zhou | PDF | Developing a single foundation model with the capability to excel across diverse tasks has been a lo [翻译失败] |

bioRxiv

标题	作者	PDF链接	摘要
复杂性状精细定位方法：针对相关个体样本的关键适应性调整

（翻译说明： 1. 专业术语处理： - "Fine-mapping"译为"精细定位"，符合遗传学领域标准译法 - "complex traits"译为"复杂性状"，保留遗传流行病学术语准确性 - "related individuals"译为"相关个体"，准确表达遗传关联样本特征

句式结构调整：
将原文名词短语转换为中文更常见的动宾结构"针对...的调整"
使用冒号替代原介词结构，符合中文标题层级表达习惯
补充说明：
增加"关键"二字以准确传达"essential"的程度修饰
"adaptations"译为"适应性调整"既保留方法学改进含义，又体现对样本特征的针对性处理） | Wang, J. | PDF | | | 果蝇视觉引导转向行为的整合模型

（翻译说明： 1. "Integrative models"译为"整合模型"，体现多系统协同作用的综合建模理念 2. "visually guided"译为"视觉引导"，准确保持视觉传感与行为控制的因果关系 3. "steering"译为"转向行为"，突出飞行控制中的主动决策特征 4. "Drosophila"采用规范学术译名"果蝇"，符合生物学命名惯例 5. 整体采用"定语前置+核心词"的中文表达结构，同时通过"行为"二字明确研究对象的生物运动特性） | Canelo, A. | PDF | | | 采用三谐波显微成像技术实现植物根系与微生物的无标记结构成像

（翻译说明： 1. "Label-free"译为"无标记"，准确体现无需荧光标记的技术特征 2. "structural imaging"译为"结构成像"，保留专业术语规范 3. "third-harmonic generation microscopy"采用专业译名"三谐波显微成像技术"，其中： - "third-harmonic"译为"三谐波"符合光学领域术语 - 补充"技术"二字符合中文科技文献表达习惯 4. 调整英文语序为中文表达逻辑，将核心检测对象"植物根系与微生物"前置 5. 使用"实现...成像"的动宾结构，比直译"imaging of"更符合中文科技文本特征 6. 整体采用14字标题句式，符合中文期刊论文标题长度规范） | Pan, D. | PDF | | | WAVE复合体在负膜曲率处形成线性阵列以指导片状伪足形成。

（翻译说明： 1. 专业术语处理： - "WAVE complex" 保留英文缩写并补充中文全称"WAVE复合体"（细胞骨架调控蛋白复合体） - "negative membrane curvature" 译为"负膜曲率"（生物物理学标准术语） - "lamellipodia" 译为"片状伪足"（细胞运动学标准译名）

句式结构：
将原文的主动语态"instruct"转换为中文常用的"以指导"结构
保持"forms...to instruct..."的因果逻辑关系，用"在...处...以..."的句式体现
准确性保障：
"linear arrays"译为"线性阵列"而非字面的"线性排列"，更符合生物大分子组装特征
保留"负曲率"的数学表述，未简化为"凹陷"等非专业表述
中文表达优化：
添加连接词"以"使句子更符合中文论文表达习惯
控制句子长度在25字以内，符合中文科技文献平均句长） | Wu, M. | PDF | | | 一种古菌CBASS系统可在不杀死宿主细胞的情况下清除病毒

（翻译说明： 1. "archaeal"译为"古菌"，准确对应微生物分类学专业术语 2. "CBASS system"保留英文缩写，符合国内学界对新型免疫系统的命名惯例 3. "eliminates viruses"译为"清除病毒"比"消灭"更符合免疫学语境 4. "without killing the host cells"采用"在不...的情况下"的句式结构，完整保留原意 5. 整体采用主动语态，符合中文科技文献表达习惯 6. 专业术语参照《微生物学名词》《病毒学名词》等规范译法） | Choudhary, D. K. | PDF | | | 《Shank3B-/-小鼠出生后早期前扣带回皮层PV阳性中间神经元功能异常》

说明： 1. 专业术语处理： - "ACC" 采用神经解剖学标准译法"前扣带回皮层"（全称），首次出现使用全称 - "PV interneurons" 译为"PV阳性中间神经元"，其中： * "PV" 保留英文缩写（Parvalbumin在神经科学领域通用缩写） * "interneurons" 采用神经科学规范译名"中间神经元" - "Shank3B-/-" 保留基因命名法原格式，符合遗传学文献惯例

句式重构：
将原文名词短语转换为中文常见的"研究对象+表症"结构
增加"功能异常"使病理表型更明确（dysfunction的语境引申）
使用破折号连接基因型与表型，符合中文分子病理学表述习惯
补充说明：
在神经发育领域，"postnatal"特指出生后早期（P0-P21），故译为"出生后早期"而非简单直译"产后"
标题采用学术论文常用的偏正结构，突出表型与基因型的关联性 | Shih, Y.-C. | PDF | | | 在独立进化的野生洞穴鱼种群中普遍存在睡眠缺失现象

翻译说明： 1. "Widespread loss"译为"普遍存在...现象"，既准确表达了原意，又符合中文表达习惯 2. "independently evolved populations"译为"独立进化的种群"，保留了进化生物学术语 3. "wild-caught cavefish"译为"野生洞穴鱼"，其中： - "wild-caught"译为"野生"而非字面的"野外捕获"，更符合生物学表述 - "cavefish"采用专业术语"洞穴鱼"而非直译"洞穴鱼类" 4. 整体采用"现象"作为中心词，使句子结构更完整，符合中文科技论文表达规范 5. 保留了原文的精确性和学术性，同时确保中文流畅自然 | North, O. | PDF | | | 研究表明，肺炎球菌的体外生长动力学主要受其荚膜结构和遗传背景的影响，而非特定单个基因位点。这一发现强调了细菌整体基因组特征在生长速率调控中的重要性，超越了单一基因变异的作用。 | Chaguza, C. | PDF | | | 乳杆菌中封装增强型基因开关

（翻译说明： 1. "Encapsulation-enhanced"译为"封装增强型"，准确传达了通过封装技术提升性能的含义 2. "genetic switches"采用专业术语"基因开关"，符合合成生物学命名规范 3. "lactobacilli"译为"乳杆菌"，采用微生物学标准译名 4. 整体采用"特性+主体+适用范围"的中文科技论文标题结构 5. 保留专业术语的准确性同时确保中文表达符合学术规范） | Blanch-Asensio, M. | PDF | | | 暴露于杀鳗剂3-三氟甲基-4-硝基苯酚时，体型较大的海七鳃鳗（Petromyzon marinus）幼体具有更长的存活时间

（翻译说明： 1. 专业术语处理： - "larval sea lamprey"译为"海七鳃鳗幼体"，采用学界通用译名 - "Petromyzon marinus"保留拉丁学名并补充中文名"海七鳃鳗" - "lampricide"译为"杀鳗剂"，准确体现其灭杀七鳃鳗的特性 - "3-trifluoromethyl-4-nitrophenol"采用标准化学命名法译为"3-三氟甲基-4-硝基苯酚"

句式重构：将原文"have longer survival times"被动式转化为中文主动式表达"具有更长的存活时间"，更符合中文表达习惯
逻辑关系显化：通过添加"时"字明确时间关系，使用"暴露于...时"的句式准确传达实验条件
语序调整：按照中文"条件-主体-结果"的逻辑顺序重组句子，将实验条件前置，使表述更清晰） | Nalesnik, A. M. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF