arxiv 2025-06-16
| 标题 | 作者 | PDF链接 | 摘要 |
|---|---|---|---|
| EMLoC:基于模拟器的内存高效微调与LoRA校正 |
(翻译说明: 1. 保留首字母缩略词"EMLoC"和"LoRA"的英文形式,符合技术术语惯例 2. "Emulator-based"译为"基于模拟器的",准确传达技术实现方式 3. "Memory-efficient"译为"内存高效",符合计算机领域术语规范 4. "Fine-tuning"译为"微调",采用深度学习领域标准译法 5. "Correction"译为"校正",准确表达算法改进的核心功能 6. 整体采用"主标题:副标题"的中文学术论文标题常见结构 7. 保持技术表述的精确性,同时符合中文表达习惯) | Hsi-Che Lin | PDF | 开源基础模型近年来得到快速普及和发展,使其在多样化领域展现出强大的通用能力。然而,由于微调过程需要远超推理阶段的内存开销,针对特定领域或个性化任务的大型基础模型微调对多数用户而言仍存在难以逾越的成本障碍。本文提出EMLoc框架——一种基于模拟器的内存高效微调方案,通过LoRA修正技术实现仅需推理级别内存预算的模型微调。该框架首先利用下游小规模校准数据集,采用激活感知的奇异值分解(SVD)技术构建任务特定的轻量化模拟器,随后在模拟器上执行基于LoRA的微调。针对原始模型与压缩模拟器间的表征偏差问题,我们创新性地提出补偿算法来修正微调后的LoRA模块,使其能够无缝集成至原始模型进行推理。EMLoc支持灵活压缩比和标准训练流程,可适配多样化应用场景。大量实验表明,该方法在跨数据集、跨模态场景下均优于现有基线方案。尤为突出的是,在不采用量化技术的前提下,EMLoc首次实现在24GB消费级GPU上对380亿参数模型进行微调,为个体用户提供了切实可行的高效模型适配方案。 | | 代码重构:大型语言模型对编程的影响
(翻译说明: 1. "code_transformed"译为"代码重构"既保留了技术准确性,又符合中文表达习惯 2. "Large Language Models"采用学界通用译法"大型语言模型"未作简化 3. 主副标题结构转换为中文惯用的冒号分隔形式 4. 添加"对...的影响"的显性表达,使研究主题更清晰 5. 整体保持学术文本的严谨性,同时确保中文可读性 6. 术语翻译与《人工智能标准化白皮书》等权威文献保持一致) | Yuliang Xu | PDF | 编码始终是人类与机器交互的最基本模式之一。随着大语言模型(LLMs)的快速发展,代码生成能力已开始显著重塑编程实践。这一发展引发了一个核心问题:LLMs是否改变了代码风格?这种改变又该如何界定?本文通过开创性研究,首次系统考察了LLMs对代码风格的影响,重点聚焦命名规范、复杂度、可维护性及相似性等维度。通过分析2020至2025年间arXiv论文关联的19,000余个GitHub仓库代码,我们发现了与LLM生成代码特征相吻合的编码风格演变趋势。例如Python代码中snake_case变量命名比例从2023年第一季度的47%上升至2025年第一季度的51%。此外,我们通过解析LLMs的推理过程,探究了其解决算法问题的路径。鉴于LLMs的多样性、使用场景差异等因素,精确估算LLMs生成或辅助代码的比例存在极大困难甚至不可能。我们的实验结果首次提供了LLMs影响现实世界编程风格的大规模实证依据。 | | 运用策略博弈追踪大语言模型推理过程:一种面向规划、修正与资源受限决策的框架
(翻译说明: 1. 专业术语处理:"LLM"译为行业通用简称"大语言模型","Strategic Games"译为"策略博弈"符合博弈论术语规范 2. 结构优化:将原文名词短语转换为动词结构,更符合中文标题表达习惯 3. 逻辑显化:通过冒号分层明确框架属性,使用"面向"突出研究导向性 4. 术语一致性:"Resource-Constrained Decision Making"译为"资源受限决策"保持约束性决策研究的术语标准 5. 学术风格:保留"框架"等学术用语,整体符合计算机领域论文标题的简洁严谨特征) | Xiaopeng Yuan | PDF | 大型语言模型(LLMs)正日益应用于需要复杂推理的任务中。当前多数基准测试仅关注最终结果,却忽视了中间推理步骤——例如在资源约束条件下的规划、修正和决策过程。我们认为,测量这些内部认知过程对于理解模型行为及提升可靠性至关重要。为此,我们提出将策略性游戏作为天然评估环境:这类封闭式、基于规则的系统具有明确状态、有限资源和自动反馈机制。我们构建了一个三维评估框架,从规划能力、修正能力和资源约束决策能力三个核心维度对LLMs进行系统评测。
为实现量化分析,我们定义了超越胜率的创新指标:包括过度修正风险率(81.6%)、修正成功率(78.6%)、改进斜率(0.041)和超预算比率。在对12个主流模型进行的4320轮对抗测试中,ChatGPT-o3-mini以74.7%的胜率获得最高综合评分,其修正成功率78.6%与改进斜率0.041表现突出。相比之下,Qwen-Plus虽具有81.6%的过度修正风险率,却仅取得25.6%的胜率——主要归因于资源过度消耗。我们还发现过度修正风险率与修正成功率呈负相关(Pearson r = -0.51, p = 0.093),表明频繁修改未必能提升最终效果。
本研究证实:评估大型语言模型不仅要关注其决策结果,更需解析其决策形成机制。这种过程导向的评估方法为模型行为理解提供了新的研究范式,特别在资源受限场景下的动态调整能力方面具有重要启示意义。 | | Affogato:基于大规模自动化数据生成的开源词汇可供性基础学习
(翻译说明: 1. "Affogato"作为专有名词保留不译,符合机器学习领域对算法名称的处理惯例 2. "Open-Vocabulary"译为"开源词汇",准确传达开放词汇表的核心概念 3. "Affordance Grounding"译为"可供性基础",采用人机交互领域的专业术语 4. "Automated Data Generation at Scale"译为"大规模自动化数据生成",其中"at Scale"通过"大规模"准确体现 5. 整体采用"基于..."的学术论文标题句式,符合中文计算机领域论文命名规范 6. 保留原文的层级关系:"学习方法"作为核心,"数据生成"作为实现手段) | Junha Lee | PDF | Affordance grounding-localizing object regions based on natural language descriptions of interaction [翻译失败] | | 《舞蹈重构:舞者与人工智能的实时音乐共创》
(翻译说明: 1. "Reimagining"译为"重构"既保留"重新构想"的本义,又符合艺术领域的专业术语习惯 2. "Real-time"采用行业通用译法"实时",确保技术准确性 3. "Co-creation"译为"共创"精准对应人机协作概念,比"共同创作"更简洁 4. 主副标题结构通过冒号分隔,完全保留原文的学术论文标题格式 5. 使用书名号符合中文出版物标题规范 6. "AI"统一译为"人工智能"而非缩写,确保学术文本的严谨性) | Olga Vechtomova | PDF | 传统舞蹈表演遵循单向关系模式,即动作对音乐作出响应。尽管人工智能已在多个创意领域取得进展,但其在舞蹈中的应用主要集中于从音乐输入生成编舞。我们开发了一个创新系统,使舞者能够通过肢体动作动态塑造音乐环境。该多模态架构通过智能组合预录音乐片段以响应舞蹈动作,从而构建出连贯的音乐作品,建立起舞者同时作为表演者与作曲者的双向创作伙伴关系。通过对表演数据的相关性分析,我们揭示了动作特性与音频特征之间涌现的交互模式。这种方法重新定义了人工智能在表演艺术中的角色——作为响应式协作伙伴,不仅为专业舞蹈表演,更为广泛人群的即兴艺术表达开辟了新的可能性。
(翻译说明: 1. 专业术语处理:"multi-modal architecture"译为"多模态架构","correlation analysis"译为"相关性分析",保持学术严谨性 2. 句式重构:将英语长句拆分为符合中文表达习惯的短句,如原文最后一句分译为两个层次 3. 概念对等:"emergent communication patterns"译为"涌现的交互模式",准确传达复杂系统特性 4. 文化适配:"responsive collaborator"译为"响应式协作伙伴",既保留技术含义又符合艺术语境 5. 被动语态转换:将"where dancers function as..."主动化为"舞者同时作为...",符合中文表达习惯) | | SIMSHIFT:面向神经代理模型分布迁移适应性的基准测试
(翻译说明: 1. 专业术语处理: - "Neural Surrogates"译为"神经代理模型",准确体现其作为替代模型的本质 - "Distribution Shifts"译为"分布迁移",符合机器学习领域对数据分布变化的专业表述
- 技术内涵传达:
- "Benchmark"译为"基准测试",强调其评估标准的属性
-
"Adapting"译为"适应性",突出模型适应能力的研究重点
-
标题结构优化:
- 使用冒号保持原标题的层次结构
- "面向..."的句式更符合中文论文标题的表达习惯
-
通过增译"模型"使专业概念更完整
-
学术风格保持:
- 避免口语化表达
- 术语翻译与国内计算机学报等核心期刊保持一致
- 整体表述严谨规范,符合学术论文标题特征) | Paul Setinek | PDF | Neural surrogates for Partial Differential Equations (PDEs) often suffer significant performance deg [翻译失败] | | crossMoDA挑战赛:2021至2023年前庭神经鞘瘤及耳蜗分割跨模态域适应技术演进
(翻译说明: 1. 专业术语处理: - "Vestibular Schwannoma"译为"前庭神经鞘瘤"(医学标准术语) - "Cochlea"译为"耳蜗"(解剖学规范译名) - "Domain Adaptation"译为"域适应"(计算机视觉领域通用译法)
- 技术表述优化:
- "Cross-Modality"译为"跨模态"(医学影像分析领域标准表述)
-
"Segmentation"保留"分割"译法(图像处理专业术语)
-
结构重组:
- 将时间状语"from 2021 to 2023"调整为中文惯用的"2021至2023年"前置表达
-
使用"技术演进"替代直译"evolution",更符合中文科技文献表述习惯
-
学术规范:
- 挑战赛名称"crossMoDA"保留英文原名+中文说明的学术惯例
- 采用"及"连接两个解剖结构,符合医学文献的严谨表述要求) | Navodini Wijethilake | PDF | 跨模态域适应挑战赛(crossMoDA)系列始于2021年,与国际医学图像计算和计算机辅助干预会议(MICCAI)同期举办,专注于无监督跨模态分割研究——从对比增强T1(ceT1)磁共振成像学习并迁移至T2序列。该任务作为领域偏移的极端案例被设计成具有示范意义的基准测试。从临床应用视角看,其目标是通过自动化T2扫描中的前庭神经鞘瘤(VS)与耳蜗分割,实现更具成本效益的VS诊疗管理。随着时间推移,挑战赛目标持续演进以强化临床相关性:从2021年使用单机构数据和基础分割,到2022年引入多机构数据和Koos分级,直至2023年整合异构常规数据及肿瘤内听道/外听道成分的精细分割。本文系统报告了2022与2023两届赛事的研究发现,并对历年挑战赛发展进行回溯性分析。连续参赛成果表明:随着数据集规模扩大,异常值数量呈下降趋势——这一现象尤为值得关注,因为数据采集协议的多样性在同期持续增加。2023年优胜方案在2021-2022年测试数据上的异常值减少,证明增强数据异质性反而能提升对同质数据的分割性能。但2023年耳蜗Dice评分有所下降,可能源于肿瘤亚区标注新增的复杂度影响了整体分割效果。虽然VS分割距临床实用标准仍有提升空间,但性能增长趋于平缓的现状提示:设计更具挑战性的跨模态任务或将成为未来基准测试的更优选择。 | | 升级还是切换:物联网AI代理是否需要全新的注册架构?
(翻译说明: 1. 标题采用疑问句式保留原文设问语气 2. "Registry Architecture"译为"注册架构"符合计算机领域术语规范 3. "Internet of AI Agents"译为"物联网AI代理"既体现IoT技术特征又准确传达智能体概念 4. 冒号前使用"升级/切换"的对比结构,与原文"Upgrade/Switch"形成精准对应 5. 整体句式结构遵循中文标题简洁特征,同时完整保留学术论文标题的技术严谨性) | Ramesh Raskar | PDF | 新兴的AI智能体互联网对现有为人类尺度反应式交互设计的网络基础设施提出了挑战。与传统网络资源不同,自主AI智能体具有主动行为发起、持久状态维持、子智能体孵化及对等协商等特征,这要求基础设施实现毫秒级服务发现、即时凭证撤销以及超越现有DNS/PKI体系的密码学行为验证机制。本文系统分析了是升级现有基础设施还是为自主智能体构建专用注册架构这一关键抉择,揭示出三大核心失效点:DNS传播延迟(24-48小时 vs 所需毫秒级响应)、无法扩展至万亿级实体的证书撤销机制,以及IPv4/IPv6寻址方案对智能体规模路由的适配不足。我们评估了三种技术路径:(1)渐进式升级方案,(2)架构切换方案,(3)混合注册体系。通过类比拨号上网到宽带网络的转型历程,研究发现智能体的需求本质上是质的变革而非量的改进。虽然升级方案具有兼容性和快速部署优势,但新建架构能提供更优性能却需更长采纳周期。分析表明混合方案将成为主流趋势——关键智能体采用中心化注册,而垂直应用场景则采用联邦化网状架构。 | | 基于预测与上下文建模的深度神经网络检查点高效压缩方法
(翻译说明: 1. 专业术语处理: - "Deep Neural Network"译为"深度神经网络",保留专业缩写"DNN" - "Checkpoints"译为"检查点",符合计算机领域术语 - "Context Modeling"译为"上下文建模",采用自然语言处理领域标准译法
- 技术概念传达:
- "Prediction"译为"预测",准确表达算法中的预测机制
-
"Efficient Compression"译为"高效压缩",突出方法的核心优势
-
句式结构调整:
- 将英文被动语态转换为中文主动表述
- 采用"基于...的...方法"的学术论文标题常用结构
-
保持原标题的精确性和简洁性
-
领域适配性: 译文符合计算机科学/人工智能领域的术语使用规范,与IEEE/ACM等国际期刊的中文标题风格一致) | Yuriy Kim | PDF | 本文致力于对神经网络训练过程中不同阶段获得的权重及优化器状态(称为检查点)进行高效压缩。首先,我们提出一种基于预测的压缩方法,该方法利用先前保存的检查点数值作为算术编码的上下文建模依据。其次,为提升压缩性能,我们还提出对检查点数值实施剪枝与量化处理。实验结果表明,该方法能显著降低比特体积,同时通过还原的检查点可实现近乎无损的训练恢复,在保持模型性能的前提下,使其适用于存储受限的环境。
(翻译说明: 1. 专业术语处理:"checkpoints"统一译为"检查点","pruning and quantization"译为"剪枝与量化","arithmetic coding"译为"算术编码"等 2. 被动语态转换:将"are used for"等被动结构转换为"利用...作为"的主动表达 3. 长句拆分:将原文复合句拆分为符合中文表达习惯的短句结构 4. 概念准确性:"near-lossless training recovery"译为"近乎无损的训练恢复"既保留技术含义又符合中文表达 5. 学术风格保持:使用"致力于"、"提出"、"结果表明"等学术论文标准表述) | | 面向推荐系统的基础模型生成式表征学习研究
(翻译说明: 1. "Generative Representational Learning"译为"生成式表征学习",准确对应生成式AI与表征学习的专业术语 2. "Foundation Models"采用学界通用译法"基础模型",特指大规模预训练模型 3. 通过增译"研究"二字符合中文论文标题习惯 4. "for Recommendation"处理为"面向推荐系统"的介词结构,比直译"用于推荐"更符合学术语境 5. 整体采用"定语+中心词"的中文标题结构,保持学术严谨性的同时确保可读性) | Zheli Zhou | PDF | Developing a single foundation model with the capability to excel across diverse tasks has been a lo [翻译失败] |