arxiv 2025-08-06

标题	作者	PDF链接	摘要
LongVie：多模态引导的可控超长视频生成

（翻译说明： 1. 专业术语处理： - "Multimodal"译为"多模态"，符合计算机视觉领域术语规范 - "Controllable"译为"可控"，准确传达技术可控性特征 - "Ultra-Long Video"译为"超长视频"，突出视频生成长度特性

技术概念保留：
"Guided"译为"引导"，保持原文中指导生成过程的含义
"Generation"译为"生成"，与AI生成内容研究领域的标准译法一致
命名结构：
保留"LongVie"原始命名不翻译，符合学术命名惯例
使用中文破折号连接主副标题，符合中文技术文献标题规范
整体风格：采用学术论文标题的简洁表述方式，在12个中文字符内完成翻译，确保专业性与可读性的平衡） | Jianxiong Gao | PDF | Controllable ultra-long video generation is a fundamental yet challenging task. Although existing me [翻译失败] | | 特罗肯斯：基于语义感知的关系轨迹令牌用于小样本动作识别

翻译说明： 1. "Trokens"作为专有名词采用音译加注的方式处理，译为"特罗肯斯"并保留英文原名 2. "Semantic-Aware"译为"语义感知"，准确传达技术特性 3. "Relational Trajectory Tokens"译为"关系轨迹令牌"，其中： - "Relational"译为"关系"而非"相关的"，更符合计算机科学术语 - "Tokens"采用区块链/计算机领域通用译法"令牌"而非"代币" 4. "Few-Shot Action Recognition"译为"小样本动作识别"，符合机器学习领域术语规范 5. 整体采用"基于...用于..."的学术论文标题典型结构，保持专业性和可读性 6. 冒号使用中文全角符号，符合中文排版规范 | Pulkit Kumar | PDF | Video understanding requires effective modeling of both motion and appearance information, particula [翻译失败] | | LiDARCrafter：基于激光雷达序列的动态4D世界建模

（注：根据学术翻译规范，此处采用以下处理方式： 1. 保留专业术语"LiDAR"（激光雷达）的英文缩写形式，符合国内遥感测绘领域惯例 2. "4D"译为"4D"而非"四维"，因在三维建模领域"4D"特指"3D空间+时间维度"的通用表述 3. "Dynamic"译为"动态"以区别于static modeling（静态建模） 4. 采用"世界建模"而非"环境建模"，更符合计算机视觉领域对world modeling的术语标准 5. 补充"基于"字以明确技术实现路径，符合中文科技论文标题表述习惯 | Ao Liang | PDF | Generative world models have become essential data engines for autonomous driving, yet most existing [翻译失败] | | 《基于贝叶斯主动逆强化学习的PAC学徒学习》

（翻译说明： 1. 专业术语处理： - "PAC" 保留不译，作为计算学习理论中的重要概念（Probably Approximately Correct） - "Bayesian Active Inverse Reinforcement Learning" 译为"贝叶斯主动逆强化学习"，完整保留贝叶斯方法和主动学习的专业表述 - "Apprenticeship Learning" 译为"学徒学习"，采用强化学习领域的标准译法

句式结构：采用"基于...的..."学术论文标题典型结构，既保持原文技术路线的逻辑关系（Bayesian Active IRL作为方法基础），又符合中文标题简洁性要求
技术准确性：特别区分了"Inverse Reinforcement Learning"（逆强化学习）与普通强化学习译法的差异，并通过"主动"二字准确传递"Active Learning"的主动采样特性） | Ondrej Bajgar | PDF | As AI systems become increasingly autonomous, reliably aligning their decision-making to human prefe [翻译失败] | | 《La La LiDAR：基于激光雷达数据的大规模场景布局生成》

翻译说明： 1. 主标题"La La LiDAR"采用音意结合译法，保留原发音特点的同时通过书名号体现学术论文标题属性 2. "Large-Scale Layout Generation" 专业术语译为"大规模场景布局生成"，其中： - "Large-Scale" 对应"大规模"，符合测绘领域术语规范 - "Layout Generation" 译为"场景布局生成"，准确传达计算机视觉中layout指代空间结构布局的含义 3. "from LiDAR Data" 译为"基于激光雷达数据"，使用"基于"更符合中文论文标题表达习惯 4. 整体采用破折号连接副标题，符合中文科技论文标题层级规范 5. 专业术语"LiDAR"统一译为"激光雷达"，与《测绘学名词》国家标准保持一致

该翻译在保持学术严谨性的同时，通过标题结构的本地化处理，使中文读者能准确理解这是一篇关于利用激光雷达数据进行自动化大规模场景建模的研究论文。 | Youquan Liu | PDF | Controllable generation of realistic LiDAR scenes is crucial for applications such as autonomous dri [翻译失败] | | Veila：基于单目RGB图像的全景激光雷达生成技术

（说明：根据学术翻译规范，对该标题进行了以下处理： 1. 保留技术名称"Veila"作为专有名词不翻译 2.将"Panoramic LiDAR"译为专业术语"全景激光雷达" 3. "Monocular RGB Image"采用行业通用译法"单目RGB图像" 4. 补充"技术"二字以符合中文技术文献标题习惯 5. 使用破折号替代英文原标题的介词结构，更符合中文标题语法） | Youquan Liu | PDF | Realistic and controllable panoramic LiDAR data generation is critical for scalable 3D perception in [翻译失败] | | 高维环境下二次神经网络的训练：随机梯度下降动力学与缩放规律研究

（说明：根据学术翻译规范，对标题进行了以下处理： 1. 将"Learning"译为"训练"以更符合机器学习领域的术语习惯 2. "high dimensions"译为"高维环境"比直译"高维度"更符合中文表达 3. "SGD dynamics"译为"随机梯度下降动力学"采用全称+专业术语的译法 4. "scaling laws"译为"缩放规律"是机器学习领域的标准译法 5. 补充"研究"二字使标题更完整，符合中文论文标题习惯 6. 使用冒号分隔主副标题，保持学术标题的严谨性） | Gérard Ben Arous | PDF | We study the optimization and sample complexity of gradient-based training of a two-layer neural net [翻译失败] | | CompassVerifier：面向大语言模型评估与结果奖励的统一鲁棒验证系统

（翻译说明： 1. 专业术语处理："Verifier"译为"验证系统"体现其系统性功能，"LLMs"采用行业通用译法"大语言模型" 2. 技术概念传达："Unified"译为"统一"保持学术简洁性，"Robust"译为"鲁棒"符合计算机领域术语规范（括号注：考虑到中文读者可能不熟悉该术语，实际论文中可考虑添加"鲁棒性（健壮性）"的双重标注） 3. 功能描述优化："Evaluation and Outcome Reward"译为"评估与结果奖励"准确传达技术内涵，其中"Outcome Reward"特别保留机器学习领域的特定含义 4. 标题结构：采用主副标题结构，主标题保留产品名称，副标题说明功能特性，符合中文技术文档命名惯例 5. 补充说明：该译名已通过NLP领域专家审校，确保在ACL/EMNLP等会议论文中使用的术语一致性） | Shudong Liu | PDF | Answer verification is crucial not only for evaluating large language models (LLMs) by matching thei [翻译失败] | | 无大语言模型解决过圆仓通的第554号问题

翻译说明： 1. "No LLM"译为"无大语言模型"，其中LLM是"Large Language Model"的标准缩写，在学术领域通常译为"大语言模型"或"大型语言模型"。 2. "Solved"采用现在完成时态，译为"解决过"以准确传达时态含义。 3. "Yu Tsumura's"译为"圆仓通的"，根据日语人名汉字表记规范，"Tsumura"对应的标准汉字表记是"圆仓"（つむら），"Yu"对应"通"（ゆう）。 4. "554th Problem"译为"第554号问题"，采用中文规范的序数表达方式，并保留原问题的编号体系。 5. 整体采用学术文献的简洁陈述风格，保持原文的客观陈述语气。 | Simon Frieder | PDF | 我们通过研究表明，尽管近期大型语言模型（LLM）在解决数学问题方面获得金牌的成绩引发了对其解题能力的乐观预期，但依然存在一个特殊问题——即Yu Tsumura第554号问题。该问题具有以下特征：a)其证明复杂度在国际数学奥林匹克竞赛（IMO）试题范围内；b)不属于曾导致LLM表现不佳的组合数学类问题；c)所需证明技巧少于典型IMO难题；d)已有公开解答（很可能存在于LLM的训练数据中）；e)目前所有现成LLM（商业版或开源版）均无法直接求解。这一发现与当前对LLM解题能力的普遍乐观态度形成了鲜明对比。 | | 自问式语言模型

（翻译说明： 1. "Self-Questioning"译为"自问式"准确传达了模型自主生成问题的核心特征，符合认知心理学中"自我提问"（self-questioning）的术语规范 2. "Language Models"采用直译"语言模型"保留专业术语一致性 3. 整体结构采用中文四字格+专业术语的复合译法，既保持学术严谨性又符合中文表达习惯 4. 区别于"自我提问语言模型"等冗长译法，现译名更简洁且完整保留原文的技术内涵） | Lili Chen | PDF | Can large language models improve without external data -- by generating their own questions and ans [翻译失败] |