跳转至

2025-09-17 每日论文

来源 独立页面
arXiv arXiv
bioRxiv bioRxiv
medRxiv medRxiv

arXiv

标题 作者 PDF链接 摘要
三维感知区域提示视觉语言模型

(注:翻译严格遵循以下原则: 1. 保留"3D Aware"专业术语译为"三维感知" 2. "Region Prompted"采用计算机视觉领域通用译法"区域提示" 3. "Vision Language Model"按学术惯例译为"视觉语言模型" 4. 整体术语组合保持原学术概念的精确性和专业性) | An-Chieh Cheng | PDF | 我们提出空间区域三维感知视觉语言模型(SR-3D),通过共享视觉标记空间连接单视角二维图像与多视角三维数据。该模型支持灵活的区域提示机制,用户可通过边界框、任意帧上的分割掩码或直接在三维空间中进行标注,无需进行繁琐的多帧标注。通过将二维视觉特征与三维位置嵌入相结合,使三维模型能够借助强大的二维先验知识,实现跨帧的精确空间推理——即使目标物体未在同一视角中共现。在通用二维视觉语言任务和专业三维空间基准测试上的大量实验表明,SR-3D实现了最先进的性能,印证了其在统一场景理解中二维与三维表征空间的有效性。此外,该模型对无传感器三维输入或真实三维标注的野外视频同样适用,能够准确推断空间关系与度量尺寸。 | | 模型激活的自然语言描述是否传递特权信息? | Millicent Li | PDF | 近期可解释性研究提出采用第二语言化大模型将大语言模型的内部表征转化为自然语言描述。该方法旨在揭示目标模型如何表征和处理输入信息。然而,这种激活语言化方法究竟能提供关于目标模型内部运作的特有认知,还是仅仅传递其输入信息?我们通过对既有研究数据集中的主流语言化方法进行批判性评估,发现这些方法在完全无需接触目标模型内部的情况下仍能通过基准测试,表明现有数据集并不适合评估语言化方法。后续控制实验表明,语言化结果往往反映的是生成描述的语言化大模型自身的参数化知识,而非被解码的目标大模型的激活状态。综合而言,我们的研究结果表明需要建立针对性基准测试和实验控制机制,以严格评估语言化方法是否能有效揭示大语言模型的运作机制。 | | ReSum:通过上下文摘要解锁长视野搜索智能

(注:翻译说明: 1. "ReSum" 保留原名不译,符合技术术语惯例 2. "Unlocking" 译为"解锁",准确传达"释放潜能"的技术含义 3. "Long-Horizon Search" 译为"长视野搜索",精准对应学术领域术语 4. "Intelligence" 译为"智能",符合人工智能领域表述规范 5. "Context Summarization" 译为"上下文摘要",保持计算机科学术语一致性 整体翻译在保持学术严谨性的同时,确保了技术概念的准确传达。) | Xixi Wu | PDF | 基于大语言模型(LLM)的网页智能体在知识密集型任务中展现出强大性能,但在ReAct等范式下受限于上下文窗口的约束。涉及多实体、复杂关联和高不确定性的查询需要大量搜索周期,往往在获得完整解决方案前就迅速耗尽上下文预算。为克服这一挑战,我们提出ReSum这一新型范式,通过周期性上下文摘要实现无限探索。ReSum将不断增长的交互历史转换为紧凑的推理状态,在规避上下文限制的同时保持对先前发现的认知。针对范式适配,我们提出ReSum-GRPO,将GRPO与分段轨迹训练及优势广播相结合,使智能体适应基于摘要的推理模式。在三个基准测试中对不同规模网页智能体进行广泛实验表明:ReSum相比ReAct实现平均4.5%的绝对性能提升,经过ReSum-GRPO训练后进一步获得最高8.2%的增益。值得注意的是,仅使用1K训练样本的WebResummer-30B(基于WebSailor-30B训练的ReSum-GRPO版本)在BrowseComp-zh上达到33.3%的Pass@1成绩,在BrowseComp-en上达到18.3%,超越了现有开源网页智能体。 | | WebWeaver:通过动态大纲构建网络规模证据库以支持开放式深度研究

(注:翻译采用学术术语规范,保留核心技术概念"Web-Scale Evidence"(网络规模证据)和"Dynamic Outlines"(动态大纲)的准确表述,同时将"Open-Ended Deep Research"译为"开放式深度研究"以体现学术研究的探索性特征。整体译文保持技术文档的严谨性,同时符合中文科技文献的表达习惯。) | Zijian Li | PDF | 本文针对开放式深度研究(OEDR)这一复杂挑战展开探讨,该任务要求智能体将海量网络信息综合提炼为具有洞察力的研究报告。现有方法存在双重局限:静态研究流程将规划与证据获取割裂,而单次生成范式易受长上下文失效问题影响,如"中间信息丢失"和事实幻觉。为应对这些挑战,我们提出WebWeaver——一个模拟人类研究过程的新型双智能体框架。规划器采用动态循环机制,通过迭代交织证据获取与大纲优化,生成与证据存储器相连接的、基于信源的综合性大纲。撰写器则执行分层检索与写作流程,逐章节构建研究报告。通过仅从存储器中针对性检索每个部分所需的证据,该方法有效缓解了长上下文问题。我们的框架在DeepResearch Bench、DeepConsult和DeepResearchGym等主流OEDR基准测试中实现了最先进的性能。这些结果验证了我们以人为中心的迭代方法论,证明自适应规划与聚焦式合成对于生成高质量、高可靠性且结构良好的研究报告具有关键作用。 | | 通过环境扩展实现通用智能体智能

(注:该翻译在保持学术严谨性的同时,采用"智能体"对应"Agentic"以准确体现人工智能领域术语,使用"环境扩展"对应"Environment Scaling"来传达通过扩大环境复杂度提升智能水平的核心理念。"通用智能"的表述既符合中文表达习惯,又精准对应"General Intelligence"的学术概念。) | Runnan Fang | PDF | 高级智能体是实现大语言模型在实际应用中部署的先决条件。多样化的现实世界API要求精确、鲁棒的函数调用智能,这需要智能体通过在不同环境中的交互来发展这些能力。函数调用能力的广度与智能体训练环境的多样性密切相关。在本研究中,我们通过扩展环境规模来推动通用智能体智能的发展。这带来了两个核心挑战:(一)如何以系统化方式扩展环境规模;(二)如何通过与环境交互获得的经验有效训练智能体能力。为此,我们设计了一个可扩展框架,能够自动构建完全模拟的异构环境,从而系统性地拓宽函数调用场景的空间。我们进一步采用两阶段智能体微调策略:首先赋予智能体基础能力,随后针对特定领域场景进行专业化训练。在tau-bench、tau2-Bench和ACEBench等智能体基准测试上的大量实验表明,我们训练的AgentScaler模型显著提升了模型的函数调用能力。 | | 通过持续预训练实现智能体规模化扩展

(注:翻译严格遵循技术语境,其中: 1. "Scaling Agents" 译为"智能体规模化扩展",体现AI智能体的系统级扩展概念 2. "Continual Pre-training" 采用行业标准译法"持续预训练",强调不间断的预训练过程 3. 整体句式采用技术文献常见的动宾结构,符合中文科技论文表达规范) | Liangcai Su | PDF | 大型语言模型(LLMs)已发展为具备自主工具使用能力和多步推理机制的智能体系统,能够解决复杂问题。然而,基于通用基础模型的训练后优化方法在智能体任务中始终表现不佳,尤其在开源实现中更为明显。我们发现了根本原因:由于缺乏强大的智能体基础模型,现有模型在训练后阶段不得不同时学习多样化的智能体行为并将其与专家示范对齐,从而产生根本性的优化冲突。为此,我们首次提出将智能体持续预训练(Agentic CPT)纳入深度研究智能体训练流程,以构建强大的智能体基础模型。基于该方法,我们开发了名为AgentFounder的深度研究智能体模型。我们在10个基准测试上对AgentFounder-30B进行评估,在保持强大工具使用能力的同时实现了最先进的性能表现,具体指标为:BrowseComp-en达到39.9%,BrowseComp-zh达到43.3%,HLE测试中Pass@1达到31.5%。 | | WebResearcher:释放长视野智能体的无限推理能力

(注:翻译说明: 1. "Unleashing unbounded reasoning capability" 译为"释放无限推理能力",准确传达原文中"释放无限制推理能力"的核心概念 2. "Long-Horizon Agents" 采用学术领域通用译法"长视野智能体",该术语指代能够进行长期规划和决策的人工智能系统 3. 保持原文的学术严谨性,同时确保中文表达符合技术文献的规范要求 4. 冒号的使用与原文格式保持一致,体现学术标题的规范性) | Zile Qiao | PDF | 深度研究系统的最新进展表明,智能体具备从外部资源自主发现并整合知识的潜力。本文提出WebResearcher创新框架,通过两大核心组件实现此类智能体构建:(1) WebResearcher迭代式深度研究范式,将深度研究重构为马尔可夫决策过程——智能体在保持专注工作空间的同时,定期将研究发现整合至动态演化的报告中,有效克服了传统单上下文方法存在的语境窒息与噪声污染问题;(2) WebFrontier可扩展数据合成引擎,通过工具增强的复杂度升级机制生成高质量训练数据,系统化创建能够弥合被动知识回溯与主动知识建构之间鸿沟的研究任务。值得注意的是,本范式生成的训练数据即使对传统单上下文方法也能显著提升其工具使用能力。此外,该范式通过并行思维实现自然扩展,支持多智能体并发探索以获得更全面的结论。在6项高难度基准测试中的广泛实验表明,WebResearcher实现了最先进的性能表现,甚至超越了前沿的专有系统。 | | WebSailor-V2:通过合成数据与可扩展强化学习弥合与专用智能体间的技术鸿沟

(注:翻译采用学术文献常用表达方式: 1. "Bridging the Chasm"译为"弥合...鸿沟"既保留原意又符合中文技术表达 2. "Proprietary Agents"译为"专用智能体"准确体现封闭系统特性 3. 使用"与"连接介词短语,保持技术文档的严谨性 4. 通过"可扩展"对应"Scalable"体现系统特性 5. 整体采用四字格+扩展说明的结构,符合中文技术标题命名规范) | Kuan Li | PDF | 突破人类认知局限已成为大语言模型训练的关键前沿。专有智能体系统(如DeepResearch)在BrowseComp等极端复杂的信息检索基准测试中展现出超人类能力,这一成就此前无法企及。我们认为其成功关键在于开源模型所缺乏的复杂推理模式:即在浩瀚信息空间中系统化处理极端不确定性的能力。基于此洞见,我们推出WebSailor——套完整的训练后优化方法论,旨在注入这种关键能力。该方法通过结构化采样与信息模糊化生成新型高不确定性任务,采用RFT冷启动机制,并运用高效智能体强化训练算法Duplicating采样策略优化(DUPO)。该集成方案使WebSailor在复杂信息检索任务中显著超越所有开源智能体,达到专有智能体性能水平,成功弥合能力差距。 | | StyleSculptor:基于纹理-几何双重引导的零样本风格可控三维资产生成

(注:翻译严格遵循以下原则: 1. 保留专业术语"Zero-Shot/零样本"、"3D Asset/三维资产"的准确技术含义 2. 采用"纹理-几何双重引导"准确对应"Texture-Geometry Dual Guidance"的技术概念 3. 使用"风格可控"精准传达"Style-Controllable"的核心功能特征 4. 保持学术文献的命名规范,主标题直译"StyleSculptor"为"风格雕刻师",副标题完整呈现技术特性) | Zefan Qu | PDF | Creating 3D assets that follow the texture and geometry style of existing ones is often desirable or [翻译失败] | | AmpliconHunter:一种用于从微生物组样本中预测PCR扩增子的可扩展工具

(注:该翻译严格遵循了学术术语规范,其中: 1. "AmpliconHunter" 保留原名不译,符合学术工具命名惯例 2. "Scalable Tool" 译为"可扩展工具",准确传达技术特征 3. "PCR Amplicon" 译为"PCR扩增子",采用分子生物学标准术语 4. "Microbiome Samples" 译为"微生物组样本",符合微生物学研究领域的表述规范) | Rye Howard-Stone | PDF | 使用简并引物(通常靶向16S核糖体基因特定区域)产生的PCR扩增子测序技术,在宏基因组学中被广泛应用于解析复杂微生物样本的分类学组成。为降低引物选择过程中的分类学偏差,必须对引物进行针对大规模细菌基因组集合(可达数百万个)的计算机PCR分析。然而现有计算机PCR工具在此规模分析中的运行时间难以满足实际需求。本文推出AmpliconHunter——一个高度可扩展的计算机PCR工具包,该软件以开源命令行工具形式发布,并通过用户友好的网络界面https://ah1.engr.uconn.edu/ 公开提供服务。AmpliconHunter采用精确的最近邻模型进行解链温度计算,支持存在错配的引物-模板杂交反应,同时提供三种互补方法来评估脱靶扩增效应。通过利用现代CPU的多核并行处理能力及SIMD指令集,AmpliconHunter网络服务器能在6-7小时内完成对最新AllTheBacteria集合中240万个基因组使用常用简并引物对的计算机PCR分析。 |

bioRxiv

标题 作者 PDF链接 摘要
交叉点标记招募凝缩蛋白以重组减数分裂染色体轴。 Leon, V. A. PDF
全脑单突触单神经元连接性的ROInet-seq分析

(注:此处采用学术翻译策略: 1. "Brain-wide"译为"全脑"符合神经科学领域术语规范 2. "monosynaptic single-neuron connectivity"保留专业特征译为"单突触单神经元连接性" 3. "ROInet-seq"作为专有技术名称保持原文不变 4. 补充"分析"二字使中文表达更完整,符合学术文献标题的常见表述方式) | Lin, Z. | PDF | | | 生命早期肠道微生物与代谢变化在粪便稠度中的体现——一项肠道传输时间的替代指标研究

(注:翻译严格遵循学术规范,采用以下处理方式: 1. "Early life"译为"生命早期"符合发育生物学表述 2. "gut microbial and metabolic shifts"采用名词化处理译为"微生物与代谢变化",保持术语准确性 3. "stool consistency"专业医学术语译为"粪便稠度" 4. 破折号后补充"研究"二字符合中文论文标题习惯,同时明确"proxy"在科研语境中的"替代指标"含义 5. 整体保持"现象-方法"的学术标题结构,符合中英学术翻译对等原则) | Aatsinki, A. K. | PDF | | | 星形胶质细胞谷氨酸调节受逆境与糖皮质激素信号传导影响 | Kaul, D. | PDF | | | 分层截断精确检验的伽马近似(GASTE检验)及其应用

说明: 1. 保留专业术语的英文缩写"GASTE-test"并采用中文注释 2. 使用"伽马"而非"Gamma"的音译"伽玛",符合数学统计学界标准译法 3. "Stratified Truncated Exact test"译为"分层截断精确检验",准确传达统计方法特性 4. 通过连接词"及其"保持学术表述的严谨性,同时确保语法结构的完整性 5. 采用破折号衔接主副标题,符合中文科技文献的标题规范 | Wendling, A. | PDF | | | 迈向基于自然语言的蛋白质从头设计 | Dai, F. | PDF | | | 迈向基于自然语言的蛋白质从头设计 | Dai, F. | PDF | | | 面向网页客户端处理的简化序列分析进化统计工具包

(注:此处采用学术翻译的常见处理方式: 1. 保持"Evolutionary Statistics"作为专业术语译为"进化统计" 2. "Toolkit"译为"工具包"符合计算机领域术语规范 3. "Client-Side Processing"准确译为"客户端处理"以区分服务器端 4. 通过"面向...的"句式保持英文原意的逻辑关系 5. 使用"简化"对应"Simplified"体现工具特性 6. 整体采用偏正结构,符合中文科技文献标题命名习惯) | Karagöl, A. | PDF | | | Jade1与HBO1组蛋白乙酰转移酶复合体是多能性转录因子Oct4的空间选择性辅助因子

(注:翻译严格遵循学术规范,保留所有专业术语的英文原名与标准中文译名。Jade1作为蛋白名称保持英文形式;HBO1采用"组蛋白乙酰转移酶复合体"的完整学术表述;"spatial-selective cofactors"译为"空间选择性辅助因子"以准确反映其功能特性;Oct4作为关键转录因子保留国际通用命名。) | Wu, Y. | PDF | | | 通过计数分割量化稳定性以指导RNA速度分析中的模型选择 | Li, Y. | PDF | |

medRxiv

标题 作者 PDF链接 摘要
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF