2025-10-11 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
ReSplat：学习循环高斯溅射模型

（注：该翻译采用学术术语直译原则： 1. 保留技术名词"Gaussian Splats"的标准译法"高斯溅射" 2. "Recurrent"译为"循环"以体现时序递归特性 3. 冒号后采用动宾结构"学习...模型"符合中文论文标题规范 4. 整体保持原标题的简洁性，同时准确传达计算机图形学中基于高斯分布的实时渲染技术内涵） | Haofei Xu | PDF | 虽然前馈式高斯溅射模型具有计算效率高、能有效处理稀疏输入场景的优点，但其性能从根本上受限于推理过程中对单次前向传播的依赖。我们提出ReSplat——一种前馈循环式高斯溅射模型，该模型无需显式计算梯度即可迭代优化三维高斯分布。我们的核心发现是：高斯溅射的渲染误差可作为丰富的反馈信号，指导循环网络学习有效的高斯更新策略。这种反馈信号在测试时能自然适应未知数据分布，从而实现鲁棒泛化。为初始化循环过程，我们引入了一个在16倍降采样空间中运行的紧凑重建模型，其生成的高斯分布数量较先前逐像素高斯模型减少16倍。这显著降低了计算开销，并实现了高效的高斯更新。通过在多种输入视角（2/8/16）、分辨率（256×256至540×960）和数据集（DL3DV、RealEstate10K）上的大量实验表明，我们的方法在显著减少高斯分布数量并提升渲染速度的同时，实现了最先进的性能。项目页面详见：https://haofeixu.github.io/resplat/。 | | BLAZER：基于大语言模型的零样本数据生成操控智能体自举框架

（注：采用学术翻译的"意译+术语保留"原则： 1. 保留核心缩写"BLAZER"作为技术代号 2. "Bootstrapping"译为"自举"符合计算机领域术语规范 3. "LLM-based"明确译为"基于大语言模型"确保技术准确性 4. "Zero-Shot Data Generation"采用"零样本数据生成"的标准机器学习术语 5. 通过增译"框架"二字使技术方案表述更完整，符合中文论文标题习惯） | Rocktim Jyoti Das | PDF | 数据与模型规模的扩展在计算机视觉和语言领域取得显著进展的过程中发挥了关键作用。受这些领域启发，机器人学近期研究同样聚焦于扩展数据与模型规模，以开发更具泛化性和鲁棒性的策略。然而与视觉和语言领域不同，机器人学缺乏跨任务与环境的互联网级示范数据资源。这导致现有数据集规模受限于人工数据采集与整理的需求。为解决该问题，本文提出BLAZER框架——一种通过自动生成训练数据来学习操作策略的方法。我们基于大语言模型规划器的零样本能力，在仿真环境中自动生成多样化操作任务的示范数据。随后利用成功案例对大语言模型进行微调，在无需人工监督的情况下提升其规划能力。值得注意的是，虽然BLAZER训练需要访问仿真器状态，但我们实现了所学技能向基于传感器的操作任务的直接迁移。通过大量实验证明，BLAZER能显著提升仿真与真实环境中的零样本操作性能。此外，该框架对训练集外任务表现出改进能力，并支持大语言模型的规模精简。我们的代码与数据将在项目页面公开发布。 | | 结合卷积与点云架构重建局部密度场 | Baptiste Barthe-Gold | PDF | 我们构建了一个神经网络，用于根据暗物质晕的视线 peculiar velocities（本动速度）——即暗物质场的偏置示踪物——对局部暗物质密度场进行回归分析。该网络架构将卷积U-Net与点云DeepSets相结合，相较于单一U-Net方法，这种组合能更有效地利用小尺度信息并提升重建质量。具体而言，在较小尺度上，我们的混合网络在聚类振幅和相位恢复方面均优于单一U-Net架构。 | | 谁说神经网络不是线性的？ | Nimrod Berman | PDF | 神经网络以非线性特性著称。然而线性性是相对于一对向量空间$f$$:$$X$$\to$$Y$定义的。是否存在这样一对非标准向量空间，使得传统非线性函数在该空间中呈现线性特征？本文提出一种通过构造显式构建此类向量空间的方法。研究发现，若将线性算子$A$嵌入两个可逆神经网络之间，即$f(x)=g_y^{-1}(A g_x(x))$，则相应的向量空间$X$和$Y$可由$g_x$和$g_y$导出的新定义向量加法与数乘运算所诱导。我们将此类架构命名为线性化器。该框架使得包括奇异值分解、伪逆、正交投影等在内的整套线性代数工具可应用于非线性映射。进一步地，我们证明共享神经网络的两个线性化器的复合仍构成线性化器。利用这一特性，我们在线性化器架构下训练扩散模型，可将数百步采样过程压缩至单步完成。此外，我们运用该框架在网络中实现幂等性约束（即$f(f(x))=f(x)$），构建出全局投影生成模型，并展示了模块化风格迁移的应用。 | | 自动驾驶的可扩展离线评估指标

（注：该翻译在保持专业性的同时实现了术语准确对应："Scalable"译为"可扩展"体现系统容量弹性，"Offline Metrics"译为"离线评估指标"准确区分于在线测试，完整保留自动驾驶领域的专业表述特征） | Animikh Aich | PDF | 对机器人系统（如自动驾驶车辆）基于感知的规划模型进行真实世界评估时，可通过离线方式安全且低成本地实施——即利用带有真实标注的预收集验证数据集计算模型预测误差。然而，如何将离线模型性能外推至在线场景仍存在挑战。在这些场景中，看似微小的误差可能持续累积，最终导致测试阶段的违规行为或碰撞事故。这种关联性尚未得到充分研究，特别是在多样化的闭环指标与复杂城市机动场景中。本研究通过跨多种条件与指标的大规模实验，重新审视了策略评估中这一被低估的问题。基于仿真分析，我们发现离线与在线场景间的相关性比既往研究报道的更差，这对当前驾驶策略评估方法与指标的有效性提出了质疑。随后我们致力于弥合离线与在线评估之间的鸿沟：研究提出基于认知不确定度的离线指标，该指标旨在捕捉闭环场景中可能引发误差的事件。相较于既有离线指标，新指标使相关性提升超过13%。我们进一步在真实场景中验证了研究结论在仿真环境之外的泛化能力，结果显示实际环境中的提升幅度更为显著。 | | NovaFlow：基于生成视频中可执行动作流的零样本操控技术

（解析：1. "Zero-Shot Manipulation"译为"零样本操控"符合机器学习领域术语规范；2. "Actionable Flow"译为"可执行动作流"既保留"动作流"的计算机视觉概念，又通过"可执行"体现其可操作性；3. 采用"基于...技术"的句式完整呈现技术路径，符合中文论文标题表述习惯；4. 保留英文原名"NovaFlow"体现专有名词一致性） | Hongyu Li | PDF | 实现机器人零样本执行新型操作任务是机器人技术的核心目标。现有方法大多假设任务分布内或依赖具身匹配数据的微调，限制了跨平台迁移能力。我们提出NovaFlow自主操作框架，无需任何演示即可将任务描述转化为目标机器人的可执行计划。给定任务描述后，NovaFlow通过视频生成模型合成任务视频，并利用现成的感知模块将其蒸馏为三维可操作物体流。对于刚性物体，系统从物体流中计算相对位姿，通过抓取提案和轨迹优化将其转化为机器人动作；对于可变形物体，该流动场则作为基于粒子动力学模型的规划跟踪目标。通过将任务理解与底层控制解耦，NovaFlow天然支持跨具身系统迁移。我们在桌面Franka机械臂和Spot四足移动机器人上验证了刚性、关节式和可变形物体的操作任务，在无需演示或具身特定训练的情况下实现了有效的零样本执行。项目网站：https://novaflow.lhy.xyz/ | | ArenaBencher：基于多模型竞争性评估的自动基准演化系统

（注：翻译采用技术术语直译与功能阐释相结合的方式： 1. "ArenaBencher"保留核心意象译为"竞技场测试器"，通过"竞技场"隐喻多模型竞争环境 2. "Benchmark Evolution"译为"基准演化"，准确对应计算机科学中基准测试的迭代优化概念 3. 副标题采用"基于...的"结构明确技术路径，将"Competitive Evaluation"规范译为"竞争性评估" 4. 整体译文既保持学术术语的精确性，又通过系统化表述体现该工具的平台属性） | Qin Liu | PDF | 基准测试是衡量大语言模型能力与指导模型发展的核心工具，然而预训练语料中普遍存在的数据泄露问题严重削弱了其有效性。模型可能通过匹配记忆内容而非展现真正的泛化能力，导致分数虚高、跨模型比较失真以及进展评估失准。我们推出ArenaBencher——一个模型无关的自动基准演进框架，能在保持可比性的同时动态更新测试用例。该框架基于现有基准和待评估的多样化模型池，通过以下流程实现演进：推断每个测试用例的核心能力要求，生成保持原始目标的候选问答对，使用LLM作为评判者验证答案正确性与意图一致性，并聚合多模型反馈以筛选能暴露共性弱点的候选案例。该过程通过上下文示例进行迭代优化，引导生成更具挑战性和诊断力的测试案例。我们将ArenaBencher应用于数学解题、常识推理和安全领域，证明其能产生经过验证的、多样化的公平更新——这些更新既能揭示新的失效模式，在保持测试目标一致性的同时提升难度，又能增强模型区分度。该框架为基准测试伴随基础模型的快速发展实现持续演进提供了可扩展路径。 | | 矩阵：面向鲁棒工具使用推理的多模态智能体调优 | Tajamul Ashraf | PDF | 视觉语言模型（VLMs）正越来越多地被部署为可调用外部工具的控制器，用于复杂推理与决策任务，但其效能仍受限于高质量多模态轨迹数据的稀缺性以及人工标注的高成本。为解决这一挑战，我们提出了以视觉为中心的智能体调优框架，该框架能自动合成多模态轨迹、生成分步偏好对，并训练出具备鲁棒工具使用推理能力的VLM控制器。我们的技术路径首先构建了M-TRACE数据集——一个包含28.5千个多模态任务、177千条已验证轨迹的大规模数据集，为实现基于模仿学习的轨迹调优奠定基础。在此基础上，我们开发了MATRIX智能体控制器，通过对M-TRACE进行微调实现分步工具推理。为实现更精细的对齐，我们进一步引入Pref-X数据集（包含11千个自动生成的偏好对），并通过分步偏好学习对MATRIX进行优化。在Agent-X、GTA和GAIA三大基准测试中，MATRIX均持续超越开源与闭源VLM模型，展现出可扩展且高效的多模态工具使用能力。项目数据与代码已发布于：https://github.com/mbzuai-oryx/MATRIX。 | | D$^2$GS：基于深度与密度引导的高斯泼溅算法——实现稳定精确的稀疏视角重建

（注：译文通过以下方式实现专业性与可读性平衡： 1. 保留核心算法简称"D$^2$GS"的数学上标格式 2. "Gaussian Splatting"采用计算机图形学领域通用译法"高斯泼溅" 3. "Depth-and-Density Guided"译为"深度与密度引导"以准确传达双重约束条件 4. 副标题采用破折号结构突出算法优势，其中"稀疏视角重建"为三维重建领域标准术语 5. 使用"稳定精确"对应原文"Stable and Accurate"的递进关系） | Meixi Song | PDF | 三维高斯溅射(3DGS)技术的最新进展实现了基于显式三维表示的实时高保真新视角合成。然而在稀疏视角条件下，该技术仍存在性能下降与不稳定的突出问题。本研究系统分析了稀疏视角下的两种关键失效模式：相机近场区域因高斯分布过密导致的过拟合现象，以及远场区域因高斯覆盖不足产生的欠拟合问题。针对这些挑战，我们提出统一框架D²GS，其包含两大核心组件：基于深度与密度引导的丢弃策略——通过密度和深度自适应掩蔽冗余高斯分布以抑制过拟合；距离感知保真度增强模块——通过针对性监督提升欠拟合远场区域的重建质量。此外，我们提出了量化高斯分布稳定性的新评估指标，为稀疏视角3DGS的鲁棒性研究提供新视角。在多数据集上的大量实验表明，本方法在稀疏视角条件下显著提升了视觉质量与系统鲁棒性。项目页面详见：https://insta360-research-team.github.io/DDGS-website/ | | 如何教授大型多模态模型新技能 | Zhen Zhu | PDF | 如何在不消除已有能力的前提下，让大型多模态模型（LMM）学习新技能？我们通过在三个模型系列上进行连续微调实验，针对五项目标技能展开研究，同时监测八个保留基准测试的通用能力。研究发现：经过针对性微调后，模型在保留任务中表现出的明显"遗忘"现象，在后续阶段会部分恢复。我们通过输出词元分布的可测量偏移追踪该现象，并构建了一个与遗忘程度同步变化的计数偏差探针进行验证。基于此发现，我们提出了两种简单且稳健的调优方案：（i）仅更新自注意力投影层；（ii）仅更新MLP门控与上行投影层，同时冻结下行投影层。跨模型与任务的实验表明，这些方法在实现显著目标技能提升的同时，能最大限度保持模型在保留任务上的性能。代码已发布于https://github.com/jessemelpolio/LMM_CL |

bioRxiv

标题	作者	PDF链接	摘要
COVID-19患者唾液病毒脱落模式的层级分析

（注：该翻译严格遵循以下学术规范： 1. 保留核心蛋白名称Scube2/Dispatched/ADAM10/Shh的英文缩写形式 2. 将HDL译为"高密度脂蛋白"并补充"受体"以明确生物学功能 3. 使用"启动"对应"primes"的动态调控含义 4. 采用"介导"准确传达酶促反应特征 5. 通过"过程"补足原文隐含的生物学进程概念 6. 保持"质膜"专业术语表述完整呈现蛋白质相互作用与信号传导路径） | Puschmann, J. | PDF | | | 时间波动性空间结构集合种群中的固定与灭绝 | Asker, M. | PDF | | | 果蝇睾丸肿瘤干细胞样细胞的细胞类型特异性及染色体特异性染色质景观与DNA复制程序

（注：此处采用学术翻译原则： 1. 保留专业术语："chromatin landscapes"译为"染色质景观"，"DNA replication programs"译为"DNA复制程序" 2. 处理复合修饰结构：通过"细胞类型特异性及染色体特异性"准确传达"Cell type- and chromosome-specific"的双重限定 3. 保持专业领域习惯："testis tumor stem-cell like cells"译为"睾丸肿瘤干细胞样细胞"符合发育生物学命名规范 4. 整体采用偏正结构，确保科学表述的严谨性） | Urban, J. | PDF | | | 疟原虫（恶性疟原虫）细胞周期检查点活性研究

（注：该翻译采用学术文献标准译法，其中： 1. "Cell cycle checkpoint" 规范译为"细胞周期检查点" 2. "Plasmodium falciparum" 采用医学寄生虫学标准译名"恶性疟原虫" 3. 通过增译"研究"二字符合中文论文标题表述习惯 4. 保持专业术语准确性的同时确保句式符合中文表达规范） | Johnson, M. K. | PDF | | | 被遗忘记忆的神经痕迹在人类大脑中持续存在并具有行为相关性

该翻译严格遵循以下学术规范： 1. 保留核心科技术语"神经痕迹"对应"Neural Traces"的准确表述 2. 采用"被遗忘记忆"这一专业心理学表述对应"Forgotten Memories" 3. 通过"持续存在"准确传达"Persist"的持续状态含义 4. 使用"行为相关性"精准对应"Behaviorally Relevant"的学术概念 5. 保持原文"人类"（Humans）的科学研究表述惯例 6. 整体句式符合中文科技论文标题的凝练特征 | Willems, T. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF