2025-12-11 每日论文
arXiv
| 标题 |
作者 |
PDF链接 |
摘要 |
| 缩小基于梯度规划的世界模型中训练与测试的差距 |
Arjun Parthasarathy |
PDF |
将世界模型与模型预测控制(MPC)结合,可以在专家轨迹的大规模数据集上进行离线训练,并在推理时泛化至广泛的规划任务。相较于依赖缓慢搜索算法或需迭代精确求解优化问题的传统MPC流程,基于梯度的规划提供了一种计算效率更高的替代方案。然而,基于梯度的规划方法在性能上迄今仍落后于其他方法。本文提出改进的世界模型训练方法,以实现高效的梯度规划。我们首先观察到:尽管世界模型通过下一状态预测目标进行训练,但在测试阶段却用于估计动作序列。本研究的目标正是弥合这一训练与测试间的差距。为此,我们提出训练阶段的数据合成技术,显著提升了现有世界模型的梯度规划能力。在测试阶段,我们的方法在仅使用10%时间预算的情况下,在多种物体操控与导航任务中均优于或匹配经典的无需梯度的交叉熵方法(CEM)。 |
| GAINS:基于高斯分布的稀疏多视角捕获逆向渲染 |
Patrick Noras |
PDF |
基于高斯泼溅的逆向渲染技术近期取得进展,通过为高斯基元引入着色参数与基于物理的光线传输模型,实现了从密集多视角采集数据中高质量恢复材质属性。然而,这些方法在稀疏视角条件下性能急剧下降——有限的观测数据导致几何结构、反射率与光照条件之间产生严重歧义。本文提出GAINS(基于稀疏多视角采集的高斯逆向渲染框架),该两阶段逆向渲染框架通过引入学习先验知识来稳定几何与材质估计。GAINS首先利用单目深度/法线先验与扩散先验优化几何结构,继而通过分割、本征图像分解及扩散先验对材质恢复过程进行正则化约束。在合成数据集与真实场景数据集上的大量实验表明,相较于当前最先进的基于高斯的逆向渲染方法,GAINS在材质参数精度、重光照质量及新视角合成方面均取得显著提升,尤其在稀疏视角条件下优势更为突出。项目主页:https://patrickbail.github.io/gains/ |
| ReViSE:基于自反思学习的统一模型中的理性感知视频编辑研究 |
Xinyu Liu |
PDF |
视频统一模型在理解与生成方面展现出强大能力,但即使配备了强大的内部视觉语言模型(VLMs),其在推理感知型视频编辑任务中仍面临困难。我们认为这一差距源于两方面因素:1)现有数据集不足以训练和评估具备推理能力的视频编辑任务;2)模型推理能力与编辑能力之间存在固有割裂,导致丰富的理解无法有效指导编辑过程。弥合这一差距需要构建连接推理与视觉转换的集成框架。为此,我们提出推理感知型视频编辑(RVE)任务,该任务要求编辑过程中对物理合理性与因果动态进行推理。为支持系统性评估,我们构建了RVE-Bench综合基准数据集,包含两个互补子集:推理感知型视频编辑与上下文视频生成。这些子集覆盖了多维推理场景与现实编辑需求。基于此,我们提出ReViSE框架——一种将生成与评估统一于单一架构的自反思推理(SRF)框架。该模型通过内部VLM评估编辑后的视频是否在逻辑上满足给定指令,从而提供内在反馈。这种差异化反馈能在训练过程中持续优化生成器的推理行为。在RVE-Bench上的大量实验表明,ReViSE显著提升了编辑准确性与视觉保真度,在推理感知型视频编辑子集上的综合得分较现有最优方法提升32%。 |
| Splatent:基于扩散隐空间的新视角合成点云渲染技术 |
Or Hirschorn |
PDF |
辐射场表示法最近在扩散模型常用的变分自编码器(VAE)潜空间中得到探索。这一方向能够实现高效渲染,并能与基于扩散的流程无缝集成。然而,这些方法面临一个根本性局限:VAE潜空间缺乏多视角一致性,导致三维重建过程中纹理模糊与细节缺失。现有方法试图通过微调VAE(以牺牲重建质量为代价)或依赖预训练扩散模型恢复细粒度细节(可能产生伪影)来解决此问题。我们提出了Splatent——一种基于扩散的增强框架,专门设计用于在VAE潜空间中的三维高斯溅射(3DGS)基础上运行。我们的核心思路突破了传统以三维为中心的观点:与其在三维空间中重建细粒度细节,我们通过多视角注意力机制从输入视图中在二维空间恢复细节。这种方法在保持预训练VAE重建质量的同时,实现了精准的细节复原。经多个基准测试评估,Splatent为VAE潜空间辐射场重建确立了新的技术标杆。我们进一步证明,将本方法与现有前馈框架结合,能持续提升细节保留效果,为高质量稀疏视角三维重建开辟了新可能。 |
| LISN:基于视觉语言模型控制器的语言指令社交导航 |
Junting Chen |
PDF |
迈向人机共存,具备社会意识的导航对于移动机器人至关重要。然而该领域现有研究主要聚焦路径效率与行人避碰——这些要素虽不可或缺,却仅构成社会导航的冰山一角。除基础功能外,机器人还需遵循用户指令,使其行为同时契合任务目标与人类表达的社会规范。本研究提出LISN-Bench,这是首个基于仿真的语言指令社会导航基准测试平台。该平台构建于Rosnav-Arena 3.0框架之上,成为首个融合多场景指令跟随与场景理解能力的标准化社会导航评估体系。针对此任务,我们进一步提出Social-Nav-Modulator分层调控系统,通过视觉语言模型智能体动态调节代价地图与控制器参数。该系统将底层动作生成与慢速视觉语言模型循环解耦,在降低高频视觉语言模型推理依赖的同时,显著提升了动态避障与环境感知适应性。实验表明,该方法平均成功率高达91.3%,较最具竞争力的基线模型提升超63%,尤其在人群跟随、严格规避指令禁行区域等高难度任务中表现突出。项目网站详见:https://social-nav.github.io/LISN-project/ |
| FALCON:连续流模型的少步精确似然估计 |
Danyal Rehman |
PDF |
热力学平衡状态下分子态的可扩展采样是统计物理学中长期存在的挑战。玻尔兹曼生成器通过将能够精确计算似然度的生成模型与重要性采样相结合,从而在目标分布下获得一致样本,以应对这一难题。当前的玻尔兹曼生成器主要采用基于流匹配训练的连续归一化流,以实现高效训练的强大模型。然而,这些模型的似然度计算成本极高,每个样本需要数千次函数评估,严重限制了其应用。本研究提出连续流少步精确似然度方法,通过引入促进可逆性的混合训练目标,实现只需少量步数即可获得适用于重要性采样的高精度似然度采样。实验表明,该方法在分子玻尔兹曼采样任务中优于当前最先进的归一化流模型,且比性能相当的连续归一化流模型快两个数量级。 |
| NordFKB:挪威地理空间人工智能细粒度基准数据集 |
Sander Riisøen Jyhne |
PDF |
我们推出NordFKB——一个面向挪威地理空间人工智能的细粒度基准数据集,该数据集源自权威且高精度的国家统一地图数据库(Felles KartdataBase, FKB)。该数据集包含高分辨率正射影像及36个语义类别的精细标注,涵盖GeoTIFF格式的逐类别二值分割掩膜与COCO风格的边界框标注。数据采集自七个地理特征各异的区域,确保在气候、地形和城市化程度上的多样性。仅包含至少含一个标注对象的图块,并通过跨区域随机抽样划分训练集与验证集,以保证类别与场景分布的代表性。经专家人工审核与质量控制,标注精度达到高标准。除数据集外,我们同步开源包含标准化评估协议及语义分割与目标检测工具的基准测试资源库,以支持可复现、可比较的研究。NordFKB为推进测绘、土地管理和空间规划领域的人工智能方法奠定了坚实基础,并为未来在覆盖范围、时间跨度及数据模态方面的扩展铺平了道路。 |
| 监督学习注重 |
Erin Craig |
PDF |
基于注意力的上下文学习使大型神经网络能够通过有选择性地聚焦于相关示例来进行特定情境下的预测。本文将这一理念应用于表格数据的监督学习方法,如套索回归和梯度提升。我们的目标是:(1) 为每个预测点灵活拟合个性化模型;(2) 保持模型的简洁性与可解释性。 |
该方法通过注意力权重对训练数据进行加权,为每个测试观测值拟合局部模型。注意力作为一种监督式相似性度量,重点关注对结果具有预测性的特征及其交互作用。注意力加权使方法能够以数据驱动的方式适应异质性数据,无需预先设定聚类或相似性标准。此外,该方法具有独特的可解释性优势:针对每个测试观测值,我们能够识别最具预测性的特征和最相关的训练观测值。
我们进一步展示了如何将注意力加权应用于时间序列与空间数据,并提出一种基于注意力加权残差修正的方法,使预训练的树模型能够适应分布偏移。在真实与模拟数据集上的实验表明,注意力加权在保持可解释性的同时提升了预测性能。理论分析证明,在已知子群结构的混合模型数据生成过程中,注意力加权线性模型相较于标准线性模型能够获得更低的均方误差。 |
| 高效持续学习在神经机器翻译中的应用:一种低秩适应方法 | Salvador Carrión | PDF | 神经机器翻译(NMT)中的持续学习面临着灾难性遗忘与重新训练高计算成本的双重挑战。本研究确立了低秩自适应(LoRA)作为一种参数高效框架,以应对专用NMT架构中的这些挑战。首先,我们证明基于LoRA的微调能使NMT模型适应新语言和领域,其性能与全参数技术相当,同时仅占用极小比例的参数空间。其次,我们提出一种采用校准化LoRA模块线性组合的交互式自适应方法。该方法作为无门控的专家混合机制,支持无需重新训练即可对领域和风格进行实时用户可控调整。最后,为缓解灾难性遗忘,我们专门针对低秩分解矩阵设计了一种基于梯度的新型正则化策略。与对完整参数集进行正则化的方法不同,我们的方法利用历史梯度信息对低秩更新施加加权惩罚。实验结果表明,该策略在有效保留原有领域知识的同时促进了新任务的学习,为交互式持续NMT提供了可扩展的范式。 |
| STACHE:强化学习策略的局部黑盒解释方法 | Andrew Elashkin | PDF | 强化学习智能体在稀疏奖励或安全关键环境中常表现出意外行为,亟需可靠的调试与验证工具。本文提出STACHE框架,为离散马尔可夫博弈中智能体的特定动作生成局部黑盒解释。该方法生成的复合解释包含两个互补部分:(1)鲁棒性区域——智能体决策保持不变的连通邻域状态集合;(2)最小反事实——改变决策所需的最小状态扰动。通过利用因子化状态空间的结构,我们提出一种精确的基于搜索算法,规避了代理模型的保真度缺陷。在Gymnasium环境中的实证验证表明,该框架不仅能解释策略行为,还能有效捕捉训练过程中策略逻辑的演变——从随机不稳定的行为到优化稳健的策略——为智能体敏感性与决策边界提供可操作的洞见。 |
bioRxiv
| 标题 |
作者 |
PDF链接 |
摘要 |
| 社区空气污染与青少年早期的神经认知发育呈负相关。 |
Kardan, O. |
PDF |
|
| 串联模块化BK通道结构揭示LRRC26(γ1)、孔道及选择性过滤器在门控调控中的不同化学计量学 |
Chen, G. |
PDF |
|
| 线粒体靶向肽HDAP2可减轻视神经损伤后的线粒体流失与视网膜神经节细胞退化 |
MacNeil, M. A. |
PDF |
|
| 癫痫相关蛋白PCDH19的胞内结构域通过Xlr基因调控皮质神经元树突棘密度的体内研究。 |
Newbold, S. A. |
PDF |
|
| 人诱导多能干细胞定向分化的心脏祖细胞在猪缺血性心肌病模型中成功生成心脏组织移植物,且未诱发室性心律失常。 |
Raval, A. N. |
PDF |
|
| 肾小球弹性模量与基因表达模式界定Alport肾病的两个阶段 |
Yoon, J. |
PDF |
|
| 果蝇性别特异性行为的昼夜节律调控 |
Franco, D. L. |
PDF |
|
| CBP内在无序区域调控乙酰化修饰与基因表达过程。 |
Gelder, K. L. |
PDF |
|
| 沙眼衣原体的细胞内生长通过损害去甲基化作用,导致组蛋白整体超甲基化。 |
Charendoff, C. I. |
PDF |
|
| 基于昏迷模式的自聚焦方法在单细胞水平解析细菌冷休克反应 |
Li, S. |
PDF |
|
medRxiv