跳转至

2025-09-24 每日论文

来源 独立页面
arXiv arXiv
bioRxiv bioRxiv
medRxiv medRxiv

arXiv

标题 作者 PDF链接 摘要
用于微调行为克隆策略的残差离策略强化学习 Lars Ankile PDF 行为克隆(BC)的最新进展已能实现卓越的视觉运动控制策略。然而,这些方法受限于人类示范数据的质量、数据收集所需的人工投入,以及离线数据增加带来的收益递减问题。相比之下,强化学习(RL)通过智能体与环境的自主交互进行训练,已在多个领域展现出显著成效。但直接在现实世界机器人上训练RL策略仍面临挑战,包括样本效率低下、安全性考量,以及长周期任务中稀疏奖励难以学习的问题,尤其对于高自由度(DoF)系统而言。我们提出一种通过残差学习框架融合BC与RL优势的方案:以BC策略作为黑盒基础,通过样本高效的离线策略RL学习轻量级单步残差修正。实验表明,该方法仅需稀疏二元奖励信号即可有效提升高自由度系统在仿真和现实环境中的操作策略。特别值得一提的是,我们实现了首个基于拟人化机器人灵巧手的真实世界RL训练成功案例。研究结果在多项视觉任务中达到最先进性能,为RL的实际部署提供了可行路径。项目网站:https://residual-offpolicy-rl.github.io
CAR-Flow:基于条件感知重参数化的源域与目标域对齐优化流匹配算法

(该翻译采用学术论文标题的经典四段式结构: 1. 保留核心算法简称"CAR-Flow"的音意结合译法 2. "Condition-Aware Reparameterization"译为"条件感知重参数化"准确对应机器学习领域术语 3. "Aligns Source and Target"引申为"源域与目标域对齐"以明确其跨域学习特性 4. "Better Flow Matching"采用"优化流匹配算法"的动宾结构,既保持专业性与中文论文标题的简洁性) | Chen Chen | PDF | 条件生成建模的目标是从包含数据-条件对的样本中学习条件数据分布。为此,基于扩散和流的方法已取得显著成果。这些方法通过学习的流模型,将忽略条件的初始标准高斯噪声传输至条件数据分布。因此模型需要同时学习质量传输和条件注入。为降低模型学习难度,我们提出条件感知重参数化流匹配方法(CAR-Flow)——一种轻量级的学习偏移机制,可对源分布、目标分布或两者同时进行条件化处理。通过重新定位这些分布,CAR-Flow缩短了模型必须学习的概率路径,在实践中实现更快的训练速度。在低维合成数据上,我们可视化并量化了CAR的效果。在高维自然图像数据(ImageNet-256)上,为SiT-XL/2模型配备CAR-Flow可将FID指标从2.07降至1.68,而仅增加不足0.6%的参数量。 | | VolSplat:基于体素对齐预测的前馈式3D高斯泼溅算法重构

(注:该翻译在保持学术术语准确性的基础上进行了以下处理: 1. "Rethinking"译为"重构"以体现方法论创新性 2. "Feed-Forward"采用计算机图形学标准译法"前馈式" 3. "Voxel-Aligned Prediction"译为专业术语"体素对齐预测" 4. 整体采用"算法名称+方法论特征"的中文学术论文标题惯用结构) | Weijie Wang | PDF | Feed-forward 3D Gaussian Splatting (3DGS) has emerged as a highly effective solution for novel view [翻译失败] | | Lyra:基于视频扩散模型自蒸馏的生成式三维场景重建技术

(解析:该标题采用学术翻译的经典结构:主标题音译"Lyra"保持品牌识别性,副标题通过"基于...的...技术"句式清晰呈现技术路径(视频扩散模型自蒸馏)与核心创新点(生成式三维场景重建)。"自蒸馏"对应self-distillation准确传达模型自监督学习特性,"生成式"修饰"三维场景重建"突出其创造性重构能力,符合计算机视觉领域术语规范。) | Sherwin Bahmani | PDF | 生成虚拟环境的能力对于从游戏到物理人工智能领域(如机器人技术、自动驾驶和工业人工智能)的应用至关重要。当前基于学习的三维重建方法依赖于捕获的真实世界多视角数据,但这些数据并非总能轻易获取。尽管视频扩散模型的最新进展展现出卓越的想象力,但其二维特性限制了在需要机器人导航与环境交互的仿真应用。本文提出一种自蒸馏框架,旨在将视频扩散模型中隐含的三维知识提炼为显式的三维高斯溅射(3DGS)表示,从而摆脱对多视角训练数据的依赖。具体而言,我们在传统RGB解码器基础上增配三维高斯溅射解码器,并通过RGB解码器的输出对其进行监督训练。该方法使得三维高斯溅射解码器可完全利用视频扩散模型生成的合成数据进行训练。在推理阶段,我们的模型能够根据文本提示或单张图像实时渲染生成三维场景。该框架还可扩展至基于单目输入视频的动态三维场景生成。实验结果表明,我们的框架在静态与动态三维场景生成任务中均达到最先进性能。 | | 在存在车辆噪声环境下的基于音频的行人检测 | Yonghyun Kim | PDF | 基于音频的行人检测是一项具有挑战性的任务,迄今为止仅在噪声受限环境中进行过探索。我们提出了新数据集、研究成果,并对存在车辆噪声环境下基于音频的行人检测技术现状进行了详细分析。本研究开展三项分析:(一)噪声环境与噪声受限环境间的跨数据集评估;(二)噪声数据对模型性能影响的评估,重点揭示声学场景的影响;(三)模型在域外声音上预测鲁棒性的评估。该新数据集是包含1321小时路侧录音的综合性资源,融合了交通流量密集的声景环境。每条录音均包含16kHz音频数据,并与帧级行人标注及每秒1帧的视频缩略图实现同步。 | | SOE:基于流形上探索的样本高效机器人策略自改进方法 | Yang Jin | PDF | 智能体通过主动探索环境持续优化自身能力而取得进步。然而机器人策略常因动作模式坍塌而缺乏足够的探索能力。现有鼓励探索的方法通常依赖随机扰动,这种方式不仅存在安全隐患,还会导致不稳定、异常的行为,从而限制其有效性。我们提出基于流形探索的自我改进框架(SOE),该框架可增强机器人操作中的策略探索与优化能力。SOE通过学习任务相关因素的紧凑潜在表征,将探索范围约束在有效动作流形上,从而确保安全性、多样性和有效性。该框架可作为即插即用模块与任意策略模型无缝集成,在保持基础策略性能的同时增强探索能力。此外,结构化的潜在空间支持人工引导探索,进一步提升效率与可控性。在仿真和真实任务中的大量实验表明,SOE在各项指标上均优于现有方法,实现了更高的任务成功率、更平稳安全的探索过程以及更卓越的样本效率。这些研究成果确立了流形探索作为样本高效策略自我改进的原则性方法。项目网站:https://ericjin2002.github.io/SOE | | 周期性驱动下的生化网络基序:传递函数与频率响应特性的精选目录 | Nguyen H. N. Tran | PDF | Understanding the function of network motifs in an attempt to gain insight into how their combinatio [翻译失败] | | 有效推理的特征是什么?重新审视思维链的长度、回顾与结构 | Yunzhen Feng | PDF | 大型推理模型(LRMs)在测试阶段需耗费大量算力处理冗长的思维链(CoT)轨迹,但高效CoT的特征仍不明确。尽管已有研究通过附加等待标记延长CoT和增加回顾(重访前期步骤)来提升效果,但近期研究表明简短思考可能优于冗长轨迹。为此,我们在数学与科学推理领域对十种LRMs进行了系统评估。与“越长越好”的论调相反,我们发现盲目延长CoT和增加回顾反而与更低准确率相关。

由于CoT逐步展开,标记级指标容易将冗长性与过程质量混为一谈。我们引入CoT的图结构视角以提取特征,并发现单一指标——失败步骤占比(FSF)(即废弃分支中的步骤比例)——在预测模型正确性时持续优于长度和回顾比率。为探究因果关系,我们设计了两项干预实验:首先在测试时按各指标对候选CoT排序,FSF带来最高pass@1增益;其次通过编辑CoT删除失败分支,显著提升准确率,表明失败分支会干扰后续推理。这些结果共同揭示高效CoT的特征是更少失败,并支持在测试阶段采用结构感知的扩展策略,而非盲目生成冗长CoT。 | | OverLayBench:面向密集重叠场景的布局到图像生成基准测试 | Bingnan Li | PDF | 尽管布局到图像生成领域已取得稳步进展,现有方法在处理包含大量边界框重叠的布局时仍面临挑战。我们识别出两大核心难题:(1)大面积重叠区域;(2)语义区分度极低的重叠实例。通过定性示例与定量分析,我们揭示了这些因素如何降低生成质量。为系统评估该问题,我们提出OverLayScore——一种量化边界框重叠复杂度的创新指标。分析表明,现有基准数据集存在偏向低OverLayScore简单案例的偏差,限制了其在更具挑战性条件下评估模型性能的有效性。为弥补这一空白,我们推出OverLayBench新基准,该基准具备高质量标注数据,并在不同OverLayScore层级间保持均衡分布。作为提升复杂重叠场景性能的初步探索,我们还提出CreatiLayout-AM模型,该模型基于精心构建的非模态掩码数据集进行微调。我们的系列贡献共同为现实挑战场景下实现更鲁棒的布局到图像生成奠定了基石。项目链接:https://mlpc-ucsd.github.io/OverLayBench。 | | MOIS-SAM2:基于范例的Segment Anything Model 2,用于全身MRI中神经纤维瘤的多病灶交互式分割 | Georgii Kolokolnikov | PDF | Background and Objectives: Neurofibromatosis type 1 is a genetic disorder characterized by the devel [翻译失败] |

bioRxiv

标题 作者 PDF链接 摘要
同居影响青鳉鱼的集体决策过程 Nakahata, R. PDF
从强直放电向簇状放电的转换在突触权重动力学中形成吸引子 Jacquerie, K. PDF
具有自旋半粒子的拓扑连接组表面网络能够产生类脑信号并存储记忆。 Sen, S. PDF
脑干成像中的生理噪声校正:基于fMRI数据驱动与外周生理记录驱动方法的实证评估 Krentz, M. PDF
基于拉曼光谱模式揭示细胞中全局化学计量守恒结构 Kamei, K.-i. F. PDF
在草履虫程序性DNA消除过程中,PRC2通过不依赖组蛋白甲基转移酶的功能调控小RNA动态变化 Miro-Pina, C. PDF
逐步表观遗传信号整合调控细胞毒性淋巴细胞的适应性编程 Grassmann, S. PDF
比较转录组学分析揭示小麦颖枯病菌在感病、抗病及非寄主互作过程中互作特异性基因表达模式 Gomez-Gutierrez, S. V. PDF
计算还是权重适应?重新思考可塑性在学习中的作用 Lior, G. PDF
单细胞图谱揭示恒河猴视觉皮层第四层异质性及功能梯度分布

(注:该翻译采用学术论文标题的经典结构,通过"揭示"对应"Uncovers"体现研究发现性质。"Layer 4"专业译为"第四层"符合神经解剖学规范,"Heterogeneity"译为"异质性"保留学科术语特征,"Functional Gradients"译为"功能梯度分布"准确传达神经功能连续变化的科学概念。整体句式符合中文学术标题的凝练要求,同时完整保留原文三个核心科学要素:研究手段(单细胞图谱)、解剖定位(第四层)和科学发现(异质性/功能梯度)。) | Guenther, D. M. | PDF | |

medRxiv

标题 作者 PDF链接 摘要
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF