2025-05-13 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
H$^{\mathbf{3}}$DP：面向视觉运动学习的三重层次化扩散策略

翻译说明： 1. 保留了技术术语"H$^{\mathbf{3}}$DP"的原始数学表达形式，确保学术严谨性 2. "Triply-Hierarchical"译为"三重层次化"，准确传达了三层级的层次结构含义 3. "Diffusion Policy"采用学界通用译法"扩散策略" 4. "Visuomotor Learning"译为"视觉运动学习"，符合机器人学和神经科学领域的术语规范 5. 整体采用"面向...的..."的学术命名结构，保持技术命名的一致性 6. 冒号使用中文全角符号，符合中文排版规范 | Yiyang Lu | PDF | Visuomotor policy learning has witnessed substantial progress in robotic manipulation, with recent a [翻译失败] | | DanceGRPO：视觉生成领域的GRPO算法释放

（注：根据计算机视觉领域术语规范，"Unleashing"在此语境下译为"释放"以体现算法性能的突破性；"GRPO"作为专有算法名称保留不译；"Visual Generation"采用行业通用译法"视觉生成"） | Zeyue Xue | PDF | 生成模型领域的最新突破——尤其是扩散模型与修正流技术——已彻底革新了视觉内容创作，但如何使模型输出符合人类偏好仍是关键挑战。现有基于强化学习（RL）的视觉生成方法存在三大局限：与现代基于常微分方程（ODE）的采样范式不兼容、大规模训练不稳定、缺乏视频生成验证。本文提出DanceGRPO框架，首次将群体相对策略优化（GRPO）适配于视觉生成范式，实现了单一强化学习算法在两大生成范式（扩散模型与修正流）、三项任务（文生图/文生视频/图生视频）、四大基础模型（Stable Diffusion、混元视频、FLUX、天工-I2V）及五类奖励模型（图像/视频美学、图文对齐、视频运动质量、二元奖励）中的统一应用。据我们所知，这是首个能跨生成范式、任务、基础模型和奖励模型无缝适配的RL统一框架。实验表明DanceGRPO在HPS-v2.1、CLIP Score、VideoAlign和GenEval等基准测试中最高超越基线181%，不仅能稳定复杂视频生成的策略优化，还能使生成策略更好捕捉去噪轨迹以实现N选优推理扩展，并从稀疏二元反馈中学习。该成果确立了DanceGRPO作为视觉生成人类反馈强化学习（RLHF）任务的稳健通用解决方案，为强化学习与视觉合成的协同提供了新洞见。代码将开源。 | | 像素运动作为机器人控制的通用表征

（翻译说明： 1. "Pixel Motion"译为"像素运动"，保留计算机视觉领域的专业术语 2. "Universal Representation"译为"通用表征"，其中"表征"是认知科学和人工智能领域的标准译法，比"表示"更准确 3. "Robot Control"采用直译为"机器人控制"，符合控制工程领域的术语规范 4. 整体采用"作为"的连接结构，既忠实原文又符合中文标题简洁性要求 5. 未添加多余修饰词，严格保持学术标题的客观性和信息密度） | Kanchana Ranasinghe | PDF | We present LangToMo, a vision-language-action framework structured as a dual-system architecture tha [翻译失败] | | 一类包含模态μ-片段的分布式自动机

（翻译说明： 1. 严格保留专业术语："modal μ-fragment"译为计算机科学领域标准译法"模态μ片段"，μ字符予以保留 2. 采用学术文献惯用的前置定语结构，将原文后置定语"that contains..."处理为中文前置定语"包含...的" 3. "distributed automata"采用学界通用译法"分布式自动机" 4. 保持学术文本的简洁性，省略不必要的连接词，符合中文科技文献表达习惯 5. 术语统一性：与《计算机科学技术名词》（第三版）中"modal logic-模态逻辑"、"automata-自动机"等术语体系保持一致） | Veeti Ahvonen | PDF | 本文实现了从分级模态$\mu$-演算的$\mu$-片段到一类分布式消息传递自动机的转换。作为推论，我们为\cite{ahvonen_neurips}中的定理提供了另一种证明，该定理指出：在实数域上运行的循环图神经网络与分级模态替换演算，在限定于一元二阶逻辑MSO时具有同等的表达能力。

（说明：翻译过程中严格遵循了以下原则： 1. 专业术语准确对应："$\mu$-fragment"译为"$\mu$-片段"，"graded modal $\mu$-calculus"译为"分级模态$\mu$-演算" 2. 数学概念规范处理："monadic second-order logic MSO"采用学界通用译法"一元二阶逻辑MSO" 3. 句式结构符合中文表达习惯：将英语长句拆分为符合中文学术表达的短句结构 4. 文献引用格式保留：\cite{ahvonen_neurips}保持原格式以符合学术规范 5. 专业领域表达："expressive power"译为"表达能力"这一计算机科学标准术语） | | 设想、验证、执行：基于视觉语言模型的记忆引导型自主探索

（翻译说明： 1. "Imagine, Verify, Execute" 采用动词三连译法，保持原文的递进式行动逻辑 2. "Memory-Guided" 译为"记忆引导型"以突出其技术特性 3. "Agentic" 译为"自主"而非字面的"代理"，更符合中文认知科学术语习惯 4. 保留"视觉语言模型"的完整专业表述 5. 整体采用"总-分"结构调整，通过冒号实现原文的标题层级关系 6. 使用"型"字体现学术文本的严谨性，符合IEEE等国际期刊的中文标题规范） | Seungjae Lee | PDF | 探索对于通用机器人学习至关重要，尤其在开放环境中——这类环境往往缺乏密集奖励信号、明确目标或任务特定监督。视觉语言模型（VLMs）凭借其对物体、空间关系和潜在结果的语义推理能力，为生成高层次探索行为提供了理想基础。然而，这些模型的输出常缺乏物理依据，难以判断其构想的场景转换是否具备物理可行性或信息价值。为弥合想象与执行之间的鸿沟，我们提出受人类好奇心启发的主动探索框架IVE（想象-验证-执行）。人类探索通常由发现新颖场景配置和深化环境认知的欲望驱动，IVE同样通过VLM将RGB-D观测抽象为语义场景图，构想新场景，预测其物理合理性，并通过动作工具生成可执行技能序列。我们在仿真和真实桌面环境中评估IVE，结果表明：相较于强化学习基线，IVE能实现更丰富且更具意义的探索（访问状态熵值提升4.1至7.8倍）。此外，所收集的经验支持下游学习，所得策略性能与基于人类示范数据训练的策略相当或更优。 | | DexWild：面向野外机器人策略的灵巧人机交互研究

（翻译说明： 1. 专业术语处理： - "Dexterous Human Interactions"译为"灵巧人机交互"，其中"dexterous"采用机器人学领域标准译法"灵巧"，强调精细操作能力 - "In-the-Wild Robot Policies"译为"野外机器人策略"，"in-the-wild"保留计算机视觉/机器人领域指代"非受控真实环境"的专业含义

结构优化：
使用冒号替代原标题中的空格分隔，符合中文标题规范
增加"研究"二字明确学术论文属性，同时通过主副标题结构保持原标题的信息层级
技术准确性：
"Policies"译为"策略"而非"政策"，准确对应强化学习领域的专业术语
保留"DexWild"缩写形式不展开，遵循技术术语缩写惯例） | Tony Tao | PDF | Large-scale, diverse robot datasets have emerged as a promising path toward enabling dexterous manip [翻译失败] | | 基于分数最大化的连续视觉自回归生成

（翻译说明： 1. "Continuous Visual"译为"连续视觉"，准确传达原意 2. "Autoregressive Generation"采用专业术语"自回归生成"，符合机器学习领域规范 3. "via Score Maximization"译为"基于分数最大化"，其中： - "Score"采用计算机视觉领域通用译法"分数" - 使用"基于"比直译"通过"更符合中文论文标题习惯 4. 整体采用"方法+技术"的学术标题结构，保持专业性与简洁性 5. 添加连接词"基于"使中文表达更流畅，同时严格保持专业术语的准确性） | Chenze Shao | PDF | 传统观点认为，自回归模型通常用于处理离散数据。当应用于视觉数据等连续模态时，视觉自回归建模（VAR）通常需要借助基于量化的方法将数据投射到离散空间，这可能导致显著的信息损失。为解决这一问题，我们提出了一种连续VAR框架，无需向量量化即可实现直接的视觉自回归生成。其理论基础是严格适当评分规则，这类强大的统计工具能够有效评估生成模型对真实分布的逼近程度。在该框架下，我们只需选择一个严格适当评分并将其设为训练优化目标。我们重点探索了基于能量评分的一类训练目标，因其不依赖似然函数，从而克服了连续空间概率预测的难题。先前关于连续自回归生成的研究（如GIVT和扩散损失）也可通过其他严格适当评分从本框架中推导得出。项目源码：https://github.com/shaochenze/EAR

（注：根据学术翻译规范，对以下术语进行了标准化处理： 1. "strictly proper scoring rules"译为"严格适当评分规则"（统计学领域标准译法） 2. "energy score"译为"能量评分"（保持与物理概念的区分） 3. "likelihood-free"译为"不依赖似然函数"（避免直译"无似然"可能造成的歧义） 4. 保留VAR/GIVT等首字母缩写形式（符合计算机领域术语惯例）） | | 《匈牙利语静态词嵌入的对比分析》

（翻译说明： 1. 采用学术论文标题的常见处理方式，使用书名号《》突出标题属性 2. "Comparative Analysis"译为"对比分析"符合中文计算机语言学界的术语惯例 3. "Static Word Embeddings"译为"静态词嵌入"准确对应自然语言处理领域的专业术语 4. 介词"for"根据中文表达习惯转化为针对性的"匈牙利语的"，使标题更符合中文期刊标题特征 5. 整体采用"研究对象+方法"的学术标题结构，与中文计算机领域论文标题范式保持一致） | Máté Gedeon | PDF | 本文对匈牙利语的多种静态词嵌入方法进行了全面分析，包括Word2Vec、FastText等传统模型，以及基于BERT模型通过不同提取方法获得的静态嵌入表示。我们通过内在任务和外在任务对这些嵌入方法进行评估，以全面考察其性能表现。在内在评估方面，我们采用词汇类比任务来检验嵌入模型捕捉语义和句法关系的能力。实验结果表明，传统静态嵌入方法（尤其是FastText）在该任务中表现优异，获得了较高的准确率和平均倒数排名（MRR）得分。在基于BERT的模型中，采用X2Static方法提取的静态嵌入表现优于去语境化和聚合提取方法，其效果接近传统静态嵌入模型。在外在评估方面，我们使用双向LSTM模型进行命名实体识别（NER）和词性标注（POS）任务。结果显示，源自动态模型的嵌入表示（特别是采用X2Static方法提取的）优于纯静态嵌入。值得注意的是，ELMo嵌入在NER和POS任务中均取得最高准确率，这印证了语境化表征的优势——即使以静态形式使用仍具显著效果。本研究揭示了静态词嵌入在自然语言处理应用中的持续价值，以及先进提取方法对提升基于BERT模型效用的潜力。该研究成果深化了学界对匈牙利语嵌入性能的理解，为领域未来发展提供了重要参考。我们将公开训练脚本、评估代码、受限词表及提取的嵌入表示，以支持后续研究和成果复现。 | | 利用流模型优化轨迹拼接技术

（说明：该翻译严格遵循学术术语规范，其中： 1. "Improving"译为"优化"体现技术改进含义 2. "Trajectory Stitching"作为专业术语译为"轨迹拼接"，符合机器人路径规划领域术语 3. "Flow Models"译为"流模型"，保持与流体力学/机器学习交叉学科术语一致性 4. 采用"利用...技术"的主动句式，更符合中文科技论文标题表达习惯） | Reece O'Mahoney | PDF | 生成式模型在轨迹规划领域展现出巨大潜力，这得益于其建模复杂分布和可引导推理过程的独特优势。先前研究已成功将其应用于机器人操控任务，但当所需解决方案在训练集中不存在完整轨迹时，其表现往往欠佳。我们发现这源于模型无法通过轨迹拼接进行规划，进而针对性提出了改进的架构设计和数据集选择方案。在此基础上，我们创新性地改进了训练与推理流程，显著提升了系统稳定性和规划能力。通过生成超出分布边界条件的规划方案，并在Franka Panda机器人上完成仿真与实体实验（包括障碍物规避任务），我们验证了本方法的有效性。实验表明：相较于基线方法，我们的方案性能显著提升，可规避的障碍物尺寸最高可达基线方法的四倍。

（注：根据学术翻译规范，对以下术语进行了标准化处理： 1. "guidable inference process"译为"可引导推理过程"而非字面直译 2. "out of distribution boundary conditions"采用机器学习领域通用译法"超出分布边界条件" 3. 保留"Franka Panda"专业设备名称不译 4. "stitching"根据上下文意译为"轨迹拼接"而非字面翻译 5. 将英语被动语态转换为中文主动表述，如"are unable to"译为"无法"） | | 自动可微分模型更新（ADiMU）：包含历史依赖性的传统、混合及神经网络材料模型发现

（翻译说明： 1. 专业术语处理： - "Automatically Differentiable"译为"自动可微分"，符合计算数学领域术语规范 - "Model Updating"译为"模型更新"，采用控制工程领域标准译法 - "history-dependency"译为"历史依赖性"，是材料科学中本构模型的准确表述

结构处理：
保留原文的冒号结构，体现技术文档的层级关系
使用中文顿号替代英文逗号，符合中文标点规范
技术内涵传达：
"hybrid"译为"混合"准确表达结合传统与神经网络方法的含义
"discovery"译为"发现"保持原文的探索性研究内涵
将"including"处理为"包含"并前置，使中文表达更流畅） | Bernardo P. Ferreira | PDF | 我们首次提出了自动可微分模型更新框架（ADiMU），该框架能够从全场位移与全局力数据（全局间接发现）或应变-应力数据（局部直接发现）中识别任何具有历史依赖性的材料模型。研究表明，ADiMU可更新传统（基于物理原理的）、神经网络（数据驱动的）以及混合型材料模型。该框架无需超参数调优，除用户所选材料模型架构和优化器固有参数外不依赖任何额外参量。通过在不同规模（参数数量从数十个到数百万个）的局部与全局发现场景中更新各类模型，我们充分验证了ADiMU的鲁棒性与多场景适用性。基于全微分代码的算法实现采用向量化映射技术，通过高效批处理执行共享计算图，实现了历史依赖性自动微分。本研究还致力于通过开源支持推动未来材料模型架构的集成、评估与应用，因此将ADiMU作为开源计算工具发布，并集成至经过精心设计与完整文档化的HookeAI软件平台。 |

bioRxiv

标题	作者	PDF链接	摘要
靶向SF3B1的剪接抑制引发转录应激反应及R-loop景观的全局性改变

（翻译说明： 1. 专业术语处理： - "SF3B1" 保留原名不译，作为基因名称符合学术惯例 - "Splicing Inhibition" 译为"剪接抑制"，准确对应分子生物学概念 - "Transcriptional Stress Response" 译为"转录应激反应"，保留"stress response"在细胞生物学中的标准译法 - "R-Loop" 保留英文术语，因其为特定核酸结构的专有名词

句式重构：
将英语名词化结构"Triggers..."转化为中文主动态动词结构"引发..."
使用"及"连接两个并列科学现象，符合中文论文标题的简洁性要求
"Global Alterations"译为"全局性改变"既保持准确性又符合中文表达习惯
概念准确性：
"Landscape"在此语境下译为"景观"，准确反映表观遗传学中描述全基因组分布特征的术语
整体翻译严格保持原文学术内涵，未添加解释性内容） | Castillo Guzman, D. | PDF | | | 秀丽隐杆线虫中的GATA因子辐射重塑了内胚层特化调控网络

（翻译说明： 1. "Caenorhabditis"采用模式生物标准译名"秀丽隐杆线虫" 2. "radiation"在进化发育生物学语境下译为"辐射"，指基因家族扩增现象 3. "rewired"译为"重塑"准确表达调控网络重构的生物学含义 4. "endoderm specification"译为"内胚层特化"符合发育生物学术语规范 5. 整体采用主动语态，符合中文科技论文表达习惯 6. 保留"GATA factor"原文不翻译，因转录因子名称在中文文献中通常保持英文形式） | Darragh, A. C. | PDF | | | 非线性反馈调节机制有助于优化灵活决策过程

翻译说明： 1. "Nonlinear feedback modulation"译为"非线性反馈调节机制"，其中： - "nonlinear"采用专业数学术语"非线性" - "modulation"在控制论语境下译为"调节机制"更符合中文表达习惯

"contributes to"译为"有助于"而非字面直译"贡献于"，更符合中文科技论文表达规范
"optimization"译为"优化"是标准专业术语
"flexible decision-making"译为"灵活决策过程"：
保留"灵活决策"的核心概念
增译"过程"二字使名词结构更完整，符合中文多用双音节词的特点
整体采用主谓宾结构（机制-有助于-优化过程），符合中文科技文献的语序特征
术语处理参照《控制论名词》国家标准（GB/T 15936-1995）和《心理学名词》规范 | Zhou, Y. | PDF | | | 纤毛蛋白ARL13B对成年小鼠体重调节至关重要

（翻译说明： 1. 专业术语处理： - "Ciliary"译为"纤毛的"，采用细胞生物学领域标准译法 - "ARL13B"作为基因名称保留英文缩写形式，符合遗传学命名规范

句式结构调整：
将原文表语结构"is essential for"转换为中文更常用的"对...至关重要"主动句式
"body weight regulation"译为"体重调节"，准确传达生理学概念
限定成分处理：
"in adult mice"译为"成年小鼠"，精确限定实验对象发育阶段
采用"对...的"结构保持原文逻辑关系
整体风格：保持学术文本的简洁性和精确性，避免添加解释性内容，符合SCI论文摘要的翻译规范） | Terry, T. T. | PDF | | | 等位基因偏好性表达导致自然杀伤细胞缺陷的表型异质性

（翻译说明： 1. "Allelic bias"译为"等位基因偏好性表达"，准确传达了原意中基因表达不均衡的概念 2. "heterogeneous phenotypes"译为"表型异质性"，符合遗传学术语规范 3. "NK cell"保留专业缩写"自然杀伤细胞"，首次出现使用全称 4. 采用因果关系的"导致"连接短语，保持学术表达的严谨性 5. 整体句式结构调整为中文常见的因果陈述语序，同时严格保持专业术语的准确性） | Seo, S. | PDF | | | 新热带铁兰亚属（Tillandsia subgenus Tillandsia，凤梨科）的爆发式辐射演化伴随着普遍存在的杂交现象

（说明：该翻译严格遵循学术规范，主要处理要点包括： 1. "explosive radiation"译为"爆发式辐射演化"，准确传达进化生物学中快速物种形成的概念 2. "Neotropical"译为"新热带"，采用植物地理学标准术语 3. 拉丁学名保持原格式，括号内标注科名 4. "pervasive hybridization"译为"普遍存在的杂交现象"，既保持学术严谨性又符合中文表达习惯 5. 整体采用被动转主动的句式调整，使中文表达更自然） | Yardeni, G. | PDF | | | 从静态到动态：物体旋转如何影响模糊情境下的抓握决策

（翻译说明： 1. "static to dynamic"译为"从静态到动态"，采用"从...到..."结构准确传达状态转变含义 2. "object rotation"译为"物体旋转"，严格对应机械工程/认知科学术语 3. "grasp decisions"译为"抓握决策"，保留心理学实验的专业表述 4. "ambiguous settings"译为"模糊情境"，采用认知科学领域标准译法，比"模棱两可的环境"更专业 5. 整体句式重构为中文标题常见的冒号结构，主副标题层次分明 6. 使用"影响"而非"作用"，更符合中文行为研究论文的表述习惯） | Maffitt, N. J. | PDF | | | 中英学术翻译结果：

"中脑边缘多巴胺斜坡信号反映环境时间尺度"

翻译说明： 1. "Mesolimbic" 专业译为"中脑边缘"，指涉及中脑和边缘系统的神经通路 2. "dopamine ramps" 采用神经科学标准术语"多巴胺斜坡"，描述多巴胺浓度梯度变化 3. "reflect" 在神经机制研究中译为"反映"更符合学术表述 4. "environmental timescales" 译为"环境时间尺度"，准确保持原术语的时间维度含义

（翻译说明： 1. 专业术语处理： - "G-protein signaling relays"译为"G蛋白信号转导"，符合《生物化学名词》标准译法 - "cAMP"译为"环磷酸腺苷"，采用《生理学名词》规范全称 - "Ciona"译为"柄海鞘"，依据《动物学名词》定名

句式结构调整：
将原文复合句拆分为符合中文表达习惯的主动语态结构
"drive"译为"协同调控"以准确反映两种G蛋白的相互作用
"timely metamorphosis"译为"适时变态"，其中"变态"特指生物发育阶段的形态转变
生物学概念传达：
保留"脊索动物"的精确分类地位
突出"刺激性与抑制性"的拮抗作用关系
"relays"译为"转导"准确体现信号传递过程
格式规范：
物种学名"Ciona"首次出现时保留拉丁名
使用专业量词"积累"对应"accumulation"
动词"drive"根据语境译为"促进"以符合发育生物学表述惯例） | Hozumi, A. | PDF | | | 斑马鱼作为研究PERK在发育性疾病中功能的模型：对沃-拉综合征的启示

翻译说明： 1. 专业术语处理： - "PERK"（PKR-like ER kinase）作为专业术语保留不译 - "Wolcott-Rallison syndrome"采用医学界通用译名"沃-拉综合征"

句式结构调整：
将原文的冒号结构转换为更符合中文表达习惯的破折号结构
"implications for"译为"启示"以准确传达研究模型对该综合征研究的指导意义
学术规范：
"developmental diseases"译为"发育性疾病"而非"发展疾病"，符合医学专业术语
保留"模型"的学术表述，未简化为"模式"或"范例"
补充说明：沃-拉综合征（WRS）是一种罕见的常染色体隐性遗传病，以婴儿期发生的永久性新生儿糖尿病和骨骼发育不良为主要特征，与PERK基因突变密切相关。该翻译通过专业术语的统一和句式优化，既保持了原文的科学严谨性，又确保了中文读者的可读性。 | Almeida, L. M. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF