2025-11-09 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
暗能量巡天第三年观测结果：基于模拟的$w$CDM模型——通过弱引力透镜与星系成图进行深度学习推断。第一部分：分析设计	A. Thomsen	PDF	基于深度学习的数据驱动方法正逐渐成为从宇宙学大尺度结构中提取非高斯信息的强大技术。本研究首次提出了一种基于模拟的推断流程，在暗能量巡天第三年（DES Y3）实际观测配置下，将弱引力透镜与星系成图技术相结合，为后续巡天数据分析工作奠定基础。我们基于CosmoGridV1系列N体模拟开发了可扩展的正向模型，在星图层面生成了超过一百万组DES Y3自洽模拟实现。利用该海量数据集，我们在全巡天球面几何范围内训练深度图卷积神经网络，学习与目标参数互信息近似最大化的低维特征。通过标准化流在十维参数空间（涵盖宇宙学$w$CDM模型、内禀排列及线性星系偏差参数）中实现隐式似然函数的神经密度估计，同时边缘化重子效应、光测红移和剪切偏差等干扰因素。为确保稳健性，我们采用正向模型中的系统性污染和独立Buzzard星系目录生成的合成观测数据，对推断流程进行了全面验证。我们的预测显示宇宙学参数约束获得显著提升，在$\Omega_m - S_8$参数平面上品质因子较基线两点统计实现提高2-3倍，并通过联合探测有效打破了参数简并。这些成果证明了基于深度学习的SBI分析在即将开展的第四阶段宽视场成像巡天中的巨大潜力。
旋转木马：用于多目标自动图像裁剪的高分辨率数据集	Rafe Loya	PDF	自动图像裁剪是一种最大化照片裁剪区域人类感知质量的技术。尽管已有若干研究提出了生成单一裁剪图像的方法，但针对生成多个具有美学吸引力的差异化裁剪图像的研究仍较为匮乏。本文通过探讨现代社交媒体应用场景来阐述该问题的重要性，并构建了一个包含277张相关图像及人工标注的数据集。我们评估了多种单次裁剪模型结合图像分割算法作为预处理步骤的有效性，相关数据集已发布于https://github.com/RafeLoya/carousel。
温和仿人机器人：学习上半身顺应性以实现接触密集的人与物体交互

解析： 1. "GentleHumanoid" 译为"温和仿人机器人"，既保留"Gentle"的温和特性，又明确其仿人机器人属性 2. "Upper-body Compliance" 专业译为"上半身顺应性"，符合机器人学术术语规范 3. "Contact-rich" 译为"接触密集"，准确表达高频接触的交互特性 4. "Human and Object Interaction" 采用"人与物体交互"的标准译法 5. 整体采用破折号连接主副标题，符合中文科技文献标题规范 | Qingzhou Lu | PDF | 人形机器人需在以人类为中心的环境中运行，安全自然的物理交互至关重要。然而当前大多数强化学习策略强调刚性轨迹跟踪而抑制外力作用。现有基于阻抗增强的方法通常局限于基座或末端执行器控制，且侧重于抵抗极端外力而非实现柔顺性。我们提出GentleHumanoid框架，将阻抗控制集成至全身运动跟踪策略以实现上半身柔顺交互。其核心是基于统一弹簧模型的构建方案，可同时模拟抵抗性接触（按压表面时产生的恢复力）与引导性接触（从人类运动数据采样的推拉动作）。该方案确保肩、肘、腕关节产生运动学一致的力，同时使策略能适应多样化交互场景。通过任务可调的力阈值进一步保障安全性。我们在仿真环境和Unitree G1人形机器人上评估了该方法，测试任务涵盖不同柔顺度需求场景：轻柔拥抱、坐立辅助及安全物体操控。相较于基线方法，我们的策略在保证任务成功率的同时持续降低峰值接触力，实现更平滑自然的交互。这些成果标志着人形机器人向安全有效的人机协作及现实环境物体操控迈出了重要一步。 | | 追踪与理解物体变换 | Yihong Sun | PDF | 现实世界中的物体常经历状态转变。无论是苹果被切成碎片，还是蝴蝶破茧而出，追踪这些变化过程对于理解现实物体及其动态规律至关重要。然而，由于物体外观的显著改变，现有方法在状态转变后往往丢失目标追踪。为突破这一局限，我们提出"任意状态追踪"任务：在检测与描述状态变化的同时完成物体跨形态追踪，并同步推出全新基准数据集VOST-TAS。针对该问题，我们开发了零样本系统TubeletGraph，该系统能在物体形态转变后重建丢失目标，并绘制物体状态随时间演变的轨迹图。TubeletGraph首先识别可能被忽略的轨迹段，继而基于语义关联性与空间邻近性先验判断是否进行轨迹整合，最后通过推理新增轨迹生成描述每次观测到状态转变的状态演化图。该系统在形态转变场景下实现了最先进的追踪性能，同时展现出对物体状态转变的深层理解力，以及在复杂物体转变时序定位与语义推理方面的显著潜力。代码、补充结果及基准数据集详见https://tubelet-graph.github.io。 | | InfinityStar：面向视觉生成的统一时空自回归建模框架

（解析说明：1. "Unified Spacetime"译为"统一时空"准确体现跨时空维度的整合特性；2. "AutoRegressive Modeling"采用控制领域标准译法"自回归建模"；3. "Visual Generation"译为"视觉生成"符合计算机视觉领域术语规范；4. 整体采用"框架"作为隐性后缀，符合中文论文命名习惯；5. 冒号后置结构保持原标题的学术表达风格） | Jinlai Liu | PDF | 我们提出InfinityStar——一个面向高分辨率图像与动态视频生成的统一时空自回归框架。基于自回归建模在视觉与语言领域的最新进展，我们的纯离散化方法在单一架构中同时捕捉空间与时间依赖性。这种统一设计通过直接的时间自回归，天然支持多种生成任务，包括文本到图像、文本到视频、图像到视频以及长程交互式视频合成。大量实验表明，InfinityStar在VBench评测中获得83.74分，以显著优势超越所有自回归模型，甚至优于HunyuanVideo等扩散模型竞争对手。在未进行额外优化的情况下，我们的模型生成5秒720p视频的速度比主流扩散方法快约10倍。据我们所知，InfinityStar是首个能够生成工业级720p视频的离散自回归视频生成器。我们将公开全部代码与模型，以推动高效高质量视频生成的进一步研究。 | | X-Diffusion：基于跨具身人类示范数据的扩散策略训练

（注：该翻译在保持学术术语准确性的基础上进行了以下处理： 1. "Cross-Embodiment"译为"跨具身"，准确传达不同物理形态智能体的核心概念 2. "Diffusion Policies"译为"扩散策略"，符合机器学习领域对扩散模型的标准译法 3. 采用"基于...的..."句式，符合中文论文标题的表述规范 4. 保留原文的破折号结构，维持品牌标识的完整性） | Maximus A. Pace | PDF | 人类视频能够快速大规模录制，这使其成为机器人学习极具吸引力的训练数据来源。然而人类与机器人在本体结构上存在根本差异，导致动作执行方式不匹配。直接对人体手部运动进行运动学重定向，可能生成机器人物理上不可行的动作。尽管存在这些底层差异，人类演示仍能提供关于物体操控与交互的宝贵运动线索。我们的核心思路是利用前向扩散过程：当动作被添加噪声时，底层执行差异逐渐消弭，而高层任务指导得以保留。本文提出X-Diffusion这一原则性框架，通过训练扩散策略最大限度利用人类数据，同时避免学习动态不可行的动作。该框架首先训练分类器预测含噪动作的执行主体是人类还是机器人，随后仅当人类动作添加足够噪声（使分类器无法识别其执行主体）时，才将其纳入策略训练。与机器人执行模式匹配的动作在低噪声级监督精细化去噪，而不匹配的人类动作仅在高噪声级提供粗略指导。实验表明，在执行失配情况下进行简单联合训练会降低策略性能，而X-Diffusion能持续提升性能。在五项操控任务中，X-Diffusion相比最佳基线实现了16%的平均成功率提升。项目网站详见：https://portal-cornell.github.io/X-Diffusion/ | | 寒武纪-S：迈向视频空间超感知 | Shusheng Yang | PDF | 我们认为，真正多模态智能的发展需要从被动式、任务驱动的系统与暴力长上下文处理模式，转向更广义的超级感知范式。我们将空间超级感知定义为超越纯语言理解的四个阶段：语义感知（识别所见之物）、流式事件认知（在连续体验中维持记忆）、隐式三维空间认知（推断像素背后的世界结构）以及预测性世界建模（构建过滤和组织信息的内部模型）。现有基准大多仅测试初级阶段，对空间认知的覆盖范围狭窄，且鲜少以需要真实世界建模的方式挑战模型。

为推动空间超级感知的发展，我们提出VSI-SUPER双模块基准：VSR（长程视觉空间回溯）与VSC（持续视觉空间计数）。这些任务需处理任意长度的视频输入，且能有效抵御暴力上下文扩展。我们通过构建VSI-590K数据集并训练Cambrian-S模型，在不牺牲通用能力的前提下使VSI-Bench指标获得30%的绝对提升。然而在VSI-SUPER上的表现仍存局限，表明单纯扩大规模不足以实现空间超级感知。

我们提出预测性感知作为突破路径，并通过概念验证展示：自监督的潜在帧预测器可利用预测误差驱动记忆与事件分割。该方法在VSI-SUPER上显著超越主流闭源基线，证明空间超级感知需要模型不仅能观察，更要具备对经验的预测、筛选和组织能力。 | | SIMS-V：面向空间视频理解的模拟指令调优技术

该翻译方案完整保留了原标题的技术内涵与学术表达规范： 1. 核心术语"SIMS-V"采用首字母缩写直译保持技术一致性 2. "Simulated Instruction-Tuning"精准译为"模拟指令调优"，准确对应预训练语言模型中的指令调优技术范式 3. "Spatial Video Understanding"译为"空间视频理解"，准确传达视频时空特征分析的技术范畴 4. 整体采用"技术载体+方法论+研究领域"的中文学术标题惯用结构，通过连接词"面向"形成逻辑通顺的学术表达 | Ellis Brown | PDF | 尽管在多模态语言模型已实现卓越的高层视频理解能力，其在时空维度上的空间推理仍面临挑战。当前空间训练方法主要依赖现实世界视频数据，但获取具有精确空间标注的多样化影像资料仍是关键瓶颈。为突破此限制，我们提出SIMS-V——一个系统化数据生成框架，通过利用三维模拟器的特权信息，为多模态语言模型创建富含空间信息的视频训练数据。基于该框架，我们通过系统化消融实验探究问题类型、混合策略与数据规模等模拟数据特性对现实世界迁移效果的影响。研究发现，仅需三类核心问题（度量测算、视角依赖推理与时序追踪）即可构建最高效的可迁移空间智能培养方案，其效果优于全面覆盖式训练，且所用问题类型更精简。这一发现实现了高效训练：我们基于2.5万模拟样本微调的70亿参数视频大语言模型，不仅超越720亿参数基线模型，更在严苛的现实世界空间推理基准测试中与专有模型性能相当。该方法展现出强大的泛化能力，在保持通用视频理解性能的同时，在具身化任务与现实空间任务上实现显著提升。 | | 数学分班评估的多方法分析：经典方法、机器学习与聚类方法 | Julian D. Allagan | PDF | 本研究采用经典测验理论、机器学习与无监督聚类相结合的多方法框架，对198名学生参与的40项数学分级测验进行评估。经典测验理论分析显示，55%的试题具有优良区分度（$D \geq 0.40$），而30%的试题区分度不足（$D < 0.20$）需予以替换。第六题（图表解析）展现出最强的区分能力：实现完全区分（$D = 1.000$），获得最高方差分析F统计量（$F = 4609.1$），并达到随机森林最大特征重要性（0.206），贡献了20.6%的预测效能。

机器学习算法表现出卓越性能，随机森林与梯度提升算法的交叉验证准确率分别达97.5%与96.0%。K均值聚类识别出以42.5%为界限的二元能力结构，该分界与院校设定的55%阈值存在差异，表明现行制度可能导致过度划分至补救类别。二聚类解展现出极佳稳定性（自助法调整兰德指数=0.855），且低分群纯度达到完美水平。

多种方法获得的收敛证据支持以下优化方案：替换低区分度试题、实施两阶段评估机制、将随机森林预测与透明化解释系统相结合。本研究证实，多方法融合能为数学分级体系的循证优化提供坚实的实证基础。 | | 遗忘无处不在 | Ben Sanati | PDF | 开发通用学习算法的一个根本性挑战在于：它们在适应新数据时往往会遗忘过去学到的知识。解决这一问题需要从原理层面理解遗忘现象；然而尽管经过数十年研究，学界仍未形成能够揭示学习底层动态机制的统一性定义。我们提出了一种与具体算法及任务无关的理论框架，将遗忘定义为学习器对未来经验的预测分布缺乏自洽性，具体表现为预测信息的丢失。该理论自然衍生出可量化算法遗忘倾向的通用度量方法。为验证理论，我们设计了涵盖分类、回归、生成建模和强化学习的综合实验，通过实证研究揭示了遗忘现象在所有学习场景中的普遍存在性及其对学习效率的重要影响。这些研究成果共同建立了对遗忘现象的原理性认知，为分析和改进通用学习算法的信息保持能力奠定了理论基础。 |

bioRxiv

标题	作者	PDF链接	摘要
对回放现象的统一解释：作为情境驱动的记忆再激活	Zhou, Z.	PDF
SYNGAP1障碍人源化模型中可复现的电生理与行为异常

（注：翻译时采用"选择性演化图景"来准确传达"selective landscape"在进化生物学中的专业内涵，既保留了"选择压力"的动态特性，又通过"图景"体现多维度演化的空间隐喻。同时将"rhizobial symbionts"译为"根瘤菌共生体"以明确其与宿主植物的互作关系，符合微生物共生领域术语规范。） | Guha, S. | PDF | | | 斑马鱼脊髓损伤后，小胶质细胞通过信号素4ab抑制再生性神经发生

说明： 1. 专业术语处理： - "Burkholderia pseudomallei" 采用微生物学标准译名"假鼻疽伯克霍尔德菌" - "Profiling" 译为"特征分析"以准确体现对细菌变种进行系统性表征的研究内涵 - "clinical isolates" 译为"临床分离株"符合微生物学常规表述

句式结构：
采用中文科技论文常用的"对...进行..."句式
保持"变种-来源-类型"的逻辑链条
将长定语"derived from Queensland clinical isolates"处理为前置定语"源自昆士兰临床分离株的"
专业规范：
保留"Queensland"音译"昆士兰"作为专有地名
使用"变种"而非"变异体"以符合微生物分类学表述习惯
整体表述符合中文微生物学研究文献的语言特征 | Coulon, P. M. L. | PDF | | | 葱属植物中的S-烷（烯）基半胱氨酸亚砜是优异的丙烯醛清除剂：对植物次级抗氧化系统的启示

（注：翻译说明： 1. "S-Alk(en)yl-Cysteine Sulfoxides"采用专业命名法译为"S-烷（烯）基半胱氨酸亚砜"，保留化学命名规范 2. "Allium Species"译为"葱属植物"符合植物分类学标准译法 3. "Acrolein Scavengers"译为"丙烯醛清除剂"准确体现其化学功能 4. "Secondary Antioxidants"译为"次级抗氧化剂"与植物生理学专业术语保持一致 5. 冒号后采用意译"启示"既保留学术严谨性又符合中文表达习惯） | Hada, A. | PDF | | | 线粒体G4 DNA被EndoG切割后，通过双链断裂修复途径激活一种灵活的应激依赖性修复反应

解析： 1. "Mitochondrial G4 DNA"译为"线粒体G4 DNA"，保留专业术语G4（G-四链体）的原始表述 2. "Cleavage by EndoG"采用被动语态译为"被EndoG切割"，准确体现内切酶G的酶切作用 3. "Flexible, Stress-Dependent Repair Response"译为"灵活的应激依赖性修复反应"，其中： - Flexible译作"灵活的"体现修复机制的可调节性 - Stress-Dependent译为"应激依赖性"符合细胞生物学表述规范 4. "via Double strand break repair pathways"译为"通过双链断裂修复途径"，完整保留DNA损伤修复的专业术语体系

该翻译严格保持原文的学术逻辑链条：EndoG酶切→G4结构解离→激活修复通路→应激响应机制，符合分子生物学领域的专业表述惯例。 | Rathore, D. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF