2026-05-22 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
通过凸松弛实现分词	Jan Tempus	2026-05-21	PDF	分词是当前自然语言处理流程中不可或缺的组成部分。现有的分词算法（如BPE和Unigram）属于贪心算法——它们仅基于局部最优决策，而未从整体角度考虑最终生成的词汇表。我们转而将分词器构建问题建模为线性规划，并利用凸优化工具求解，由此提出名为ConvexTok的新算法。实验表明，ConvexTok能持续改进分词内在评估指标及语言模型实现的每字节比特数（BpB）；在下游任务性能上亦有提升，但稳定性稍弱。此外，ConvexTok允许用户通过下界验证其分词器与特定目标函数的最优解之间的差距，实证发现，在常见词汇表规模下，该差距可控制在1%以内。
它往哪边移动？诊断并克服视频大语言模型中的方向性运动盲点	Jongseo Lee	2026-05-21	PDF	视频大语言模型（Video-LLMs）在时序视频理解方面取得了快速进展，但许多模型在基本感知原语——图像平面有符号运动方向——上表现失败。在单个物体向左、右、上或下移动的简单视频中，大多数Video-LLMs的表现接近随机水平，而高于随机的情况主要归因于预测偏差，而非真正的方向理解。我们将这种失败称为方向运动盲视。我们通过追踪Video-LLM流水线中的运动方向信息来定位该失败。运动方向在视觉编码器、投影器和LLM隐藏状态中仍保持线性可访问性，但读出过程未能将该信号绑定到正确的口头答案选项上，揭示了方向绑定缺口。尽管合成运动方向指令微调在源领域缩小了这一缺口，但运动方向概念向量分析表明，视觉复杂性削弱了信号强度并限制了域外泛化。我们引入了MoDirect——一个用于运动方向指令微调和评估的数据集家族，以及DeltaDirect——一种诊断驱动的投影器级目标函数，该函数从相邻帧特征差异中预测归一化的二维运动向量。在MoDirect-SynBench上，使用DeltaDirect进行指令微调将运动方向准确率从25.9%提升至85.4%。在MoDirect-RealBench上，DeltaDirect在无真实世界微调数据的情况下，将真实世界运动方向准确率相较于原始基线提升了21.9个百分点，同时保持了标准视频理解性能。代码：https://github.com/KHU-VLL/DeltaDirect
通过神经需求势能实现的可积弹性	Carlos Heredia	2026-05-21	PDF	我们提出可积情境依赖需求网络（ICDN），这是一种面向多产品零售需求的需求优先神经网络模型。该模型将对数需求学习为对数价格的光滑、情境条件函数，从而能够从学习到的需求曲面精确推导出弹性。在Dominick's啤酒数据集上，ICDN相比有向对数-对数基准模型提升了样本外泛化能力，并生成了更稳定、经济上更合理的弹性估计，尤其对于弱识别的交叉价格效应。
Cambrian-P: 基于姿态的视频理解	Jihan Yang	2026-05-21	PDF	相机位姿至关重要。每个视角的位置和朝向定义了一个共享的空间坐标框架，用于关联视频帧之间的观测信息。然而，这一信号在多模态大语言模型（MLLMs）的视频理解中基本缺失——这些模型将帧视为孤立的二维快照，而非人类所感知的持续场景。我们重新审视位姿作为轻量级监督信号的作用，提出Cambrian-P，一种通过逐帧可学习相机令牌和位姿回归头增强的视频MLLM。借助精心设计的采样方案，该模型在VSI-Bench等空间推理基准上取得了4.5-6.5%的显著提升，在另外八个空间和通用视频问答基准上展现出泛化能力，并作为副产品，在ScanNet上实现了流式位姿估计的最优性能。令人惊讶的是，使用来自野外视频的伪标注位姿进行训练进一步提升了通用视频问答基准的表现，表明位姿在空间推理之外也能提供帮助。这些结果共同将相机位姿定位为视频模型理解物理世界的基础信号。
MotiMotion：基于视觉推理的运动控制视频生成	Lee Hsin-Ying	2026-05-21	PDF	当前基于运动控制的图像到视频生成模型严格遵循用户提供的轨迹，但这些轨迹往往稀疏、不精确且因果不完整。这种依赖常导致不自然或不可信的结果，尤其会遗漏次要因果后果。为解决这一问题，我们提出MotiMotion——一种将运动控制重构为"推理-生成"问题的新框架。为促进基于因果推理且符合常识的交互，我们利用无需训练的视觉语言推理器优化主轨迹的图像空间坐标，并合理推测次要运动。为进一步提升运动自然度，我们提出置信度感知控制方案，通过调节引导强度使模型在高置信度计划下严格遵循轨迹，同时在低置信度输入下利用内部生成先验修正伪影。为支持系统性评估，我们构建了新的图像到视频基准MotiBench，包含由运动触发新事件的交互中心场景。基于VLM的评估与MotiBench上的人类研究均表明，MotiMotion生成的视频具有更合理的物体行为与交互，且优于现有方法。
向量策略优化：多样性训练提升测试时搜索性能	Ryan Bahlous-Boldi	2026-05-21	PDF	语言模型现在必须能够开箱即用地泛化到新环境，并在推理时扩展的搜索流程（如AlphaEvolve）中工作，这些流程会通过多种任务特定的奖励函数来选择生成结果。然而，LLM后训练的标准范式是优化一个预设的标量奖励，这往往导致当前LLM产生低熵的响应分布，从而难以展现推理时搜索所需的多样性。我们提出向量策略优化（VPO），这是一种强化学习算法，明确训练策略以预测多样化的下游奖励函数并生成多样化的解决方案。VPO利用了实践中奖励常为向量值的特点，例如代码生成中每个测试用例的正确性，或多种不同的用户画像及奖励模型。VPO本质上可作为GRPO优势估计器的即插即用替代方案，但它训练LLM输出一组解决方案，其中每个解决方案专门针对向量奖励空间中的不同权衡。在四个任务上，VPO在测试时搜索（如pass@k和best@k）中匹配或超越了最强的标量RL基线，且随着搜索预算增加，差距进一步扩大。对于进化搜索，VPO模型解锁了GRPO模型完全无法解决的问题。随着测试时搜索日益标准化，优化多样性可能需成为默认的后训练目标。
AwareVLN：视觉语言导航中的自我意识推理	Wenxuan Guo	2026-05-21	PDF	视觉与语言导航要求智能体在视觉环境中根据语言指令进行移动。现有最先进方法虽能利用视觉语言模型的推理能力实现端到端动作预测，但往往缺乏对智能体、指令和场景之间关系的显式可解释理解。相反，显式构建场景地图进行启发式规划虽直观可行，却依赖额外3D传感器且阻碍大规模视觉语言预训练。为弥合这一鸿沟，我们提出AwareVLN这一新型框架，通过赋予导航模型自我感知推理机制，使其能以完全端到端和数据驱动的方式理解智能体状态与任务进度。本方法包含两项关键创新：(1) 结构推理模块，促进空间与任务导向的自我感知能力；(2) 具备进度划分功能的自动数据引擎，实现高效训练。在Habitat模拟器多个数据集上的大量实验表明，AwareVLN显著超越先前最先进的视觉语言导航方法。项目页面：https://gwxuan.github.io/AwareVLN/。
保持好奇心：用于三维探索的情景语境与持久世界	Lily Goli	2026-05-21	PDF	在稀疏奖励、长周期任务中，探索是学习有用行为的前提，尤其在三维环境中。基于好奇心的强化学习通过智能体对世界的预测模型与现实之间的差异产生的内在奖励来解决这一问题。然而，将这种内在动机迁移到复杂逼真的环境中仍然困难，因为智能体可能陷入局部循环，并在重新访问被遗忘的状态时获得新的奖励。本研究表明，这种失败源于缺乏空间持久性和情景上下文。我们证明，有效的好奇心需要一个持续更新且具有持久性的世界模型，同时智能体需维护一个情景轨迹历史以导航至新区域。我们通过在线三维重建作为持久的世界模型实现这一目标，而智能体策略则参数化为基于RGB观测的序列模型以维持情景上下文。这种设计使训练期间能够有效探索，同时允许智能体在部署时仅使用RGB帧进行导航。仅通过HM3D上的好奇心训练，我们的智能体超越了基于强化学习的主动建图基线，并零样本泛化至Gibson和AI生成的世界。我们的端到端策略能够高效适应下游任务（如摘苹果和图像目标导航），优于从头训练的基线。视频结果请见https://recuriosity.github.io/。
GesVLA：嵌入表征的姿势感知视觉-语言-动作模型	Wenxuan Guo	2026-05-21	PDF	视觉-语言-动作（VLA）模型通过统一感知与动作，在通用机器人操作中展现出强大潜力。然而，现有VLA系统主要依赖文本指令，难以解决复杂场景中多个相似物体带来的空间歧义问题。为突破这一局限，我们引入手势作为并行指令模态，并提出手势感知视觉-语言-动作模型（GesVLA）。该方法将手势特征直接编码至潜在空间，使其同时参与高层推理与低层动作生成，并采用双VLM架构实现手势表征与动作策略的紧密耦合。在数据层面，我们通过将手部模型渲染至真实场景图像，构建了可扩展的手势数据生成流水线，在降低仿真到现实视觉差异的同时，生成包含多样化运动模式及对应指向标注的丰富数据。此外，我们采用两阶段训练策略，使模型同时具备手势感知与动作预测能力。我们在多个真实机器人任务上评估该方法，包括用于验证的受控积木操作任务，以及产品与农产品选择等更实用场景。实验结果表明，融入手势持续提升了目标定位精度与人机交互效率，尤其在复杂杂乱环境中表现显著。项目页面：https://gwxuan.github.io/GesVLA/。
GS-QA：地理空间问答基准	Majid Saeedan	2026-05-21	PDF	大型语言模型（LLM）的最新进展显著提升了问答系统的性能。为应对问答系统评估的挑战，标准化基准测试应运而生。本研究聚焦地理空间问答问题，其中大量地理空间数据以空间数据库或其他形式存在。现有地理空间问答基准存在诸多局限，包括问题数量少、空间谓词有限、输出类型单一且缺乏多源推理能力。我们提出GS-QA——一个可扩展的地理空间问答基准，基于OpenStreetMap和Wikipedia数据构建了28个模板的2800个问答对，涵盖广泛的空间对象、谓词（包括方向过滤和朝向过滤）及答案类型（实体名称、位置、距离、方向、计数、聚合面积/长度）。GS-QA的关键特性在于部分问题需融合多源信息，例如结合OSM的地理空间信息与Wikipedia的事实信息。该基准采用综合评估方法，融合基于文本的问答指标与地理空间特定指标（如距离误差和角度误差）。我们基于三种LLM（GPT-4o、Claude Sonnet 4.6、Ministral-3）结合直接提示、检索增强生成和文本转SQL策略，实现了九种地理空间问答基线系统。实验结果表明，现有方案在简单空间谓词和实体名称输出场景下表现良好，但涉及复杂空间谓词、数值输出类型及多源推理的问题时准确率显著下降，证明地理空间问答仍是亟待深入研究的开放性难题。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
新生儿通过产前语言经验在临界状态附近进行大脑调谐	Encinas, J.	2026-05-22	PDF	语言发展很早就开始了，甚至可能在子宫内就已启动。最新研究结果表明，新生儿对产前接触过的语言产生的神经反应，与对陌生语言的神经反应已存在差异。然而，这些差异化反应背后的神经动态机制仍鲜为人知。我们假设，这种差异化反应源于新生儿因产前语言经验而触发的临界态功能调谐——临界态是一种能最大化信息传递、动态范围和灵活性的状态。为验证这一假设，我们研究了新生儿在接触自然口语刺激前后的静息态脑活动：刺激语言包括产前语言法语、节奏相似的陌生语言西班牙语，以及节奏不同的陌生语言英语。结果显示，母语能引导大脑趋近临界态，平衡网络活动并增强时间相关性。重要的是，我们发现网络状态对节奏不同的语言不敏感，仅对节奏相似的语言产生部分响应。这些结果表明新生儿存在刺激驱动的临界态调谐机制，这可能是早期神经可塑性的基础，其依赖于产前经验，并可能响应早期功能与发育需求。
单词搜索与检索过程中额叶与颞叶区域之间的因果依赖关系	Winzer, B.	2026-05-22	PDF	言语流畅性是一项行为任务，要求从语义类别（类别流畅性）或以特定字母开头的单词（字母流畅性）中生成词汇。尽管词汇生成涉及额叶-颞叶-顶叶网络，但尚无研究探讨颞叶和顶叶区域（负责语义和语音知识表征）的损伤如何削弱左侧三角部和左侧岛盖部（左额下回中参与词汇搜索与提取的两个相邻区域）的神经反应。本研究对52例颞叶病变患者进行了临床功能磁共振成像，在完成类别和字母流畅性任务时采集数据。我们采用基于体素的病变活动映射技术，探究病变位置与三角部和岛盖部任务特异性神经反应强度之间的负相关关系。结果发现：在类别流畅性任务中，左侧前上颞回、左侧颞极、左侧海马、左侧岛叶及下方额枕下束的病变与左侧三角部神经反应减弱相关；右侧海马损伤则与左侧岛盖部神经反应减弱相关。相反，在字母流畅性任务中，左侧后上颞回、左侧缘上回、左侧顶叶岛盖、额枕下束及左侧弓状束的病变与左侧三角部和岛盖部神经反应减弱相关。这些结果表明，当不同搜索策略限制词汇表征的提取时，解剖学上可分离的脑网络与左额下回存在交互作用。
快速成对溯祖使得在不同人类群体中实现近期选择的基因分辨率扫描成为可能。	Korfmann, K.	2026-05-22	PDF	识别塑造近期人类适应的遗传变化，取决于我们从基因组数据中检测选择信号的能力。单倍型扫描的汇总统计量被广泛用于此目的，通过窗口聚合遗传信号，但连锁限制了分辨率，且当选择性清除接近固定时（如整合单倍型评分iHS），其检测效力可能下降。基于古DNA的扫描通过分析时间序列轨迹恢复信号，但大多数人类群体位于现有古DNA数据集的地理范围之外。成对溯祖时间提供了一种补充统计量的方法，可应用于任何现代群体，但由于单倍型对数量呈二次增长，在群体规模上密集计算这些时间面临计算挑战。我们推出gamma_smc_cu，这是Gamma-SMC算法（Schweiger和Durbin，2023）的GPU实现，用于推断成对最近共同祖先时间（TMRCA）。应用于1000基因组计划（3,202个定相样本，对应6,404条单倍型；26个群体和五种不同大陆祖先的829,638个群体内成对组合；约10^12次逐位点后验评估），在屏蔽片段重复后，生成了17,823个常染色体蛋白编码基因的基因级TMRCA景观。该扫描恢复了已知的选择性清除（LCT、SLC24A5、EDAR、FADS1、HERC2、ABCC11），并结合从贫乏到富集的变异类别谱，将单倍型块信号解析至基因水平。在七个案例研究中，两个在正文中展开——GRK2/ADRBK1（chr11q13.2；SAS+EUR）和TREML1/TREM2（chr6p21.1）——其余五个（IFIH1 chr2q24/IBS、CCDC92 chr12q24/CDX、SLC6A15 chr12q21/CHS、BPIFA2 chr20q11/GIH、CLEC6A chr12p13/CDX）在补充信息（SI）中呈现。值得注意的是，TREML1/TREM2是一个共享的走出非洲信号——在19个非非洲1000基因组面板中，有16个面板的群体内排名低于1%尾部，而PopHumanScan和五个标志性单倍型扫描均遗漏了它。先前10 kb窗口平均iHS扫描稀释了聚集在约5 kb基因体内的极端位点簇，而我们自己的基因级iHS独立地在三个南亚面板（BEB、STU、ITU；全基因组前0.4%）中恢复了该位点。我们通过近期西欧亚古DNA扫描的970万个逐变异选择后验值，对七个案例进行了交叉验证。BPIFA2被一致检测到（s约1.8%每代）。GRK2和CCDC92在侧翼变异中达到检测阈值，但未在其自身基因体内达到，而TREML1/TREM2簇低于该阈值。为校准新颖性，我们对照一个扩展的八个目录集审查了候选景观，该目录集涵盖精选单倍型扫描、当前最大的西欧亚古DNA线索以及近期26群体iHS细化；我们的绝大多数位点与至少一个先前条目重叠，仅少数——包括TREML1/TREM2——仍未被标记。本工作的贡献在于基因级分辨率、系统性古DNA交叉验证，以及一个可重复使用的TMRCA景观，用于补充古DNA面板。
Cas9结合双链DNA小环的结构揭示DNA形状对Cas9靶标识别的影响	Lee, K.-Y.	2026-05-22	PDF	CRISPR-Cas9是一种RNA引导的内切核酸酶，可在特定位点切割双链DNA，并已被改造为强大的基因组操作工具。Cas9通过Cas9核糖核蛋白与DNA双链体之间协调的多种构象转变来识别其靶标。这些转变以及由此产生的Cas9靶向特异性，预计会受到被称为DNA形状的集体双链体物理特性的显著影响。为了增进目前对DNA形状与Cas9靶标识别之间相互作用的有限理解，我们解析了两种与嵌入松弛95碱基对DNA双链小环中的同源靶标结合的SpyCas9冷冻电镜结构。Cas9结合的DNA片段在PAM结合和R-loop起始中涉及的相互作用与Cas9结合线性DNA时观察到的相似。然而，R-loop仅限于少于三个碱基对，从而干扰了Cas9的切割。完全解析的小环DNA保留了其整体形状。当Cas9局部解开原间隔区时，闭环拓扑结构限制了配对PAM远端DNA双链体的运动，从而干扰了R-loop的延伸。这些数据为DNA形状与Cas9结构和功能之间的相互作用提供了详细见解，并可能为不同DNA拓扑环境中的基因组编辑和操作提供启示。
JPT2/HN1L 以细胞类型特异性方式作为NAADP结合蛋白发挥作用	Ottenheijm, R.	2026-05-22	PDF	烟酰胺腺嘌呤二核苷酸磷酸（NAADP）是一种第二信使，通过靶向多种钙离子通道（包括双孔通道TPC1/2、瞬时受体电位黏脂蛋白1 TRPML1或兰尼碱受体1型RYR1）引发细胞内钙库释放钙离子。NAADP激活钙通道需要结合蛋白（如JPT2/HN1L和LSM12）的参与。目前，这些蛋白的功能仅在少数细胞系和极有限的原代细胞中得到分析，但在已知利用NADP信号传导的细胞类型中，其生理相关性仍不明确。本研究通过构建JPT2/HN1L缺陷型（Jpt2/Hn1l-/-）小鼠，评估JPT2/HN1L蛋白对血小板聚集、心肌细胞、肥大细胞及CD4+ T细胞钙信号的影响。已知NAADP参与胶原相关肽（CRP）诱导的血小板聚集，但JPT2/HN1L缺失并未改变这一过程。功能性钙成像显示，JPT2/HN1L在NAADP介导的钙释放中具有显著的细胞类型特异性作用。在搏动的心室肌细胞中，β-肾上腺素能刺激已知会诱发致心律失常性自发性舒张期钙瞬变，而Jpt2/Hn1l-/-心肌细胞中该瞬变频率未发生改变。此外，抗原诱导的腹腔肥大细胞（PMCs）钙瞬变在Jpt2/Hn1l-/- PMCs中亦无变化。然而，CD4+ T细胞对JPT2/HN1L表现出显著依赖性。在T细胞受体/CD3刺激后，Jpt2/Hn1l-/- CD4+细胞中全局钙升高及早期NAADP驱动的钙微域（在TCR/CD3结合后数十毫秒内发生，作为下游免疫激活的起始信号）显著降低。我们得出结论：JPT2/HN1L是T细胞中NAADP介导钙释放的必需蛋白，但在心肌细胞、血小板和肥大细胞中（至少针对所用激动剂）并非必需。据此推测，LSM12可能补偿了JPT2/HN1L的缺失。综上，JPT2/HN1L并非普遍必需的NAADP结合蛋白，而是具有细胞类型特异性，并在T细胞钙信号中发挥关键功能。
铁可用性调控PIN介导的生长素运输与分布，从而调节拟南芥根的向地性生长。	Fang, Y.	2026-05-22	PDF	铁（Fe）是植物生长的必需微量元素，而生长素激素是调控根系向重力性等发育过程的关键因子。本研究探究了拟南芥中铁营养与生长素介导的根系生长之间相互作用的分子机制。表型分析显示，缺铁显著改变根系构型和根系向重力性，且这些表型在铁吸收突变体irt1-1中更为严重。遗传分析表明，缺铁并未加重pin2突变体eir1-4的向重力性缺陷，提示铁有效性通过PIN2依赖途径调控根系向重力性。进一步的转录组分析证实，缺铁显著改变了大量与生长素通路相关基因的表达，为观察到的生理关联提供了分子证据。综上，本研究揭示了铁有效性通过调控PIN介导的生长素运输与分布来调节根系向重力性生长，为理解植物如何整合营养信号与发育程序提供了新见解。
黄芩毛状根培养物中黄芩苷的分子与空间表征	Fedorova, A. M.	2026-05-22	PDF	本研究利用X射线衍射分析及一系列核磁共振波谱技术，对体外黄芩根培养物的水醇提取物中分离得到的黄芩苷进行了结构验证。样品的晶体分子结构被确认与黄芩苷一致。1H、13C{1H}、二维1H-1H COSY、1H-13C HSQC、1H-13C HMBC谱图证实，其化学位移、信号多重性、积分强度及自旋-自旋耦合常数均与目标化合物结构完全吻合。在谱图的脂肪族区域检测到微量杂质信号，总含量不超过5 mol%。这些结果证实了黄芩苷（一种备受关注的生物活性黄酮苷）的高纯度及结构独特性。
拟南芥幼苗去黄化过程中光形态建成抑制因子SPA2与SPA3的功能分化	Cao, Z.	2026-05-22	PDF	COP1/SPA泛素连接酶是光形态建成的关键抑制因子，光受体通过失活该连接酶启动光信号传导。四个SPA蛋白（SPA1-SPA4）在植物生长过程中赋予COP1功能特异性，但其分子机制尚不明确。本研究采用转基因幼苗中的结构域交换策略，探究SPA2与SPA3的功能分化。结果表明，在光照生长的幼苗中，两者N端激酶结构域分别决定了SPA2与SPA3的蛋白质稳定性差异。SPA2的不稳定性与其N端结构域在光照下特异性结合光敏色素A的能力相关，提示光敏色素A促进CUL4DET1/COP1依赖的SPA2降解，但不影响SPA3。我们发现SPA2与SPA3的卷曲螺旋结构域和WD重复结构域在抑制光形态建成活性上存在显著差异，其中SPA2的这两个结构域具有更强的抑制活性。因此，SPA2兼具强效抑制活性与光诱导不稳定性。我们得出结论：SPA2响应光照而进化的不稳定性，可抵消其固有的强抑制活性，从而在黑暗条件下维持幼苗黄化，并在幼苗出土接触光照后通过SPA2降解快速降低COP1活性，启动光合生长。
由碳浓缩机制介导的CO2固定使蓝藻能够快速响应氮缺乏。	Saldivar, E. V.	2026-05-22	PDF	蓝藻是海洋中主要的生物质生产者，其生态成功依赖于对二氧化碳和氮等营养物质动态可用性的响应能力，这需要不同的适应机制。为应对氮缺乏，蓝藻会可逆地进入休眠模式。在低二氧化碳水平下，二氧化碳浓缩机制（CCM）支持其碳固定。尽管已有研究表明CCM和氮同化共享部分调控通路，但CCM如何影响对氮缺乏的响应仍未被充分探索。本研究利用缺乏CCM组分的沿海蓝藻聚球藻PCC 7002突变体，揭示了CCM介导的高碳固定速率调控β-蓝藻对氮缺乏的响应速度。我们首先发现，在大气二氧化碳浓度下，CCM突变体无法诱导典型的氮缺乏响应。然而，在较高二氧化碳浓度下，CCM突变体能够诱导氮缺乏响应。通过结合Rubisco动力学模型与不同二氧化碳浓度下氮响应速度的测量，我们证明氮缺乏响应速度与Rubisco羧化速率呈线性正相关。进一步研究表明，CCM对氮响应的调控也存在于亲缘关系较远的淡水蓝藻细长聚球藻PCC 7942中，提示该调控机制在β-蓝藻中具有广泛作用。本研究证实，蓝藻CCM的二氧化碳固定是氮缺乏响应的关键调控因子，有利于对动态环境做出快速响应。
权力越大，责任越大：科学导师如何影响早期研究人员的福祉	Simon Martinez de Goni, X.	2026-05-22	PDF	科研指导对早期职业研究人员（ECRs）的体验至关重要，然而从ECR视角探讨其在塑造福祉与留任率方面的作用仍缺乏充分研究。我们分析了来自65个国家2604名博士前、博士后及前研究人员的匿名调查反馈。总体而言，76%的受访者表示导师态度对其心理健康产生中度或重度影响。尽管多数人出于职业使命感进入学术界，但在前研究人员中，与导师的负面经历（48%）与工作不稳定、经济困境并列成为最常见的离职原因之一。伤害最常关联于沟通不畅、忽视福祉、微观管理和竞争氛围。相比之下，ECR更看重支持型而非命令式指导、定期沟通、合理期望及尊重个人时间。这些发现表明导师行为是影响ECR福祉与留任率的关键且可调节因素，并凸显了加强机构问责制、导师培训及将指导视为科研文化核心要素的资助激励措施的必要性。

medRxiv

标题	作者	发布日期	PDF链接	摘要
用于医院抗菌药物耐药性预测与受限干预优化的数字孪生系统	Triantafyllidis, C. P.	2026-05-22	PDF	医院抗菌药物耐药性（AMR）源于患者周转、异质性患者-工作人员接触模式、抗生素驱动的宿主内选择以及不完善的监测之间一系列复杂的相互作用。我们提出了一种医院AMR数字孪生模型，该模型将机械模拟与时间图学习相结合，通过不断演变的日常接触网络预测耐药性的出现，并支持干预规划。我们的方法包含两个层面：利用图神经网络和Transformer进行预测建模，以及通过数学规划优化提供决策支持。主要预测任务旨在判断未来耐药感染的传播更可能由医院内源性传播和选择驱动，还是由入院时的输入性感染驱动。我们在完全观测和部分观测两种设置下评估了该任务，使用了基线基准测试以及消融实验、监测扰动和分布偏移压力测试。在标准条件下，该模型表现出极强的预测性能，尤其在获取真实系统状态时表现突出，且在部分观测下仍能提供有效信息。消融实验表明，接触权重信息相对稳健，而压缩节点特征表示在观测不完整时对性能的削弱更为显著。监测压力测试进一步显示，在某些场景下可容忍延迟或低频报告，但在更严重的观测变化下阈值校准变得脆弱。在更广泛的流行病学和监测变化中，真实状态模型通常保持较强的排序能力，而部分观测下的性能则较不稳定。当模型直接在变化后的场景中训练时，性能相比零样本迁移有所提升，表明数字孪生能够适应新的、未见过的运行条件，但跨场景的可迁移性仍有改进空间，尤其在仅获得部分监测数据时。我们还通过将医院状态分支到冲击-超级传播者场景下的小型筛查与隔离策略库，评估了干预条件预测。学习到的模型支持有效的状态内策略排序，并常能识别出优于基线防控方案或避免恶化结果的策略。同一数字孪生模型还可支持受限干预选择，但可靠部署需要仔细校准、提升部分观测下的鲁棒性，并扩展更广泛的策略库。
从模糊到清晰：HAGAN——用于远程OCT图像增强的混合注意力生成对抗网络	Arian, R.	2026-05-22	PDF	常规光学相干断层扫描（OCT）对早期视网膜疾病检测至关重要，但频繁就诊给患者和医疗系统带来负担。远程OCT（包括居家成像）可实现更频繁的监测，但因操作不专业、环境不可控以及成本和便携性导致的硬件限制，图像质量存在差异。为最大化OCT的部署，硬件和软件必须克服这些挑战。本文聚焦软件部分，开发了基于物理信息的仿真框架Siloton仿真软件，通过向高质量OCT图像引入物理精确的噪声和采集伪影，模拟远程OCT采集过程，生成模拟患者操作不佳的低质量图像。基于此数据，我们提出HAGAN（混合注意力生成对抗网络），用于增强低质量OCT图像。该模型从基线U-Net逐步发展为包含混合注意力的对抗框架。通过系统评估和消融研究，确定性能最佳的U-Net骨干网络EfficientNet-B1作为生成器，在跳跃连接中引入注意力门控，在解码器中加入自注意力机制，并与基于VGG19的判别器配对。训练采用多目标损失函数，结合像素、结构、感知、边缘和对抗损失。实验表明，HAGAN在标准增强指标和临床相关的视网膜层分割下游任务中，始终优于基线方法和现有最优方法，在保持诊断意义结构的同时提升视觉质量。该模型对渐进增加的噪声/伪影水平表现出强鲁棒性，即使在严重退化条件下仍能保持稳定性能。这些结果凸显了HAGAN在支持未来患者操作OCT监测的可靠增强及有效远程视网膜疾病管理方面的潜力。
伊贺市基于人群的队列研究基线特征——伊贺市队列研究	Hishida, A.	2026-05-22	PDF	我们于2013年3月至2014年7月在伊贺市开展了一项基于人群的基因组队列研究，命名为伊贺市队列研究。在伊贺市民的配合和伊贺市综合医院医务人员的支持下，与J-MICC（日本多机构协作队列）研究合作，招募了1578名参与者，旨在基于个体基因组信息建立个性化疾病预防的证据。在获得知情同意后，采用基于J-MICC研究实际使用的问卷进行访谈，收集了吸烟行为、饮酒习惯、体力活动、食物摄入（食物频率问卷，FFQ）以及包括教育背景在内的社会经济状况（SES）信息。生物样本与健康体检样本一同采集，包括血清、血浆和血沉棕黄层，经离心处理后从中提取基因组DNA。同时，我们为伊贺市民提供了幽门螺杆菌（HP）根除的公共服务，并正在进行微创诊断检测以早期发现癌症的研究。在排除不符合条件的参与者和退出者后，目前有1505名受试者处于随访中。该队列研究收集的数据有望有效用于促进伊贺市民及日本国民的健康。
两项纵向人群队列研究中的维生素D缺乏、补充与衰老相关发病率和死亡率	Israel, A.	2026-05-22	PDF	维生素D缺乏与衰老及机体恢复力的生物学过程相关，但其与长期系统性衰老轨迹的关系尚未完全阐明。我们分析了来自两大医疗系统的纵向电子健康记录数据：以色列全国性健康组织Leumit Health Services（LHS）和覆盖超1.2亿人去标识化电子健康记录的美国联邦研究网络TriNetX。在LHS中（2009-2020年），我们检测了来自468,500余名成年人的超过167万份血清25-羟基维生素D[25(OH)D]样本。在LHS中开展纵向匹配分析，并通过TriNetX中22.3万对倾向评分匹配病例对严重缺乏相关关联进行外部验证。在两个人群中，严重缺乏与代谢、心血管、神经退行性、肾脏、微血管及死亡相关结局（包括糖尿病、心肌梗死、脑血管疾病、痴呆、透析、糖尿病视网膜病变和足趾截肢）的风险增加相关。为评估补充剂的潜在健康效益及可调节性，我们利用药房配药购买数据纵向建模维生素D补充情况，预测血清25(OH)D随时间的变化。补充剂与死亡率及多种衰老相关结局的剂量依赖性降低独立相关，但对皮肤恶性肿瘤（与紫外线暴露密切相关的阴性对照结局）未显示相应保护性关联。为强化因果推断，我们进一步采用逆概率治疗加权边际结构Cox模型分析死亡率，结果与传统校正模型一致，且部分效应更强。综上，这些发现支持严重维生素D缺乏是人类系统性衰老脆弱性和年龄相关多病共存的重要且潜在可调节的决定因素。
探索多病共存的遗传结构及其对长新冠风险的影响	Bauer, S. J. M.	2026-05-22	PDF	多病共存（即多种长期疾病同时存在）是老龄化人口面临的重大挑战，尽管其与长新冠存在共同的流行病学风险因素，但两者的遗传结构及关联机制仍不明确。我们分析了86,756名年龄≥65岁的英国生物银行白人参与者中的多病共存模式，识别出涵盖神经退行性、心脏、胃肠道、肌肉骨骼、血管、癌症及眼病六大疾病领域的六个聚类。全基因组关联研究及后GWAS分析揭示了五个聚类中的显著位点，包括APOE、LPA和CDKN2B-AS1，其遗传相关性模式与已知疾病关系一致。值得注意的是，APOE-APOC1位点的一个共享变异对肌肉骨骼和血管聚类表现出相反效应方向，这与两者的负遗传相关性相符。通过遗传相关性和孟德尔随机化探究多病共存与长新冠的关系，未发现显著共享遗传结构或因果效应的证据。这些结果表明，多病共存聚类代表具有生物学结构的部分可遗传表型，而长新冠与多病共存的遗传重叠有限。
FORGE：功能引导的OCT表征用于青光眼内表型分析	Moradi, M.	2026-05-22	PDF	由于疾病异质性和单模态结构成像的局限性，青光眼内表型分型仍具挑战。我们提出FORGE（功能引导型青光眼内表型OCT表征）框架，这是一种跨模态对比学习框架，在训练过程中将视野功能信号作为特权监督信号整合进来，生成功能信息增强的视网膜神经纤维层（mRNFL）表征，并通过学习到的空嵌入实现仅基于OCT的推理。在5,372例MEEI配对检查中，FORGE识别出9种临床特征鲜明的mRNFL内表型，其进展速率存在显著差异（MD斜率-0.2至-1.8 dB/年，P<0.001），相比仅基于OCT的基线方法，聚类效果提升22%（FCM）和11%（GMM）。在74,077例UK Biobank影像上的外部评估证实了其泛化能力，临床风险关联性显著改善（r=-0.33对比r=0.04）。遗传分析发现，与仅基于OCT的表型分型相比，新增12个全基因组显著青光眼位点。FORGE证明，功能引导的表征学习能够生成具有临床和遗传一致性的内表型，对需要大规模人群结构推断的多模态疾病具有广泛适用性。
在一项高风险队列研究中，GLP-1受体激动剂治疗与手术伤口愈合之间的关联	Adams, J. C.	2026-05-22	PDF	目的本研究评估全身性GLP-1受体激动剂（GLP-1RA）使用对高风险手术人群（包括糖尿病患者）手术伤口愈合的影响，及其对围手术期规划和愈合结果的启示。方法这项回顾性队列研究比较了术后伤口未愈合的成年手术患者，根据其是否使用GLP-1RA进行分组。结局指标包括愈合状态、伤口闭合时间及手术干预次数。结果队列包含35名未使用GLP-1RA的患者和16名使用GLP-1RA的患者，两组基线特征相似，但使用组静脉功能不全患病率显著更高。尽管所有患者的中位闭合时间相似，但使用组所需手术干预次数更少，且伤口闭合率与非使用组存在显著差异。在糖尿病患者中，所有GLP-1RA使用者的愈合情况均显著优于非使用者。创新点GLP-1RA治疗对高风险重建及软组织手术伤口愈合的影响此前尚不明确。本初步队列研究填补了这一空白，初步提示GLP-1RA使用与改善伤口愈合及减少术后干预相关。这些发现通过识别可优化高风险人群手术结局的全身性药理学因素，可能为围手术期实践提供参考。结论GLP-1RA使用与更高的愈合率和更少的干预次数相关，尤其在糖尿病患者中。这些结果支持其在手术伤口愈合中的有益作用，并需开展更大规模的多中心研究。
BSO-AD：一种用于表示和协调ADRD中行为社会知识的本体	Li, H.	2026-05-22	PDF	行为与社会因素（BSFs）显著影响阿尔茨海默病及相关痴呆症（ADRD）的风险、发生和进展，但BSF相关知识仍分散于异构来源中，给数据协调和证据整合带来关键挑战。为填补这一空白，我们提出了行为与社会数据及知识本体（BSO-AD），这是一个符合FAIR原则的语义资源，用于表示和协调BSF与ADRD相关知识。BSO-AD遵循既定本体设计原则开发，复用了现有本体和受控术语体系，包括健康社会决定因素本体、药物重定位导向的阿尔茨海默病本体、AD-Onto、ICD-9-CM和ICD-10-CM。BSF与ADRD之间的关系通过文献挖掘获得。BSO-AD包含1,690个类、152个对象属性、49个数据属性和40个注释属性。通过基于Hootation的领域专家评审和可扩展的LLM辅助本体评估框架进行的本体评估，显示出高领域覆盖率和强语义一致性。BSO-AD为BSF相关ADRD研究中的数据协调和知识整合提供了语义基础，而LLM辅助评估框架则支持可扩展的自动化本体评估。
使用真实世界证据比较TTR稳定剂治疗ATTR-CM的有效性：Acoramidis对比Tafamidis	Wright, R.	2026-05-22	PDF	背景：转甲状腺素蛋白（TTR）淀粉样变性心肌病（ATTR-CM）的进展可导致充血加重，需强化利尿治疗（DI）、因心力衰竭住院（HFH）及死亡。氯苯唑酸是2019年至2024年美国唯一获批的ATTR-CM治疗药物，而2024年获批的阿可拉米迪可实现近乎完全（≥90%）的TTR稳定化。由于缺乏头对头试验，需真实世界比较效果（CE）数据指导治疗选择。目的：评估新发ATTR-CM患者中阿可拉米迪与氯苯唑酸的真实世界CE。方法：采用Komodo Healthcare Map®美国索赔数据（经Claritas标记化处理）进行回顾性研究。纳入2024年12月11日至2025年4月30日期间新启用阿可拉米迪或氯苯唑酸、有≥1次处方索赔（首次定义为索引日期）且索引日期前连续入组≥6个月的患者，随访至脱组、死亡、换药或研究结束日期（2025年7月31日）。结局包括DI（口服袢利尿剂启动或等效剂量升级、肠外袢利尿剂使用或加用噻嗪类利尿剂）以及DI、HFH（住院记录中任意位置有心衰相关ICD-10-CM诊断编码）和死亡率的复合终点。倾向性评分加权平衡基线特征、疾病严重程度、合并症负担及基线用药。采用加权Cox比例风险模型评估时间至事件结局。结果：加权后，阿可拉米迪组（n=170）与氯苯唑酸组（加权样本量=448）患者基线特征可比（平均年龄78.6 vs 78.7岁；男性80.0% vs 80.2%），平均随访时间分别为139天和143天。DI累积发生率曲线早期即分离并持续分化，阿可拉米迪组DI事件风险较氯苯唑酸组显著降低43%（11.8% vs 20.5%；HR 0.57；95% CI 0.35-0.92；P=0.021）。阿可拉米迪组复合终点风险亦显著降低34%（17.6% vs 26.4%；HR 0.66；95% CI 0.44-0.99；P=0.046）。结论：在这项针对新发患者的首个真实世界CE研究中，阿可拉米迪组DI事件及DI、HFH和死亡率复合终点风险均显著低于氯苯唑酸组，提示启用阿可拉米迪可能改善临床稳定性。需通过更长随访、更大队列和/或前瞻性临床结局进行进一步评估。
父母迁移是否影响儿童的免疫覆盖率？一项印度横断面分析研究	Dhalaria, P.	2026-05-22	PDF	引言-印度的免疫接种计划是全球规模最大的之一，每年有2700万新生儿，通过全民免疫计划（UIP）在提高覆盖率方面取得了显著进展。然而，挑战依然存在，多种因素共同导致了现有问题，其中父母迁移是重要因素之一。迁移一直是社会经济和人口结构变化的关键驱动力，尤其是在中低收入国家（LMICs）。具体而言，需要更深入地了解近期移民在免疫接种方面的脆弱性。为此，本研究探讨了母亲近期迁移与印度12-23月龄儿童全程免疫覆盖率之间的关联。数据与方法-本研究使用了第五次全国家庭健康调查（2019-21年）的数据。研究关注的结局变量是儿童是否接种了所有基础疫苗（全程免疫）。主要预测变量是儿童的迁移状态。我们采用一系列多变量逻辑回归模型，在模型中设置部分数据限制条件，分析了全程免疫与儿童近期迁移之间的关系。结果-结果显示，移民儿童与非移民儿童的全程免疫覆盖率相差17%。与未近期迁移的儿童相比，近期迁移儿童的全程免疫优势比（OR: 0.39, 95% CI: 0.35-0.43）更低。即使在家庭财富五分位和社会群体中，近期迁移的12-23月龄儿童全程免疫的可能性也较低。结论-本研究提供了重要的定量证据，表明儿童近期迁移（不足3年）是影响印度12-23月龄儿童免疫覆盖率的关键因素，也是预测其全程疫苗接种的重要指标。在不同家庭财富水平和社会群体中，近期迁移始终与较低的全程免疫覆盖率相关。研究表明，近期迁移儿童是易受影响的亚群体，面临在一岁前无法完成所有基础疫苗接种的风险。