2026-05-23 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
通过凸松弛实现分词	Jan Tempus	2026-05-21	PDF	分词是当前自然语言处理流程中不可或缺的组成部分。现有的分词算法（如BPE和Unigram）属于贪心算法——它们在局部最优决策中未将整体词汇表纳入考量。我们转而将分词器构建问题形式化为线性规划，并利用凸优化工具求解，由此提出名为ConvexTok的新算法。实验表明，ConvexTok能持续改进内在分词指标及语言模型实现的每字节比特数（BpB）；在下游任务性能上亦有提升，但稳定性稍弱。此外，ConvexTok允许用户通过下界验证其分词器与特定目标的最优性差距，实证发现常见词汇量规模下该差距可控制在1%以内。
它往哪边移动？诊断并克服视频大语言模型中的方向性运动盲症	Jongseo Lee	2026-05-21	PDF	视频大语言模型（Video-LLMs）在时间视频理解方面取得了快速进展，但许多模型在基本感知原语——图像平面有符号运动方向——上表现失败。在单个物体向左、右、上或下移动的简单视频中，大多数Video-LLMs的表现接近随机水平，而高于随机的情况主要归因于预测偏差，而非真正的方向理解。我们将这种失败称为方向运动盲视。我们通过追踪Video-LLM流水线中的运动方向信息来定位失败原因。运动方向在视觉编码器、投影器和LLM隐藏状态中仍保持线性可访问性，但读出过程未能将此信号绑定到正确的口头答案选项，揭示了方向绑定差距。尽管合成运动方向指令微调在源领域缩小了这一差距，但运动方向概念向量分析表明，视觉复杂性削弱了信号强度并限制了域外泛化。我们引入了MoDirect——用于运动方向指令微调和评估的数据集系列，以及DeltaDirect——一种诊断驱动的投影器级目标，从相邻帧特征差异中预测归一化的二维运动向量。在MoDirect-SynBench上，使用DeltaDirect进行指令微调将运动方向准确率从25.9%提升至85.4%。在MoDirect-RealBench上，DeltaDirect在无真实世界微调数据的情况下，将真实世界运动方向准确率较原始基线提升21.9个百分点，同时保持标准视频理解性能。代码：https://github.com/KHU-VLL/DeltaDirect
通过神经需求势实现的可积弹性	Carlos Heredia	2026-05-21	PDF	我们提出可积上下文相关需求网络（ICDN），这是一种面向多产品零售需求的需求优先神经网络模型。该模型将对数需求学习为对数价格的平滑、上下文条件函数，从而能够从学习到的需求曲面中精确推导出弹性。在Dominick's啤酒数据集上，ICDN相比有向对数-对数基准模型提升了样本外泛化能力，并生成了更稳定、经济上更合理的弹性估计，尤其对于弱识别的交叉价格效应。
Cambrian-P：基于姿态的视频理解	Jihan Yang	2026-05-21	PDF	相机位姿至关重要。每个视角的位置和方向定义了一个共享的空间坐标框架，用于关联视频帧之间的观测信息。然而，这一信号在多模态大语言模型（MLLMs）的视频理解中基本缺失——这些模型将帧视为孤立的二维快照，而非人类所感知的持续场景。我们重新审视位姿作为轻量级监督信号的作用，并提出Cambrian-P——一种通过逐帧可学习相机令牌和位姿回归头增强的视频MLLM。借助精心设计的采样方案，该模型在VSI-Bench等空间推理基准上实现了4.5-6.5%的显著提升，在另外八个空间及通用视频问答基准上展现出泛化能力，并作为副产品在ScanNet上达到了流式位姿估计的最优水平。令人惊讶的是，使用来自野外视频的伪标注位姿进行训练进一步提升了通用视频问答基准的表现，表明位姿在空间推理之外也能发挥作用。这些结果共同将相机位姿定位为视频模型理解物理世界的基础信号。
MotiMotion：基于视觉推理的运动控制视频生成	Lee Hsin-Ying	2026-05-21	PDF	当前基于运动控制的图像到视频生成模型严格遵循用户提供的轨迹，但这些轨迹往往稀疏、不精确且因果不完整。这种依赖常导致不自然或不合理的结果，尤其会遗漏次要因果后果。为解决这一问题，我们提出MotiMotion——一种将运动控制重构为"推理-生成"问题的新框架。为促进基于因果推理且符合常识的交互，我们利用无需训练的视觉语言推理器优化主轨迹的图像空间坐标，并合理推测次要运动。为提升运动自然度，我们提出置信度感知控制方案，通过动态调节引导强度，使模型在高置信度计划下严格遵循轨迹，同时在低置信度输入下利用内部生成先验修正伪影。为支持系统评估，我们构建了新的图像到视频基准MotiBench，包含由运动触发新事件的交互中心场景。基于VLM的评估及MotiBench上的人类研究均表明，MotiMotion生成的视频具有更合理的物体行为与交互，且优于现有方法。
向量策略优化：多样性训练提升测试时搜索性能	Ryan Bahlous-Boldi	2026-05-21	PDF	语言模型现在必须能够开箱即用地泛化到新环境，并在推理时扩展的搜索流程（如AlphaEvolve）中工作，这些流程会通过多种任务特定的奖励函数来选择生成结果。然而，LLM后训练的标准范式优化的是预设的标量奖励，这往往导致当前LLM产生低熵的响应分布，从而难以展现推理时搜索所需的多样性。我们提出向量策略优化（VPO），这是一种RL算法，能够显式训练策略以预测多样化的下游奖励函数并生成多样化的解决方案。VPO利用了实践中奖励常为向量值这一特点，例如代码生成中每个测试用例的正确性，或多种不同的用户画像及奖励模型。VPO本质上是GRPO优势估计器的即插即用替代方案，但它训练LLM输出一组解决方案，其中每个解决方案专门针对向量奖励空间中的不同权衡。在四个任务中，VPO在测试时搜索（如pass@k和best@k）上匹配或超越了最强的标量RL基线，且随着搜索预算增加，差距进一步扩大。对于进化搜索，VPO模型解锁了GRPO模型完全无法解决的问题。随着测试时搜索日益标准化，优化多样性可能需成为默认的后训练目标。
AwareVLN：面向视觉语言导航的自我感知推理	Wenxuan Guo	2026-05-21	PDF	视觉与语言导航（VLN）要求智能体在视觉环境中将语言指令与自身移动相结合。现有最先进方法虽利用视觉语言模型（VLM）的推理能力进行端到端动作预测，但往往缺乏对智能体、指令和场景之间关系的显式可解释理解。相反，为启发式规划显式构建场景地图虽直观可行，却依赖额外3D传感器且阻碍大规模视觉语言预训练。为弥合这一差距，我们提出AwareVLN——一种新型框架，通过赋予导航模型自我感知推理机制，使其能以完全端到端和数据驱动的方式理解智能体状态与任务进度。本方法包含两项关键创新：（1）结构推理模块，促进空间与任务导向的自我感知能力；（2）带进度划分的自动数据引擎，实现高效训练。在Habitat模拟器多个数据集上的大量实验表明，AwareVLN显著优于先前最先进的视觉语言导航方法。项目页面：https://gwxuan.github.io/AwareVLN/。
保持好奇心：面向3D探索的情景上下文与持久世界	Lily Goli	2026-05-21	PDF	在稀疏奖励、长周期任务中，探索是学习有效行为的前提，尤其在三维环境中。基于好奇心的强化学习通过智能体对世界的预测模型与现实之间的差异产生的内在奖励来解决这一问题。然而，将这种内在动机迁移到复杂、逼真的环境中仍然困难，因为智能体可能陷入局部循环，并在重新访问被遗忘的状态时获得新的奖励。在本研究中，我们证明这种失败源于缺乏空间持久性和情景上下文。我们表明，有效的好奇心需要一个持续更新且具有持久性的世界模型，同时智能体需维护一个情景轨迹历史以导航至新区域。我们通过在线三维重建作为持久的世界模型来实现这一点，而智能体策略则参数化为基于RGB观测的序列模型以维持情景上下文。这种设计在训练期间实现了有效探索，同时允许智能体在部署时仅使用RGB帧进行导航。通过仅在HM3D上基于好奇心训练，我们的智能体超越了基于强化学习的主动建图基线，并零样本泛化至Gibson和AI生成的世界。我们的端到端策略能够高效适应下游任务，如摘苹果和图像目标导航，性能优于从头训练的基线。视频结果请见https://recuriosity.github.io/。
GesVLA：嵌入表征的体态感知视觉-语言-动作模型	Wenxuan Guo	2026-05-21	PDF	视觉-语言-动作（VLA）模型通过统一感知与动作，在通用机器人操作中展现出巨大潜力。然而，现有VLA系统主要依赖文本指令，难以解决复杂场景中多个相似物体带来的空间歧义问题。为突破这一局限，我们引入手势作为并行指令模态，并提出手势感知视觉-语言-动作模型（GesVLA）。该方法将手势特征直接编码至潜在空间，使其同时参与高层推理与低层动作生成，并采用双VLM架构实现手势表征与动作策略的紧密耦合。在数据层面，我们通过将手部模型渲染到真实场景图像上，构建了可扩展的手势数据生成流水线，在降低仿真到真实视觉差异的同时，生成包含多样化运动模式及对应指向标注的丰富数据。此外，我们采用两阶段训练策略，使模型同时具备手势感知与动作预测能力。我们在多个真实机器人任务上评估了该方法，包括用于验证的受控积木操作任务，以及产品与农产品选择等更实际的应用场景。实验结果表明，融入手势持续提升了目标定位精度与人机交互效率，尤其在复杂杂乱环境中表现显著。项目页面：https://gwxuan.github.io/GesVLA/。
GS-QA：地理空间问答基准	Majid Saeedan	2026-05-21	PDF	大型语言模型（LLM）的最新进展显著提升了问答系统的性能。为应对问答系统评估的挑战，标准化基准测试应运而生。本研究聚焦地理空间问答问题，其中大量地理空间数据以空间数据库或其他形式存在。现有地理空间问答基准存在诸多局限，包括问题数量少、空间谓词有限、输出类型单一、缺乏多源推理能力。我们提出GS-QA——一个可扩展的地理空间问答基准，基于OpenStreetMap和Wikipedia数据构建了28个模板的2800个问答对，覆盖广泛的空间对象、谓词（包括方向过滤和朝向过滤）及答案类型（实体名称、位置、距离、方向、计数、聚合面积/长度）。GS-QA的关键特性在于部分问题需结合多源信息，例如OSM的地理空间信息与Wikipedia的事实信息。该基准采用综合评估方法，融合基于文本的问答指标与地理空间特定指标（如距离误差和角度误差）。我们基于三种LLM（GPT-4o、Claude Sonnet 4.6、Ministral-3）结合直接提示、检索增强生成和文本转SQL方法，实现了九种地理空间问答基线系统。实验结果表明，现有方案在处理简单空间谓词和实体名称输出时表现良好，但在涉及复杂空间谓词、数值输出类型及多源推理的问题上准确率显著下降，证明地理空间问答仍是值得深入研究的开放性挑战。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
脑穿梭靶标的表达水平因个体而异，而非因脑区、疾病、年龄或性别而异。	Santa Maria, A. R. P.	2026-05-23	PDF	利用内源性受体介导的血脑屏障转运机制，将治疗药物与脑穿梭体融合，为向中枢神经系统递送大分子药物和生物制剂提供了有前景的策略。其临床开发中一个基础但未经检验的假设是：这些内皮受体靶点在不同个体间及不同患者群体中具有一致的表达水平。本研究通过单细胞和单核转录组学及定量蛋白质组学，分析了来自11个大型队列的离体人脑微血管内皮细胞和脑微血管中11种经典脑穿梭靶点的基因与蛋白表达。结果显示，这些靶点在不同脑区、性别、年龄以及正常健康状态与四种主要神经退行性疾病（阿尔茨海默病、帕金森病、亨廷顿病和肌萎缩侧索硬化症）之间的表达高度稳定，631项比较中有612项（97%）无显著差异。此前在啮齿动物模型中报道的脑穿梭靶点区域异质性未在人体组织中观察到，且疾病状态对所有检测疾病的影响极小。与此形成鲜明对比的是，所有11种靶点及所有数据模式中，不同人口统计学和临床分组内的个体间靶点丰度始终存在差异。这些发现将个体受体丰度确立为脑穿梭转化研究（包括临床试验设计和患者分层）中一个关键且此前未被表征的变量。
小胶质细胞Foxo3塑造帕金森病中多巴胺能神经元的脆弱性	Texier, B.	2026-05-23	PDF	帕金森病（PD）等神经退行性疾病源于神经元应激与周围组织环境的复杂相互作用，但调控这种互作的决定因素仍不完全清楚。尽管神经元对线粒体功能障碍和蛋白毒性应激的反应已被广泛研究，但小胶质细胞状态对疾病进展的贡献仍不明确。本研究发现转录因子Foxo3主要通过小胶质细胞而非神经元内在机制调控多巴胺能神经元脆弱性。在响应线粒体复合物I抑制和α-突触核蛋白聚集时，多巴胺能样细胞中Foxo3被快速诱导并转位至细胞核，表明保守的神经元应激反应被激活。然而，神经元特异性敲除Foxo3虽能减弱早期帕金森样转录特征，但未在体内提供持续性神经保护。相反，在MPTP中毒和α-突触核蛋白驱动的病理互补小鼠模型中，小胶质细胞特异性敲除Foxo3对多巴胺能神经元变性提供了强效且持久的保护。转译组学分析显示，Foxo3缺失诱导小胶质细胞在基线状态下发生广泛转录重塑，建立富含免疫相关和吞噬通路的独特状态，且与组织稳态兼容。值得注意的是，尽管神经毒性损伤后转录重编程程度极小，但神经保护作用依然显著，提示疾病结局由基线小胶质细胞状态而非损伤后转录反应强度决定。机制上，神经保护作用与选择性调控离散信号节点相关，包括强化TREM2-TYROBP轴和减弱胞内信号放大通路，而非广泛抑制炎症程序。这些发现表明Foxo3并非主要调控小胶质细胞活化强度，而是定义决定后续神经免疫动力学的基线构型和反应阈值。综上，本研究确定基线小胶质细胞状态是神经退行性轨迹的决定因素，并将Foxo3定位为该过程的核心调控因子。更广泛而言，这些发现构建了以小胶质细胞状态设定（而非单纯反应强度）主导多巴胺能神经元脆弱性的理论框架，为靶向帕金森病神经免疫互作的治疗策略提供了潜在启示。
Acan-Cre小鼠品系的生成与验证：用于选择性标记小脑核团B类兴奋性神经元	Cheron, J.	2026-05-23	PDF	小脑核是小脑的主要输出结构，由一组高度保守的细胞类型构成。每个小脑核中存在两类兴奋性细胞——A类和B类，它们介导小脑的所有兴奋性输出。为获得针对这些细胞类型的遗传学工具，本研究鉴定出Acan可作为B类细胞的标记基因，并构建了Acan-P2A-Cre基因敲入小鼠品系。实验证明该Acan-Cre品系能选择性标记小脑核中的B类神经元，并验证了其在病毒投射追踪中的应用。这一新型小鼠品系为研究小脑核组织结构和功能提供了宝贵的遗传学工具。
在早期红系分化过程中，GATA2染色质结合的短暂增强	Hobbs, J. W.	2026-05-23	PDF	红细胞分化需要转录因子与染色质靶点结合的精确调控，在此过程中造血祖细胞丧失多能性并激活谱系程序。GATA2维持祖细胞特性，通常认为随着GATA1水平升高其表达逐渐沉默。然而，这一转变过程中GATA2染色质结合动力学的精确变化仍不明确。本研究结合细胞系和原代小鼠祖细胞的活细胞单分子成像与CUT&Tag染色质分析，解析了红系生成过程中GATA2的活性。单分子追踪解析出两种相互作用模式：短寿命（<1秒）的搜索性相互作用和长寿命（>5秒）的结合。令人惊讶的是，早期红系分化的特征表现为长寿命GATA2染色质结合的短暂增强——在G1E-ER4细胞中表现为GATA2与染色质结合停留时间延长，在HPC7细胞和原代小鼠祖细胞中则表现为长寿命结合群体扩大。这种增强结合的短暂阶段在进一步分化后减弱。全基因组定位揭示了早期过渡状态下GATA2选择性占据的调控元件，发现富含GATA/RUNX基序的近端启动子区域和含有复合GATA/E-box特征的远端元件。综合成像与染色质分析表明，GATA2染色质结合在分化启动时经历动力学重塑，早期招募靶点分为不同的启动子相关和增强子相关亚类。这些结果支持转录因子动力学构成动态染色质结合层的模型，该特征性变化主导了GATA2向GATA1的转变过程。
体细胞拷贝数改变特征揭示癌症加速的性别分化衰老轨迹	Feng, B.	2026-05-23	PDF	体细胞拷贝数变异（CNAs）随年龄积累并促进年龄相关病理，但单细胞全基因组测序中通量与分辨率之间的权衡限制了其在单细胞分辨率下的系统性表征。本研究开发了ultra-CNA——一种高分辨率单细胞分析流程，可将CNA检测扩展至10-kb分辨率，并联合分析拷贝数与单核苷酸变异（SNV）。通过重新分析来自16名年龄0.7至79岁健康供体的32,526个淋巴细胞的Tasc-WGS数据集（Liu等，2022；此前以200-kb分辨率分析），我们构建了按染色体背景、拷贝数状态、大小和克隆性分层分析的多维CNA图谱。小型（<1 Mb）、罕见且主要为缺失型的CNA随年龄呈渐进式随机积累。性染色体缺失呈现差异化动力学：女性X染色体缺失细胞每年增加0.10个百分点，而男性Y染色体缺失细胞每年增加0.03个百分点。性染色体缺失对常染色体SNV负荷具有特异性影响：在年轻供体中，缺失细胞携带的常染色体SNV少于非缺失细胞，而在老年供体（>30岁）中，两性缺失细胞的常染色体SNV均超过非缺失细胞。女性X染色体缺失细胞还表现出45S rDNA拷贝数升高，支持X染色体缺失与LOY具有生物学差异。时钟样SBS1和SBS5突变特征在两性中均随年龄共同积累。通过将KL散度非负矩阵分解应用于通道化CNA谱，我们构建了经留一样本交叉验证验证的衰老时钟。应用于匹配的食管队列时，该时钟检测到从正常鳞状上皮经巴雷特食管到食管腺癌的加速衰老，且癌症相关谱中大型高克隆事件显著富集。因此，ultra-CNA为从血液中量化体细胞基因组衰老及检测癌症加速衰老提供了可扩展框架。
利用大型语言模型解读组学数据分析，以推动疾病靶点和药物发现。	XU, Z.	2026-05-23	PDF	在生物医学科学发现中，从文献中综合已有知识是解读组学数据、识别疾病靶点和药物发现的关键环节。大型语言模型虽能快速从生物医学文本中提取疾病机制，但纯文本输出缺乏队列特异性定量证据，在靶点和药物优先级排序中过于笼统且不可靠。为此，我们提出一种可溯源的文本-靶点框架，将模式约束的多模型大语言模型检索与数值组学数据分析相结合。其核心设计是模态感知融合步骤：候选对象被划分为重叠支持锚点、仅检索隐藏枢纽和网络涌现新颖节点，随后在拓扑约束下传播至分阶段假设与策略生成。我们在阿尔茨海默病和胰腺导管腺癌中评估该模型。在PDAC中，工作流生成了平衡的75基因候选集和23项策略组合，在靶点和策略层面均获得显著的DepMap支持。在AD中，更严格的候选控制产生了紧凑的34基因集和14项策略；在扩展的CRISPRbrain注册库中，靶点层面两个维度均显著，策略层面富集效果强劲。两种疾病最终策略均保持与候选池的完整溯源闭环，实现从检索产物到验证输出的端到端可审计性。这些结果支持一种可迁移的发现架构：组学证据约束生物活性，大语言模型检索扩展机制搜索空间，网络感知融合保持可解释性。该框架为双疾病靶点优先级排序提供了可复现基础，并通过智能体证据更新循环推动文献-机制持续一致性验证。
计算蛋白质设计中配体大小、形状和化学互补性的快速评估	Petrenas, R.	2026-05-23	PDF	在深度学习方法推动下，计算蛋白质设计正快速发展，目前已能快速且稳健地生成大量全新蛋白质结构。这为该领域开辟了新前沿，包括设计能紧密特异性结合小分子的蛋白质，以及理解支撑此类设计的非共价相互作用，使结合过程可预测且可调控。在此，我们提出一种基于物理学的快速计算方法，用于在全新设计的蛋白质中生成针对小分子靶点的等排且化学互补的结合口袋。我们通过构建并表征针对多种合成及天然发色团的结合蛋白进行实验验证。仅需评估个位数级别的设计，该流程即可产出具有预组织结合位点的稳定蛋白质（经X射线晶体学确认），这些蛋白质能以微摩尔级或更高亲和力选择性结合靶标。为展示该方法的适用范围与应用潜力，我们在双结构域全新蛋白质中整合了独立且耦合的发色团结合位点，实现两结合位点间的可控能量转移；同时开发了一种小型全新结合蛋白，可用于活体哺乳动物细胞中可视化亚细胞结构。
NiCLIP：用于从脑激活图像预测文本的神经影像对比语言-图像预训练模型	Peraza, J. A.	2026-05-23	PDF	从脑激活图预测认知过程多年来一直是神经科学领域的一个未解问题。元分析功能解码方法旨在通过提供与特定脑区相关的行为特征的定量估计来解决这一问题。现有方法在神经影像元分析中面临内在挑战，特别是在整合出版物中的文本信息时，因为它们依赖的有限指标无法捕捉文本的语义上下文。大语言模型与先进深度对比学习模型（如CLIP）的结合，用于对齐文本与图像，已彻底改变了神经影像元分析，可能为功能解码挑战提供解决方案。在本工作中，我们提出了NiCLIP，一种对比语言-图像预训练模型，可从脑激活模式预测认知任务、概念和领域。我们利用超过23,000篇神经科学文章训练了一个用于文本-脑关联的CLIP模型。对NiCLIP预测的评估显示，使用全文文章而非摘要时性能最优，同时使用具有精确任务-概念-领域映射的精选认知本体也能提升性能。此外，微调后的大语言模型（如BrainGPT模型）在性能上略优于其基础大语言模型对应版本。我们的结果表明，NiCLIP能准确预测人类连接组项目提供的群体级激活图中的认知任务（涵盖情感、语言、运动等多个领域），并精确描述特定脑区（包括杏仁核、海马体和颞顶联合区）的功能角色。然而，NiCLIP在处理含噪声的个体级激活图时表现出局限性。NiCLIP代表了神经影像定量功能解码的重大进展，为研究人员提供了假设生成和科学发现的强大工具。
抑郁症进展景观的分子特征	Sharma, V.	2026-05-23	PDF	重度抑郁症（MDD）常呈现发作与缓解交替的复发性病程，最终往往发展为治疗抵抗。已有研究探索了发作期与缓解期定义状态特异性变化的分子差异。然而，进行性差异——即从首次发作到复发性发作或缓解的临床阶段中，反映随时间推移疾病负担增加的横断面线性趋势——仍未被充分理解，这限制了持续性治疗效果的实现。本研究通过分析死后sgACC的RNA-seq数据，结合分子与细胞特异性、遗传风险、疾病共病性及潜在治疗靶点的综合评估，识别了MDD发作期或缓解期中的进行性差异与状态特异性差异。差异表达分析显示，缓解期进行性差异与状态特异性差异的重叠程度高于发作期。通路富集分析表明，细胞外基质通路的紊乱在状态特异性与进行性发作期中共同存在，而代谢与催化通路在缓解期得以恢复。细胞类型特异性分析显示，进行性变化与浅层端脑内投射神经元相关，而状态特异性变化则富集于锥体神经元亚型及深层SST阳性中间神经元。全基因组关联分析富集进一步将这些转录组变化与遗传风险因素及症状维度联系起来。快感缺失同时与状态特异性发作期和进行性缓解期特征相关，提示其可能是MDD的持续性特质样特征。最后，整合药理学分析揭示了促疾病靶点与治疗靶点之间的共享分子机制，强调了关键通路随疾病状态和剂量产生的多效性效应。这些发现为理解MDD随发作或缓解进展的生物学基础提供了新视角，并识别了涉及病理性和/或代偿性/治疗性过程的药理学靶点。
青春期前功能脑网络与青春期发育时机及抑郁症状的相关性	Metoki, A.	2026-05-23	PDF	背景：与同龄、同性别的同伴相比，青春期发育成熟的时间差异（青春期时机）与青少年期抑郁症状风险增加有关。这一发育阶段还伴随着功能性脑网络的显著重组。然而，青春期时机如何影响静息态功能连接（rsFC）变化及抑郁风险仍不清楚。方法：我们基于青少年脑认知发展（ABCD）研究，分析了9-11岁青春期前儿童的青春期时机与rsFC的关联。采用基于父母报告的身体发育状况的青春期年龄差方法估算青春期时机。使用线性混合效应模型和贝叶斯多层模型评估青春期时机与大规模功能性脑网络rsFC的横断面和纵向关联。同时检验rsFC差异是否解释了青春期时机与后续抑郁症状之间的关联。结果：较早的青春期时机与异质性rsFC模式相关，且在女性中效应更强、更广泛。在女性中，较早的青春期时机与感觉运动网络和联合网络的rsFC增减均相关；而在男性中，关联更有限且局限于感觉运动和小脑系统。纵向来看，女性较早的青春期时机预测了2年随访时rsFC的降低，而男性无显著关联。rsFC差异未能解释青春期时机与后续抑郁症状的关联。结论：青春期时机与早期青少年期性别特异性的脑功能连接模式相关，女性表现出更大的异质性和更广泛的网络参与。这些发现表明青春期成熟促进了功能性脑网络的早期重组，尽管这些变化未能解释后续的抑郁症状。

medRxiv

标题	作者	发布日期	PDF链接	摘要
人类表型本体（HPO）映射器：利用AI嵌入和基于LLM的质量控制将临床发现语义映射到人类表型本体	Kadhim, A. Z.	2026-05-23	PDF	背景：与遗传数据关联的结构化表型注释能够推动复杂疾病的诊断洞察与治疗发现。然而，非结构化临床记录中蕴含的丰富临床数据难以被研究有效获取，这仍是表型-基因型整合的主要障碍。本文提出人类表型本体（HPO）映射器——一种可扩展的AI辅助工具，旨在整合语义结构化的临床发现及其对应解剖区域，并精准映射至HPO术语及相关基因。结果：我们将HPO映射器应用于从炎症性肠病（IBD）患者记录中提取的两种标准化临床输入。第一种数据类型来自非结构化临床报告中的"临床发现+解剖区域"配对，第二种为标准化ICD-10编码衍生表型。HPO映射器对两种数据类型均实现了高语义对齐与映射精度（F1值分别为0.85±0.05和0.84±0.03）。此外，该工具成功将62.3%先前无法使用的自由文本条目转化为HPO术语。在队列规模验证中，生成的HPO集合映射至基因空间后，成功识别出包括NOD2、IL6、STAT3、IL10RA和CTLA4在内的IBD关键驱动基因。结论：本公开工具适用于将临床发现与解剖区域转化为基因关联的HPO术语，为精准医学提供实时HPO映射能力，奠定跨疾病可扩展AI表型分析的基础。更广泛而言，HPO映射器构建了通用化基础设施，可释放临床叙事数据的潜在价值，弥合临床记录与基因组诊断发现之间的鸿沟，助力靶向治疗开发。
超越急性黄疸：完善南苏丹和孟加拉国疑似戊型肝炎的病例定义	Koyuncu, A.	2026-05-23	PDF	由于缺乏常规诊断检测且症状非特异性，戊型肝炎的真实疾病负担尚不明确。我们评估了国际疑似戊型肝炎病例定义在两项研究中的敏感性与特异性，并探索替代病例定义能否更准确识别真实戊肝病例，从而提升监测数据的解读能力。研究数据来自南苏丹（2022年3-12月）和孟加拉国（2014年12月-2017年9月）的急性黄疸监测项目，这两个地区均存在戊型肝炎基因1型流行。对因急性黄疸综合征（AJS）就诊的个体，我们询问其戊肝相关体征/症状，并进行抗戊型肝炎病毒（HEV）IgM ELISA检测。采用分类模型集成方法评估体征/症状区分HEV阳性与阴性AJS病例的能力。为探索替代病例定义，我们估算了所有体征/症状组合的敏感性与特异性。在AJS患者中，南苏丹20%和孟加拉国38%的病例检出IgM抗体。国际疑似戊肝病例定义在不同研究人群中的敏感性（53-96%）和特异性（6-60%）存在差异。替代病例定义在两个人群中均表现出较差的区分能力（南苏丹AUC=0.64；95%置信区间：0.57-0.71；孟加拉国AUC=0.60；95%置信区间：0.57-0.63）。没有任何替代病例定义能在两个研究人群中同时实现敏感性和特异性超过60%。两个不同人群的急性黄疸监测显示，仅凭体征/症状不足以区分HEV相关病例与其他原因导致的急性黄疸。准确评估戊肝疾病负担及疫苗成本效益需要扩大诊断检测的应用。
将炎症性肠病风险变异解析至基因和细胞类型	Fachal, L.	2026-05-23	PDF	炎症性肠病（IBD），主要包括克罗恩病（CD）和溃疡性结肠炎（UC），是涉及炎症反应且常伴随进行性组织损伤的常见慢性疾病。全基因组关联研究已定位众多风险信号，但因果变异、效应基因及相关细胞背景仍难以明确，限制了机制解析与治疗转化。本研究对125,992例IBD患者及逾120万对照进行跨祖先全基因组关联分析荟萃，在420个IBD区域鉴定出619个独立关联信号（其中374个为新发现），这些信号可解释77-80%的基于SNP的遗传度。精细定位解析出81个高置信度变异，其中41个为首次报道。尽管多数信号在CD与UC间共享，但39%显示亚型特异性：UC信号在肠上皮细胞、分泌细胞及肠内分泌细胞的功能注释中富集更显著，而CD与循环炎症生物标志物（包括C反应蛋白和糖蛋白乙酰化）的遗传相关性更强。潜在因果模型支持高密度脂蛋白降低对CD风险的因果效应。通过整合批量及单细胞eQTL与pQTL资源（采用共定位与孟德尔随机化方法），结合外显子组测序的编码变异证据，我们在341个信号中优先筛选出664个候选效应基因（含390个新发现的IBD相关基因），揭示了人类遗传学支持的新生物学机制及候选治疗靶点。
数字注册器：一种基于模式优先的框架，通过本地大语言模型实现多癌隐私保护病理学抽象	Chow, N.-H.	2026-05-23	PDF	背景/目标：外科病理报告包含最细粒度的癌症诊断数据，但其以自由文本为主的格式造成了“转化鸿沟”，阻碍了自动化的登记录入和二次分析。尽管当前大语言模型（LLM）研究常聚焦于狭窄的提取任务，但本研究强调以临床为导向的架构层作为更持久的科学贡献，以实现长期互操作性和可重复性。方法：我们开发了一套符合美国病理学家学会（CAP）标准的临床本体，以严格类型化的分层架构实现，并编码为DSPy签名。该系统覆盖10种主要癌症类型的193个登记字段，包括淋巴结组和手术切缘等复杂可变长度结构。利用DSPy框架构建了提取流水线，实现了模型无关的架构，使LLM作为可互换的推理引擎。在893份内部病理报告（2023-2024年）和150份TCGA外部验证队列上进行了性能基准测试。硬件可行性在单块48 GB GPU上测试，以确保适用于本地化、隐私保护的医疗工作站部署。结果：使用gpt-oss:20b模型，该框架在所有内部登记字段上实现了94.3%的平均精确匹配准确率。外部验证准确率在TCGA队列中保持92.4%的高水平，展示了跨不同机构报告风格的稳健泛化能力。关键预后指标保持高保真度，包括乳腺癌生物标志物（接近完美准确率）和手术切缘阳性（91.2%平均准确率）。操作上，gpt-oss:20b在速度（每份报告40-70秒）和准确率之间提供了最佳平衡，优于更密集或更复杂的架构。结论：主要贡献在于一种架构优先的抽象层，将临床逻辑与特定AI模型解耦。通过将叙述性报告转化为具有登记级可靠性的机器可读结构，该框架为自动化癌症监测、隐私保护的机构数据复用以及未来多模态临床系统提供了可移植基础。
传播加速指标优于地方性通道阈值，可用于登革热暴发检测。	Pelitro, K. J.	2026-05-23	PDF	极端天气推动登革热传播超出历史时空发病模式。在极端天气条件下，尚无经过验证的登革热暴发阈值可用于早期预警。本研究表明，传播加速度比地方病通道阈值能更早且更一致地检测到暴发。我们在一个高度流行城市、17个热带地区和8个登革热流行国家评估了检测器。基于加速度的检测器在病例捕获量、预警提前时间、预警持续性和敏感性方面始终优于地方病通道。在城市尺度上，传播加速度每季捕获4257例病例，而地方病通道为1119例；其敏感性达100%，而后者为30%，且在6.9周（对比1.6周）的提前时间内触发于4至8周的预期预警窗口。这些结果确立了基于加速度的检测器作为登革热预警行动的稳健信号，使其更适用于日益受极端天气影响的传播格局。
妊娠表型的动态遗传图谱	Liu, S.	2026-05-23	PDF	妊娠期（从受精到分娩约40周）是人类生殖的基础。在此期间的健康监测涉及系统的产前和产后检查，其指导指标在国家医保框架下统称为妊娠表型。尽管这些表型具有临床重要性，但其遗传基础及其与后期健康结局的关联仍知之甚少。在这项大规模遗传学研究中，我们分析了121,579例中国妊娠中的122种妊娠表型，涵盖人体测量指标、血液生物标志物以及常见妊娠并发症与结局。我们鉴定出3,845个遗传位点（含1,893个新位点），并在23种表型中发现妊娠特异性遗传效应，其比例范围为0%至100%。这些位点富集于激素调控、细胞生长和免疫功能相关通路。针对24种全血细胞表型重复测量的纵向全基因组关联分析显示，在五个妊娠期和产后阶段中，17.8%的位点存在显著的基因-妊娠时间交互作用。对220种中晚年表型的孟德尔随机化分析确定了73项妊娠表型与慢性病风险之间的因果关联。这些发现为人类妊娠表型的遗传结构及其对长期健康的影响提供了重要见解，为推进妊娠期人群健康奠定了基础。可视化结果见https://monn.pheweb.com/。
南亚人群自然选择对更高心脏代谢疾病风险贡献的评估	Searby, D. J. C.	2026-05-23	PDF	有假说认为，南亚人群心血管和代谢疾病发病率高于欧洲人群，是由于其遗传易感性更高。我们首先证明，在排除技术性假象后，相关性状的遗传效应在不同祖先群体间基本一致，这削弱了基因-基因或基因-环境交互作用导致患病率差异的假说。若南亚人群遗传易感性较高源于进化过程中脂肪相关性状的选择压力，那么与心脏代谢疾病及其他因果相关性状（如脂肪分布）关联的基因座应存在选择信号。我们通过比较连锁不平衡评分和最小等位基因频率匹配的SNP零分布，检测了与心脏代谢疾病相关性状关联的基因座中多种选择统计量（FST、XP-EHH和XP-nSL）的富集情况。结果显示，与2型糖尿病、躯干脂肪百分比、体脂百分比及躯干脂肪质量等部分性状关联的基因座存在FST富集，这支持了跨群体分化存在适度适应性解释。然而，所有研究性状均未出现基于单倍型统计量的富集，表明跨群体遗传分化不太可能由近期选择性清除驱动，而更可能源于古老选择或近期多基因选择作用于现有遗传变异。
MyeGPT：一种用于多发性骨髓瘤的人工智能代理	Chang, J. G.	2026-05-23	PDF	如今，我们对癌症生物学的理解日益归功于大规模临床分子数据集。以多发性骨髓瘤（第二常见的血液系统恶性肿瘤）为例，CoMMpass研究提供了包含1143名患者配对临床与测序数据的数据集。由于该数据集的多组学数据具有复杂性，需要编程技能才能处理，这对希望基于群体数据验证假设的实验性骨髓瘤研究者构成了障碍。近年来智能体AI的兴起为弥合这一技术鸿沟带来了前所未有的机遇。我们提出MyeGPT（多发性骨髓瘤生成式预训练Transformer），这是一种以CoMMpass数据集为基准的多发性骨髓瘤AI生物信息学家。MyeGPT能将"诱导治疗后复发患者有何特征"或"比较NSD2高表达与正常表达患者的总体生存率"等自然语言查询转化为基于真实数据的全新分析，并主动生成可视化结果图表。我们基于CoMMpass开发了一套包含评分标准的评估问题集，通过基准测试确定大语言模型和文本嵌入模型的最佳选择。我们将MyeGPT封装为即用型浏览器应用，使研究者可通过智能手机完成基于CoMMpass的假设验证。
加拿大马尼托巴省性传播及血源性感染、甲基苯丙胺使用与COVID-19疫苗接种情况：基于2020-2022年人群行政医疗数据的回顾性匹配队列分析	Shaw, S. Y. Y.	2026-05-23	PDF	目的：研究加拿大马尼托巴省在COVID-19大流行急性期，性传播及血源性感染（STBBI）确诊者与甲基苯丙胺使用者的疫苗接种情况。方法：采用回顾性匹配队列研究，基于马尼托巴省关联的人口行政医疗、实验室及疫苗接种数据库。纳入2020年3月1日前四年内实验室确诊衣原体/淋病（CT/NG）、梅毒、HIV和/或记录有甲基苯丙胺使用的16岁以上个体，组成八个暴露队列。各队列按年龄、性别、地理区域及收入五分位数匹配未暴露对照组。主要结局为2020年12月1日至2022年3月31日期间接种≥2剂COVID-19疫苗。采用泊松回归模型估算疫苗接种率的调整率比（aRR）及95%置信区间（95% CI）。结果：与匹配对照组相比，多数暴露队列完成COVID-19基础疫苗接种的可能性较低。仅梅毒组（aRR: 0.87, 95% CI: 0.85-0.90）、梅毒合并感染组（aRR: 0.84, 95% CI: 0.81-0.86）、仅CT/NG组（aRR: 0.95, 95% CI: 0.94-0.96）、CT/NG合并感染组（aRR: 0.82, 95% CI: 0.80-0.85）、仅甲基苯丙胺组（aRR: 0.78, 95% CI: 0.76-0.80）及甲基苯丙胺+STBBI组（aRR: 0.74, 95% CI: 0.72-0.77）的疫苗接种率显著较低。仅HIV组与匹配对照组无显著差异（aRR: 0.98, 95% CI: 0.95-1.01）。低接种率集中于低收入地区人群。结论：马尼托巴省STBBI确诊者与甲基苯丙胺使用者在COVID-19疫苗接种中面临显著不平等，尤其合并STBBI感染及物质滥用者。将疫苗接种与HIV服务、减少伤害及成瘾治疗整合的干预措施，可在未来公共卫生紧急事件中改善疫苗公平性。
在肯尼亚社会健康管理局过渡前，确诊高血压或糖尿病的肯尼亚成年人中，健康保险覆盖、可负担性障碍及治疗缺口：基于2022年肯尼亚人口与健康调查的性别分层分析	Amollo, N. W.	2026-05-23	PDF	背景：肯尼亚于2024年10月以社会健康管理局取代国家健康保险基金，使2022年肯尼亚人口健康调查成为过渡前最后一个具有全国代表性的基线数据。关于已确诊高血压或糖尿病成年人的保险覆盖率和治疗缺口（包括性别差异模式）的证据仍然有限。本研究旨在评估国家健康保险基金时代末期，确诊成年人在保险覆盖率和治疗缺口方面的水平、分布及相关因素。方法：我们对2022年肯尼亚人口健康调查进行了基于调查权重的横断面二次分析。受访者报告了保险状况、既往诊断和当前用药情况。分析按性别分层并采用调查权重，通过调整患病率比评估保险覆盖率与治疗缺口之间的关联。使用集中指数检验与财富相关的不平等性。结果：分析样本包括1,932名确诊成年人（1,384名女性和548名男性）。任何保险覆盖率为47.7%，主要来自国家健康保险基金参保（43.4%）。总体而言，63.8%的确诊成年人被归类为存在治疗缺口（至少一种确诊疾病未服药），其中女性为67.1%，男性为59.8%，所有财富五分位组的治疗缺口均超过60%。保险覆盖率呈现明显的亲富倾向，而治疗缺口则分布于各财富梯度。调整后，保险与女性或男性治疗缺口患病率降低无强关联，且正式交互作用检验不支持性别效应修饰。在女性中，未参保者报告"缺乏治疗资金"为主要障碍的频率远高于参保者。结论：在社会健康管理局过渡前，肯尼亚面临保险覆盖率不平等、持续的可负担性障碍以及高血压或糖尿病确诊受访者中显著的治疗缺口。这些发现为卫生筹资改革提供了全国性过渡前基准。研究提示，扩大参保覆盖面是必要的，但除非公共保险安排同时改善福利深度、门诊药品可及性以及持续性非传染性疾病护理的一线准备，否则难以缩小慢性病治疗缺口。