2026-05-24 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
通过凸松弛实现分词	Jan Tempus	2026-05-21	PDF	分词是当前自然语言处理流程中不可或缺的组成部分。现有的分词算法（如BPE和Unigram）均为贪心算法——它们仅基于局部最优决策，未将整体词汇表纳入考量。我们转而将分词器构建问题形式化为线性规划，并利用凸优化工具求解，由此提出名为ConvexTok的新算法。实验表明，ConvexTok能持续提升分词内在指标及语言模型实现的每字节比特数（BpB）；在下游任务性能上亦有改进，但效果不够稳定。此外，ConvexTok允许用户通过下界验证其分词器与特定目标的最优性差距——实证发现，在常见词汇表规模下，该差距可控制在1%以内。
它往哪个方向移动？诊断并克服视频大语言模型中的方向性运动盲症	Jongseo Lee	2026-05-21	PDF	视频大语言模型（Video-LLMs）在时间视频理解方面取得了快速进展，但许多模型在基本感知原语——即图像平面上的符号化运动方向——上表现失败。在单一物体向左、右、上或下移动的简单视频中，大多数Video-LLMs的表现接近随机水平，而高于随机的情况主要归因于预测偏差，而非真正的方向理解。我们将这种失败称为方向性运动盲症。通过追踪运动方向信息在Video-LLM处理流程中的流动，我们定位了失败原因。运动方向在视觉编码器、投影器和LLM隐藏状态中仍保持线性可访问性，但读出过程未能将该信号绑定到正确的口头答案选项上，揭示了方向绑定缺口。尽管合成运动方向指令微调在源领域缩小了这一缺口，但运动方向概念向量分析表明，视觉复杂性削弱了信号强度并限制了域外泛化。我们引入了MoDirect——一个用于运动方向指令微调和评估的数据集系列，以及DeltaDirect——一种诊断驱动的投影器级目标函数，该函数从相邻帧特征差异中预测归一化的二维运动向量。在MoDirect-SynBench上，使用DeltaDirect进行指令微调将运动方向准确率从25.9%提升至85.4%。在MoDirect-RealBench上，DeltaDirect在无真实世界微调数据的情况下，将真实世界运动方向准确率较原始基线提升21.9个百分点，同时保持标准视频理解性能。代码：https://github.com/KHU-VLL/DeltaDirect
通过神经需求势能实现的可积弹性	Carlos Heredia	2026-05-21	PDF	我们提出可积上下文相关需求网络（ICDN），这是一种面向多产品零售需求的需求优先神经网络模型。该模型将对数需求学习为对数价格的平滑、上下文条件函数，从而能够从学习到的需求曲面精确推导出弹性。在Dominick's啤酒数据集上，ICDN相比有向对数-对数基准模型提升了样本外泛化能力，并生成了更稳定、经济上更合理的弹性估计，尤其适用于弱识别的交叉价格效应。
Cambrian-P：基于姿态的视频理解	Jihan Yang	2026-05-21	PDF	相机位姿至关重要。每个视角的位置和朝向定义了一个共享的空间坐标框架，用于关联视频帧之间的观测信息。然而，这一信号在多模态大语言模型（MLLMs）的视频理解中基本缺失——这些模型将帧视为孤立的二维快照，而非人类所感知的持续场景。我们重新审视位姿作为轻量级监督信号的作用，提出Cambrian-P：一种增强型视频多模态大语言模型，配备逐帧可学习的相机标记和位姿回归头。通过精心设计的采样方案，该模型在VSI-Bench等空间推理基准上取得4.5-6.5%的显著提升，在另外八个空间与通用视频问答基准上展现泛化能力，并作为副产品在ScanNet上实现了流式位姿估计的最优性能。令人惊讶的是，使用野外视频的伪标注位姿进行训练进一步提升了通用视频问答基准的表现，表明位姿在空间推理之外也能发挥作用。这些结果共同将相机位姿定位为视频模型理解物理世界的基础信号。
MotiMotion：基于视觉推理的运动控制视频生成	Lee Hsin-Ying	2026-05-21	PDF	当前基于运动控制的图像到视频生成模型严格遵循用户提供的轨迹，但这些轨迹往往稀疏、不精确且因果不完整。这种依赖常导致生成结果不自然或不可信，尤其容易遗漏次要因果后果。为解决这一问题，我们提出MotiMotion——一种将运动控制重构为“先推理后生成”问题的新框架。为促进基于因果逻辑且符合常识的交互，我们利用无需训练的视觉语言推理器优化主轨迹的图像空间坐标，并合理推测次要运动。为进一步提升运动自然度，我们提出置信度感知控制方案，动态调节引导强度：使模型在高置信度计划下严格遵循轨迹，同时在低置信度输入下利用内部生成先验修正伪影。为支持系统性评估，我们构建了新的图像到视频基准MotiBench，包含由运动触发新事件的交互中心场景。基于VLM的评估与人类研究均表明，MotiMotion生成的视频具有更合理的物体行为与交互，且优于现有方法。
向量策略优化：多样性训练提升测试时搜索性能	Ryan Bahlous-Boldi	2026-05-21	PDF	语言模型现在必须能够开箱即用地泛化到新环境，并在推理时扩展的搜索流程（如AlphaEvolve）中工作，这些流程会通过多种任务特定的奖励函数来选择生成结果。不幸的是，当前大语言模型后训练的标准范式优化的是预设的标量奖励，这往往导致现有LLM产生低熵的响应分布，从而难以展现推理时搜索所需的多样性。我们提出向量策略优化（VPO），这是一种显式训练策略以应对多样化下游奖励函数并生成多样化解决方案的强化学习算法。VPO利用了实际场景中奖励常为向量值的特点（例如代码生成中每个测试用例的正确性，或多种不同用户画像/奖励模型）。VPO本质上是GRPO优势估计器的即插即用替代方案，但它训练LLM输出一组解决方案，其中每个解决方案专门针对向量奖励空间中的不同权衡。在四个任务中，VPO在测试时搜索指标（如pass@k和best@k）上达到或超越最强标量强化学习基线，且随着搜索预算增加差距进一步扩大。在进化搜索中，VPO模型解锁了GRPO模型完全无法解决的问题。随着测试时搜索日益标准化，优化多样性可能需要成为默认的后训练目标。
AwareVLN：面向视觉语言导航的自我感知推理	Wenxuan Guo	2026-05-21	PDF	视觉与语言导航（VLN）要求智能体在视觉环境中将语言指令与自身移动相结合。现有最先进方法虽利用视觉语言模型（VLM）的推理能力进行端到端动作预测，但往往缺乏对智能体、指令和场景之间关系的显式可解释理解。相反，为启发式规划显式构建场景地图虽直观可行，却依赖额外3D传感器且阻碍大规模视觉语言预训练。为弥合这一差距，我们提出AwareVLN——一种新型框架，通过为导航模型配备自感知推理机制，使其能以完全端到端和数据驱动的方式理解智能体状态与任务进度。本方法包含两项关键创新：（1）结构推理模块，促进空间与任务导向的自感知能力；（2）带进度划分的自动数据引擎，实现高效训练。在Habitat模拟器多个数据集上的大量实验表明，AwareVLN显著优于先前最先进的视觉语言导航方法。项目页面：https://gwxuan.github.io/AwareVLN/。
保持好奇：用于3D探索的情景上下文与持久世界	Lily Goli	2026-05-21	PDF	探索是在稀疏奖励、长周期任务中学习有用行为的前提条件，尤其在三维环境中。基于好奇心的强化学习通过智能体对世界的预测模型与现实之间的差异产生的内在奖励来解决这一问题。然而，将这种内在动机迁移到复杂、逼真的环境中仍然困难，因为智能体会陷入局部循环，并在重新访问被遗忘的状态时获得新的奖励。在本研究中，我们证明这种失败源于缺乏空间持久性和情景上下文。我们表明，有效的好奇心需要一个持久且持续更新的世界模型，并配合一个维护情景轨迹历史以导航至新区域的智能体。我们通过在线三维重建作为持久的世界模型来实现这一点，同时将智能体策略参数化为基于RGB观测的序列模型以维护情景上下文。这种设计使训练期间能够进行有效探索，同时允许智能体在部署时仅使用RGB帧进行导航。仅通过HM3D上的好奇心训练，我们的智能体在性能上超越了基于强化学习的主动建图基线，并零样本泛化至Gibson和AI生成的世界。我们的端到端策略能够高效适应下游任务，如摘苹果和图像目标导航，性能优于从头训练的基线。视频结果请见https://recuriosity.github.io/。
GesVLA：嵌入表征的姿势感知视觉-语言-动作模型	Wenxuan Guo	2026-05-21	PDF	视觉-语言-动作（VLA）模型通过统一感知与动作，在通用机器人操作中展现出巨大潜力。然而，现有VLA系统主要依赖文本指令，难以解决复杂场景中多个相似物体造成的空间歧义问题。为突破这一局限，我们引入手势作为并行指令模态，并提出手势感知视觉-语言-动作模型（GesVLA）。该方法将手势特征直接编码至潜在空间，使其既能参与高层推理又能参与低层动作生成，并采用双VLM架构实现手势表征与动作策略的紧密耦合。在数据层面，我们通过将手部模型渲染到真实场景图像上，构建了可扩展的手势数据生成流水线，在缩小仿真到真实视觉差异的同时，生成包含多样化运动模式及对应指向标注的丰富数据。此外，我们采用两阶段训练策略，使模型同时具备手势感知与动作预测能力。我们在多个真实机器人任务上评估该方法，包括用于验证的受控积木操作任务，以及产品与农产品选择等更实用场景。实验结果表明，融入手势能持续提升目标定位精度与人机交互效率，尤其在复杂杂乱环境中表现显著。项目页面：https://gwxuan.github.io/GesVLA/。
GS-QA：地理空间问答基准	Majid Saeedan	2026-05-21	PDF	大型语言模型（LLM）的最新进展显著提升了问答系统的性能。为应对问答系统评估的挑战，标准化基准测试应运而生。本研究聚焦地理空间问答问题，其中大量地理空间数据以空间数据库或其他形式存在。现有地理空间问答基准存在诸多局限，包括问题数量少、空间谓词有限、输出类型单一且缺乏多源推理能力。我们提出GS-QA——一个可扩展的地理空间问答基准，基于OpenStreetMap和Wikipedia数据构建了28个模板的2800个问答对，涵盖广泛的空间对象、谓词（包括方向过滤和朝向过滤）及答案类型（实体名称、位置、距离、方向、计数和聚合面积/长度）。GS-QA的关键特性在于部分问题需要整合多源信息，例如结合OSM的地理空间信息与Wikipedia的事实信息。该基准包含综合评估方法，融合了基于文本的问答指标与地理空间专用指标（如距离误差和角度误差）。我们采用三种LLM（GPT-4o、Claude Sonnet 4.6和Ministral-3），结合直接提示、检索增强生成和文本转SQL方法，实现了九个基于LLM的地理空间问答基线。实验结果表明，现有方案在处理简单空间谓词和实体名称输出时表现良好，但在涉及复杂空间谓词、数值输出类型及多源推理的问题上准确率显著下降，证明地理空间问答仍是值得深入研究的开放性挑战。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
将波动性与随机性分离揭示了精神病理学的跨诊断计算特征	Fang, X.	2026-05-24	PDF	适应性学习需要区分环境潜在状态的变化（即波动性）与观测值逐刻的随机性。两者对学习率提出相反要求：波动性需要更快的更新速度，随机性则需要更慢的更新速度。由于两者都会放大经验方差，导致推断容易受到系统性个体差异的影响，进而可能对精神病理学产生影响，因此将它们分离开来在计算上具有挑战性。三种计算表型捕捉了这种变异：完整学习者；随机性盲学习者（将噪声视为变化而过度更新）；以及波动性盲学习者（将变化视为噪声而更新不足）。在两个大规模在线样本及三项任务中，我们发现这些表型与跨诊断精神维度之间存在双重分离：随机性盲学习者在内化维度（焦虑、抑郁）上得分更高，而波动性盲学习者在外部化维度（行为成瘾、强迫性）上得分更高。因此，不同的症状维度对应着关于不确定性推断的不同失败模式，这支持了精神病理学中学习-不确定性缺陷的选择性而非普遍性解释。
在人类前额叶皮层中跨多尺度绘制精神分裂症的空间组织分子与遗传特征图谱	Kwon, S. H.	2026-05-24	PDF	背外侧前额叶皮层（dlPFC）是精神分裂症（SCZ）认知功能障碍的核心区域，但分子变化如何在大脑皮层中组织仍不清楚。本研究对死后人类dlPFC组织，采用互补性空间转录组学方法，覆盖层域、微环境及细胞类型。在层域层面，SCZ相关转录变化在胶质细胞富集区域（第1层/脑膜及白质）最为显著，包括小胶质细胞相关基因下调，而遗传风险则定位于神经元丰富的灰质。我们进一步分析了与SCZ相关的微环境，包括神经毡、神经元、神经元周围网络及血管区域。在这些微环境中，神经元和突触的转录变化在神经毡中最为突出，表现为活动依赖性突触基因及抑制性神经元标志物下调。在细胞层面，这些信号反映了定位于细胞类型的内在改变。跨分析结果均指向BDNF-TrkB信号通路改变及抑制性环路功能障碍。综上，我们的发现强调空间尺度是解析SCZ相关生物学中神经元与非神经元特征的关键决定因素。
血管模式通过HIF1α-Vegf信号通路影响膜内骨化。	Dash, S.	2026-05-24	PDF	器官和组织的发育与血管系统密切相关，血管系统负责运输血液和营养物质，并帮助清除代谢废物。血管系统主要由内皮细胞构成，这些细胞提供结构支撑、形成屏障，并作为发育信号的来源。我们近期发现，介导转录调控的多蛋白复合体——中介体，对血管正常发育至关重要。本研究聚焦于中介体尾部亚基Med23在内皮细胞中的特异性功能。通过Tek-Cre技术在小鼠胚胎中特异性敲除内皮细胞Med23，导致血管异常，包括水肿、出血和血管结构紊乱，同时伴随颅面部缺陷如下颌发育不全和腭裂。神经嵴细胞的形成和迁移未受影响，但Med23突变体颅面区域中神经嵴细胞的成骨分化严重受损。空间转录组学分析显示，关键血管和成骨基因（如Vegfr1和Col1a1）表达下调，且内皮细胞与成骨细胞群体间的信号动态发生改变。Med23突变体中观察到HIF1表达升高和VEGF信号减弱，提示缺氧驱动的成骨细胞成熟抑制。与此模型一致，联合使用HIF1抑制剂和VEGFA补充剂可挽救颅面骨化异常并延长胚胎存活时间。这些发现揭示了Med23在协调血管模式与膜内骨化中的关键作用，并凸显颅面真皮骨与中轴骨及附肢软骨内骨发育对缺氧和血管生成的不同需求。因此，颅面血管系统（尤其是内皮细胞）在颅面发育过程中对神经嵴细胞分化具有指导性作用。
脊椎动物KCNH电压门控钾通道的进化分析及其在斑马鱼胚胎中的表达	Wu, K.	2026-05-24	PDF	电压门控钾通道（Kv）是一个包含40个成员、分属12个亚型的大型钾通道家族。KCNH基因编码电压门控钾通道的3个亚家族：Kv10（EAG，醚-阿-勾-勾）、Kv11（ERG，EAG相关基因）和Kv12（ELK，EAG样钾通道）。Kv通道在神经系统和心血管系统中发挥重要作用。Kv通道突变与多种人类疾病相关，如癫痫、心律失常和癌症。目前对蛋白质结构、生理功能及药理调节剂的研究已取得显著进展，但脊椎动物KCNH基因在胚胎发育过程中的进化史和基因表达仍鲜为人知。我们系统鉴定并克隆了斑马鱼中的14个kcnh基因，随后通过系统发育和共线性分析研究了脊椎动物KCNH通道的进化。数据显示，KCNH基因家族的三个亚型在无脊椎动物中已进化形成，远早于脊椎动物的出现。脊椎动物KCNH基因数量的增加很可能源于全基因组复制事件。此外，我们通过原位杂交技术检测了斑马鱼早期胚胎发育过程中kcnh基因的表达模式。各亚组基因表现出相似但具有差异的表达域（部分例外），多数在神经组织中表达。值得注意的是，kcnh6a在发育中的心脏呈现强表达，与其在心脏复极化中的保守功能一致。另有少数kcnh基因在体节和脊索等非神经组织中短暂表达，提示其在胚胎发育中可能具有独特作用。我们对KCNH通道的系统发育和发育分析揭示了其进化史及胚胎发生过程中的潜在作用，这与它们的生理功能和人类通道病研究相吻合。
达尔文适合度、其方向导数，以及考虑代内与代际环境随机性下具有等级结构的有限扩散的汉密尔顿法则	Lehmann, L.	2026-05-24	PDF	达尔文适合度在此等同于入侵适合度，定义为决定单一突变类型命运（必然灭绝或可能扩散）的量。我们将其与表型导数共同推导，用于有限遗传混合下的群体结构种群演化，其中目标物种的人口统计及其环境被建模为离散时间随机过程。繁殖、生理发育、扩散和生存受群体内及群体间相互作用、代际及代内环境波动的影响。通过随机环境中的多类型分支过程，我们证明入侵适合度可由随机增长率预测，该增长率在生物学上具有两种有意义的谱系学表征方式：其一，突变谱系代表性成员每时间步产生的预期人均突变拷贝数的长期几何平均值；其二，该个体产生的预期生殖价值加权人均突变拷贝数的长期几何平均值。后一种表征方式有助于计算入侵适合度的表型方向导数。此外，该导数可写为由驻留种群过程属性导出的以行为者为中心的包容性适合度效应，该效应取决于类别特异性适合度差异、亲缘关系、生殖价值及类别频率。然而，除非世代与类别特异性适合度定义随机矩阵，否则该导数无法将随机生殖价值与亲缘关系和类别频率分离，需通过模拟评估。总之，我们从生物学角度普遍形式化入侵适合度，并展示如何由此推导出汉密尔顿边际法则。
Deep-Pose-Tracker：一种用于秀丽隐杆线虫行为分析的统一模型	Saha, D.	2026-05-24	PDF	追踪和分析动物行为是神经科学和发育生物学等领域的关键步骤。以秀丽隐杆线虫的行为研究为例，这有助于理解生物如何响应外界信号，以及特定生理反应如何与即时或习得行为相关联。尽管通过运动轨迹和姿态动态追踪行为是常规操作，但人工执行时既繁琐又耗时。因此，自动化这一过程对于准确快速检测和分析至关重要。为此，本研究开发了Deep-Pose-Tracker（DPT），这是一种端到端深度学习模型，旨在自动化分析秀丽隐杆线虫的姿态动态和运动行为。该模型基于YOLO（You Only Look Once）架构，能够自动检测和追踪线虫，同时测量运动速度、方向、前进或后退运动以及复杂身体弯曲（如omega转弯）等关键行为特征。此外，模型还包含特征蠕虫分解，可在低维空间中表示复杂姿态动态。该模型在评估和测试数据集上表现出可靠性能，推理速度快且用户友好。因此，DPT可成为研究不同环境刺激下行为的重要工具包。
多组学状态转换揭示急性髓系白血病治疗后转录组去同步化	Rangel Ambriz, J.	2026-05-24	PDF	外周血转录组的时间动态对于理解白血病演变和治疗反应至关重要，因为它能揭示基因表达程序如何驱动异常细胞状态、疾病异质性和治疗耐药性。我们利用状态转换的数学模型，在急性髓系白血病小鼠模型中研究了外周血信使RNA和微小RNA转录组的时间动态。在该模型中，mRNA和miRNA转录组被表示为在二维多组学势能景观中进行布朗运动的粒子。化疗后，我们观察到该景观出现不对称偏移，导致mRNA与miRNA转录组反应在时间上不同步。具体而言，mRNA轨迹在治疗后几乎立即响应，而miRNA反应延迟约两周。聚类分析发现，这种时间延迟主要由小鼠染色体12qF1和人类染色体14q32上印记基因Dlk1-Dio3区域的一个显著miRNA簇驱动。尽管该区域此前已被证实与急性早幼粒细胞白血病、淋巴瘤和代谢失调相关，但本研究首次提供了Dlk1-Dio3位点与AML化疗反应及治疗诱导的转录组不同步相关的证据。该框架为识别血液恶性肿瘤中治疗反应的生物学驱动因素及新型治疗靶点提供了一种创新的动力学策略。
含磷镁/铁层状双氢氧化物分散在花旗松生物炭上作为控释肥料及其对矮生菜豆（Phaseolus vulgaris）生长的影响。	Singh, T.	2026-05-24	PDF	许多农业土壤缺乏植物健康生长所需的关键大量营养素。长期依赖高水溶性商业肥料成本高昂且对环境有害。本研究探究了一种负载磷的镁/铁层状双氢氧化物（LDH）分散在花旗松生物炭上（Mg/Fe-LDH生物炭）作为控释肥料，并评估其对菜豆（Phaseolus vulgaris L.）生长的影响。研究强调可持续性，整合了控释肥料、生物炭和LDH改性，以提高养分利用效率并减少环境径流。通过共沉淀法在生物炭上直接合成Mg/Fe-LDH，利用阴离子交换将磷酸盐负载到复合材料上，并通过元素分析、N2 Brunauer-Emmett-Teller（BET）比表面积分析和X射线光电子能谱对材料进行表征，确认了花旗松生物炭上成功的LDH改性，以及高比表面积和可及活性位点。合成得到稳定的P-Mg/Fe-LDH生物炭，具有增强的分散性和磷酸盐缓冲能力，可实现控释施肥。在温室实验中，与未施肥对照组和传统磷肥相比，使用P-Mg/Fe-LDH生物炭种植的菜豆在100.88 kg（P2O5）ha-1施用量下表现出改善的生长指标，包括产量增加（豆荚鲜重31.7克）、生物量（植株干重6.3克）、株高（32.8厘米）和养分吸收提高（1.88 mg（P）g-1），表明实现了高效、控释的磷酸盐供应和持续的养分有效性。结果表明，整合LDH改性生物炭可增强磷吸收和植物生长，同时减少淋溶损失。总体而言，本研究强调了结合生物炭、层状双氢氧化物和控释配方的战略意义，以推进可持续养分管理并改善农业生态系统中的作物表现。这些发现为符合资源效率和粮食安全全球目标的环保肥料设计与土壤改良策略提供了有前景的途径。
多谱系转录和细胞通讯特征定义了启动和维持类风湿关节炎的个性化演变机制。	Liu, C.	2026-05-24	PDF	类风湿关节炎（RA）是一种因高危个体免疫耐受丧失及自身抗体产生而引发的系统性自身免疫疾病。靶向治疗应答存在个体差异，现有预防策略虽能延缓但无法阻止疾病发生。我们提出：一组转录因子（TFs）及其下游通路调控高危人群与RA患者中炎症细胞通讯网络。这些网络可驱动多种致病细胞类型及介质，并可能解释靶向药物应答差异。为验证该假说，我们筛选了抗环瓜氨酸蛋白抗体（ACPA）阳性高危个体、早期及确诊RA患者与健康对照。通过整合外周血单个核细胞的单细胞染色质可及性与转录组图谱，发现共享致病机制，尤其是SUMO化修饰、RUNX2、YAP1、NOTCH3及β-连环蛋白通路。令人意外的是，该特征信号存在于多种细胞类型中。随后在RA滑膜组织中验证了个体化基因表达模式。细胞通讯分析显示，多谱系细胞均可向受体细胞传递核心促炎介质。纵向分析表明，特征性细胞类型在高危个体中动态演变。细胞类型特异性通路可能影响靶向治疗的临床应答差异。本研究揭示了相同临床表型如何源于多种致病机制。
前青春期功能性脑网络与青春期发育时机及抑郁症状的相关性	Metoki, A.	2026-05-24	PDF	背景：与同龄同性别的同伴相比，青春期发育时机的差异（青春期启动时间）与青少年期抑郁症状风险增加有关。这一发育阶段还以功能性脑网络的大规模重组为特征。然而，青春期启动时间如何影响静息态功能连接（rsFC）变化及抑郁风险仍不明确。方法：本研究基于青少年脑认知发展（ABCD）研究，分析了9-11岁青春期前儿童的青春期启动时间与rsFC的关联。通过父母报告的身体发育数据，采用青春期年龄差距法估算青春期启动时间。使用线性混合效应模型和贝叶斯多层模型，评估大规模功能性脑网络中青春期启动时间与rsFC的横断面及纵向关联。同时检验rsFC差异是否解释了青春期启动时间与后续抑郁症状之间的关联。结果：青春期启动较早与rsFC的异质性模式相关，在女性中效应更强且更广泛。女性中，青春期启动较早与感觉运动网络和联合网络的rsFC增减均相关；而男性中，关联更局限，主要集中于感觉运动和小脑系统。纵向分析显示，女性青春期启动较早可预测两年随访时rsFC的降低，男性中无显著关联。rsFC差异未能解释青春期启动时间与后续抑郁症状的关联。结论：青春期启动时间与青少年早期脑功能连接的性别特异性模式相关，女性表现出更大的异质性和更广泛的网络参与。这些发现表明青春期发育促进了功能性脑网络的早期重组，但这些变化并未解释后续的抑郁症状。

medRxiv

标题	作者	发布日期	PDF链接	摘要
系统治疗在既往接受过蒽环类药物治疗的不可切除、晚期或复发性软组织肉瘤患者中的有效性：一项系统评价和网络荟萃分析	Nakano, Y.	2026-05-24	PDF	引言：软组织肉瘤（STS）是一种罕见的恶性肿瘤，具有多种组织学亚型，年发病率约为每百万人40例。尽管自2012年以来，日本已批准帕唑帕尼、曲贝替定和艾日布林等多种药物用于既往接受过蒽环类药物治疗的患者，但临床指南对二线治疗方案尚未提出一致建议。由于缺乏头对头比较证据，治疗方案的选择主要取决于临床医生的判断。本研究旨在通过系统评价和网络荟萃分析（NMA），评估不可切除、晚期或复发性STS的二线及后续药物治疗方案的相对疗效。方法与分析：将通过全面检索MEDLINE（via PubMed）、Embase（via ProQuest）、CENTRAL、WHO ICTRP和ClinicalTrials.gov，检索时间从建库至检索日期，无语言限制，识别随机对照试验（RCT），包括多臂设计。两名评审员将独立筛选文献、提取数据，并使用Cochrane RoB 2工具评估偏倚风险；分歧由第三名评审员解决。将使用随机效应模型进行成对荟萃分析，随后采用频率学NMA，通过REML估计研究间方差。一致性将通过设计-治疗交互作用模型（全局）和节点分割法（局部）进行评估。治疗排序将使用P评分或SUCRA进行评估。每个结局的证据确定性将根据GRADE框架使用CINeMA进行评估。支持/资助：本研究未获得公共、商业或非营利部门的任何特定资助机构的资助。伦理与传播：本系统评价和网络荟萃分析将使用从已发表研究和试验注册库中提取的数据进行。由于不会收集或使用个体患者数据，因此无需伦理批准。本综述的研究结果将通过同行评审期刊发表和相关科学会议报告进行传播。研究结果还将与临床医生、政策制定者和研究人员分享，以指导临床实践和未来研究。最终数据集和分析代码可能会在开放获取存储库中提供，以确保透明度和可重复性。PROSPERO注册号：CRD420251156600 关键词：软组织肉瘤；二线治疗；挽救治疗；网络荟萃分析；随机对照试验
多语言消费者健康AI中温暖感与临床实质之间的不对称性	Ariel, D.	2026-05-24	PDF	同一患者问题在不同语言中可能产生不同临床质量。针对六种语言、四个聊天机器人中的504个论坛患者提问，语言匹配的临床医生对五个临床维度进行了评分（1008次评分；5040个维度得分）。在四个临床实质维度上，患者语言的影响超过了聊天机器人身份（语言综合偏eta平方为0.275，聊天机器人为0.035；排除研究者评分后稳健性检验：eta平方为0.260），但共情维度除外（eta平方为0.029）：临床实质与语言相关；温暖感相对保持稳定。灾难性安全评分因语言差异达4.3倍（英语3.6%，泰语和希伯来语15.5%）；62%的灾难性评分超过英语基线水平（描述性差异）。失败具有系统性和隐蔽性：24个中风相关回复均未体现时间紧迫性框架，24个一氧化碳中毒相关回复均未质疑家属的压力框架，120个关键回复中未发现明确错误。温暖感无法区分临床风险（回复层面共情AUC=0.49）：消费者健康AI可能以流畅关切的语气传递临床实质退化的内容。
使用临床笔记的自然语言处理来补充结构化电子健康记录数据，以在医疗系统中对吸烟和肥胖进行表型分析	Yang, J.	2026-05-24	PDF	目的：基于电子健康记录（EHR）的研究通常依赖结构化数据，但这类数据可能无法完整捕捉EHR文本中重要的临床表型。本研究旨在评估两种自然语言处理（NLP）工具从非结构化EHR文本中提取表型的能力，并在医疗系统规模下评估将NLP衍生表型与结构化EHR数据整合的附加价值。方法：本回顾性研究基于2019年1月1日至2020年12月31日期间Mass General Brigham医疗系统的住院和门诊EHR数据。采用两种成熟的基于规则的NLP工具，从503,025名患者的19,215,303份临床文本中提取吸烟和肥胖信息。通过分层样本的人工审核评估NLP性能。单独使用结构化EHR数据估算表型患病率，并与补充NLP衍生特征后的患病率估算结果进行比较。结果：两种NLP工具均表现出高性能，吸烟信息的准确率和F1分数均为0.99，肥胖信息分别为0.92和0.91。NLP与结构化数据结合识别出220,714名吸烟患者（43.88%），而单独使用结构化数据仅识别出170,396名（33.87%），相对增加29.5%。对于肥胖，NLP从EHR文本中识别出121,360名患者（24.12%），结构化数据记录为169,905名（33.78%）；纳入NLP衍生特征后额外识别出32,823名患者，相对增加19.3%。结论：在大规模应用中，从非结构化EHR文本中提取的NLP衍生表型相比单独使用结构化EHR数据，能显著提高吸烟和肥胖患者的识别率。
基于深度学习的二尖瓣病因多分类方法：利用有限B型与彩色多普勒超声心动图进行内部与外部验证	Jeong, D.	2026-05-24	PDF	背景：准确识别二尖瓣（MV）的病因分类对指导临床管理至关重要，但目前仍依赖专家视觉判读。尽管基于人工智能（AI）的定量分析取得进展，但在常规成像条件下实现自动化形态学判读仍存在局限。目的：开发并验证一种深度学习（DL）框架，利用有限的常规经胸超声心动图（TTE）切面对主要二尖瓣病因进行多分类。方法：构建多切面深度学习模型，用于分类五种二尖瓣病因（正常、风湿性、退行性、脱垂和功能性）。开发数据集包含来自全国多中心注册研究的4,344例TTE检查。验证采用内部测试数据集和独立外部测试数据集（2,262例TTE检查）。根据二尖瓣反流（MR）严重程度和自动化图像质量（IQ）进行预设亚组分析。结果：模型在内部和外部数据集中对所有二尖瓣病因均展现出稳健性能。在内部测试数据集中，各病因的受试者工作特征曲线下面积（AUROC）范围为0.968至0.997，其中正常瓣膜和风湿性疾病的性能更高。在外部测试数据集中，尽管疾病分布和MR严重程度存在差异，判别性能仍保持稳定（AUROC，0.931-0.992）。与轻度MR相比，中度及以上MR时二尖瓣脱垂的敏感性显著提高，而退行性疾病在各MR严重程度下均持续显示较低敏感性。诊断性能在不同图像质量分层中保持稳定，在所有合格和部分欠佳检查中准确率和宏F1分数相当。在事后分析中，对于存在多种二尖瓣病因的病例，模型在85.7%的病例中正确识别出至少一种专家指定的病因。结论：基于深度学习的有限常规TTE切面分析可实现二尖瓣病因的可靠多分类。该方法可补充定量自动化和专家视觉评估，支持常规超声心动图实践中更一致且可扩展的二尖瓣评估。
MyeGPT：一种用于多发性骨髓瘤的AI智能体	Chang, J. G.	2026-05-24	PDF	如今，我们对癌症生物学理解的进步日益归功于大规模临床分子数据集。以多发性骨髓瘤（第二大常见血液系统恶性肿瘤）为例，CoMMpass研究提供了包含1143名患者配对临床与测序数据的数据集。由于其复杂性，CoMMpass的多组学数据需要编程技能，这对希望在群体数据上验证假设的实验性骨髓瘤研究者构成了障碍。过去几年中，智能体AI的兴起为弥合这一技术鸿沟提供了前所未有的机遇。我们提出MyeGPT（骨髓瘤生成式预训练Transformer），这是一种基于CoMMpass数据集作为真实依据的多发性骨髓瘤AI生物信息学家。MyeGPT可将"诱导治疗后复发患者有何特征"或"比较高表达与正常NSD2表达患者的总生存期"等自然语言查询转化为基于真实数据的新分析，并主动生成可视化结果图表。我们基于CoMMpass开发了一套包含评分标准的评估问题集，通过基准测试确定大语言模型和文本嵌入模型的最佳选择。我们将MyeGPT封装为即用型浏览器应用，支持通过智能手机进行基于CoMMpass的假设验证。
接种疫苗五年后持续的EBOV GP特异性免疫原性：来自刚果民主共和国北基伍省和赤道省的纵向结果	Merritt, S.	2026-05-24	PDF	埃博拉病毒病（EVD）由埃博拉病毒（EBOV）引起，具有高发病率和死亡率的特点，仅刚果民主共和国（DRC）就报告了16次独立的EVD疫情。作为对2018年赤道省和北基伍省疫情的正式应对措施之一，一种重组水疱性口炎病毒-扎伊尔埃博拉病毒包膜糖蛋白疫苗（rVSV-ZEBOV-GP）在紧急使用授权下投入使用。尽管临床试验评估了疫苗的安全性和有效性，但关于疫苗接种后长期抗体持久性的真实世界数据仍然匮乏。本研究呈现了来自北基伍省贝尼市（n=599）和赤道省姆班达卡市（n=482）共1081名在疫情期间接种疫苗个体的血清学数据——样本采集时间从基线至接种后五年。通过多重免疫分析，我们观察到抗EBOV GP抗体的持续反应：在第五年采集的样本中，72%的接种时未感染个体仍保持对EBOV GP的血清反应性。按地区分层分析，在线性和逻辑混合效应模型中，所有疫苗接种后时间点的抗体滴度均显著高于基线水平。姆班达卡地区基线时存在的EBOV GP反应性是抗体反应的最强独立预测因子，与更高滴度和血清阳性率显著相关（OR=3.87，95%CI：2.50-6.01，p值<0.001），这与既往暴露个体的增强效应一致。但该现象在贝尼地区未得到重复（OR：0.66，95%CI：0.27-1.58，p值=0.348）。在姆班达卡地区，报告接种加强针的受种者中，接种后4.2年和5年时的血清反应性概率分别是首剂接种后三周的12.75倍（p值<0.001）和3.68倍（p值=0.04）。与医护人员相比，存在人畜共患或社区层面暴露风险的职业群体血清反应性概率呈下降趋势，该现象在贝尼地区最为显著。最终数据显示，接种rVSV-ZEBOV-GP疫苗五年后，大多数接种者仍可检测到抗EBOV GP抗体。虽然EVD的保护相关性尚未明确建立，但针对EBOV GP的持续性IgG血清反应性可作为未来理解这种高致病性病原体免疫应答持久性及变异性的标志物。