medRxiv 2026-05-21

标题	作者	发布日期	PDF链接	摘要
复发性重度抑郁症中方向特异性兴奋-抑制失衡及其神经生物学基础	Ding, S.	2026-05-21	PDF	背景：重度抑郁症（MDD）以脑区间信息流中断为特征。尽管有效连接（EC）能捕捉这些因果交互作用，但其潜在的微观结构与分子基础仍不明确。本研究旨在探究MDD中方向特异性EC改变及其与层状结构协方差（SC）、转录组和神经递质谱的关联。方法：对REST-meta-MDD联盟（发现组，N=1627）和独立队列（验证组，N=226）的静息态功能磁共振成像和结构磁共振成像数据进行分析。我们基于梁氏信息流计算了无符号和有符号EC，并基于皮层深度计算了层状SC，比较了MDD患者与健康对照组的差异。进一步将EC改变与整合基因表达（AHBA）和神经递质受体（PET/SPECT）的分子谱进行关联分析。随后通过链式中介分析构建从分子基础到EC的层级通路。最后在纵向数据集（药物治疗N=16，神经调控N=11）中评估EC对治疗反应的临床预测价值。结果：分析显示首发MDD的EC无显著改变，但复发性MDD（RMDD）呈现小脑-大脑EC过度驱动模式，其特征为方向特异性兴奋-抑制失衡：抑制性小脑输出增强，同时感觉运动/认知区域的抑制性输入和兴奋性输出同步增加。这些改变受特定层状SC模式的物理约束，尤其涉及中间皮层板层。此外，RMDD患者输入EC改变主要富集于化学突触传递调控相关生物学过程，而输出EC改变与突触结构调节相关。这些EC改变与5-羟色胺能、GABA能和谷氨酸能神经递质系统密切相关。重要的是，我们鉴定出少突胶质前体细胞（OPCs）是连接微观分子特征与宏观连接改变的RMDD关键细胞中介。上述发现在验证数据集中具有可重复性。临床层面，药物治疗主要诱发输入降低伴输出增强的模式，而神经调控则引发输入增强伴输出减弱的反向转变。结论：这些发现揭示了RMDD中方向特异性基因-神经递质-细胞类型-层状SC-EC病理模型。通过整合多尺度生物学机制与临床表型，本研究凸显了定向EC作为难治性抑郁症分层和精准治疗生物标志物的潜力。
生成式人工智能在医学教育与社会行动参与式研究中的应用：人类与人工智能的比较分析	Juniu, S.	2026-05-21	PDF	参与式定性方法（如Photovoice）正越来越多地被用于连接研究与社会行动。人工智能的最新进展可能增强此类参与式方法中的数据分析、推理和行动规划。本研究通过传统Photovoice分析探索医学生对社会正义的认知，并评估生成式人工智能的潜在贡献。九名学生参加了为期六周的研讨会"用Photovoice探索社会正义概念"。首次两小时课程涵盖伦理、Photovoice框架和摄影技巧。参与者随后拍摄反映其社会正义观点的照片，撰写叙事，并参与引导式小组讨论。人类研究人员与学生进行了三阶段Photovoice分析：1）选择照片，2）结合参与者叙事进行情境化，3）归纳编码主题。为探索AI如何支持数据分析，研究团队使用五种生成工具（包括Sonix、ChatGPT和Copilot）分析相同数据。将AI生成的主题和视觉呈现与人类推导结果在一致性、深度和建议行动步骤方面进行比较。传统分析识别出五大主题：（1）社会正义与不平等，（2）矛盾与正义代价，（3）社区与集体行动，（4）环境与环境正义，（5）感知、主观性与视角。AI辅助分析得出六个统一主题，与人类发现高度吻合。传统Photovoice图像传递了真实的生活体验和强烈情感意义，为倡导提供了有力基础。AI生成的图像和主题摘要提供了效率、创造力并减少了研究者偏见，提升了可推广性，但缺乏参与者创作视觉内容中的情感深度和情境细微差别。
癌症手术后口腔微生物群的动态变化：一项关于手术部位感染风险的172样本纵向研究	Serpa, M. S.	2026-05-21	PDF	背景：手术部位感染（SSI）是口腔癌术后围手术期并发症的首要原因，但口腔微生物群在SSI发病机制中的作用仍不明确。本研究前瞻性调查了接受口腔鳞状细胞癌（OSCC）切除术患者中微生物群动态变化与SSI发生的关系。方法：共从45例OSCC患者中采集172份口腔拭子样本，覆盖四个纵向时间点：基线（术前约29天）、术前即刻（入院时）、术后早期（5天内）和术后晚期（6至15天）。通过16S-rDNA V3-V4测序分析细菌组成（172份样本成功测序），并通过qRT-PCR定量细菌/人DNA比值（评估170份样本）。采用改良CDC标准评估术后30天内SSI发生情况。结果：45例患者中14例（31.1%）发生SSI。年龄较小与SSI发生显著相关（SSI组中位年龄53.2岁 vs. 非SSI组67.4岁；p=0.011），年龄每减少1岁风险增加7%。值得注意的是，年轻患者肿瘤更大且分期更晚（T3/T4：中位年龄57.2岁 vs. T1/T2的72.9岁；p=0.033），导致手术范围更广。在所有172份样本中，手术导致术后细菌载量和多样性显著降低。但在术后晚期（第IV次采集），SSI患者α多样性显著高于未感染患者（Observed、Shannon和Simpson指数均p<0.05）。该时间点两组β多样性也存在显著差异（加权UniFrac，p=0.043）。感染时SSI患者以普雷沃菌属和卟啉单胞菌属为主，两者合计占序列数的约40%，而未感染患者仅占9.5%。在纵向分析的172份样本中，术后早期（第III次采集）的聚集杆菌属丰度成为后续SSI的显著预测因子（每增加1%的OR值：1.10；p=0.012），频率>0.044%时风险增加5.7倍。结论：我们的纵向分析表明，虽然OSCC手术会严重破坏口腔微生物群，但非SSI患者在12天内可恢复术前菌群特征。相比之下，SSI以普雷沃菌属和卟啉单胞菌属主导的持续性菌群失调为特征。伴有晚期肿瘤的年轻患者风险尤其高。术后早期聚集杆菌属丰度可能成为SSI的新型风险指标，有望对高危患者实施及时的预防性干预。
文库制备策略对临床宏基因组学中RNA病毒检测灵敏度具有关键影响。	Stepniak, D.	2026-05-21	PDF	临床宏基因组学利用测序技术直接从临床标本中进行非培养依赖的病原体鉴定。尽管许多方案声称具有病原体非特异性，但RNA病毒的检测灵敏度可能低于细菌或真菌，因其需要额外的处理步骤（包括逆转录为cDNA）。序列非依赖性单引物扩增（SISPA）于1991年首次被描述，但其优先富集病毒分子的机制至今未被阐明。本研究提出单引物扩增利用了PCR抑制效应，该效应基于片段长度差异，选择性扩增较长的病毒分子而非较短宿主来源的cDNA片段。该模型预测任何破坏片段长度的上游处理步骤都将阻止这种富集。为验证此假说，我们系统比较了两种接头引入策略——在cDNA合成过程中引入与通过标签化引入——随后进行单引物扩增，使用含16种RNA病毒和3种DNA病毒株的ZeptoMetrix呼吸道检测组合2.1。基于SISPA的方法恢复了对照样本中所有病毒基因组，而通过标签化扩增cDNA的方法未恢复任何病毒序列。随后将对照样本掺入临床提取物中，发现基于SISPA的方法在所有背景条件下表现最佳，但在高背景条件下所有方法均未恢复病毒基因组。最终通过改良SMART-9N方案，证实单引物PCR对整体性能至关重要，表明在需要高RNA病毒灵敏度的临床宏基因组学方案中，应避免直接对cDNA进行标签化及双引物PCR。这些发现证明文库构建策略从根本上决定RNA病毒检测灵敏度，并为直接关联临床宏基因组学的方案优化提供了机制性见解。
无需重新训练的早期多模态ICU死亡率预测	Bakumenko, A.	2026-05-21	PDF	更早的ICU死亡率预测在临床上更具价值，因为能在治疗决策仍可调整时识别高风险患者。然而现有模型多基于固定时间窗口数据训练，因此尚不明确：基于ICU前48小时数据训练的模型，在更早的ICU住院阶段使用时是否仍保持可靠性。我们评估了一个多模态ICU死亡率模型，该模型在MIMIC-III数据集上以48小时数据完成训练后，直接应用于6、12、24及48小时时间点。模型架构包含处理生理时序数据的LSTM、经微调的临床文本专用ClinicalModernBERT模型，以及逻辑回归融合层。模型在更早时间点仍保持强劲性能，表明无需重新训练即可在ICU早期实现有效的死亡率预测。在6小时时间点，模型AUROC达0.777，且无需任何重校准即保持良好校准性（ECE 0.038），并在所有时间窗口均优于单模态模型。多模态优势在生理数据稀疏的早期时间窗口最为显著：两个模态间的预测一致性从48小时到6小时下降超过50%，而临床文本的中位贡献率从37%提升至49%。贝叶斯融合层版本显示，随着数据积累，存活患者的不确定性降低，但非存活患者的不确定性仍维持高位；最不确定病例的死亡风险高达其他病例的4.9倍。连续小时级分析进一步表明，临床文本在文档记录间隔期间提供稳定的上下文信息。直接沿用最近一次临床记录的策略，其表现优于文本衰减模型和文档间隔模型。这些结果表明，基于48小时数据训练的多模态ICU死亡率模型无需重新训练即可提供可靠的早期预测，同时能识别出最难解释的病例。
医学AI系统的语言依赖性诊断安全性：一项跨语言基准测试与前瞻性临床研究	Wang, Y.	2026-05-21	PDF	背景全球患者以多种语言接受医疗服务，但医疗AI系统几乎仅在高资源语言（如英语和中文）中完成验证，这使得其他语言环境中的患者面临未量化的诊断风险。现有多语言评估依赖翻译的研究型基准测试，无法反映真实的临床工作。本研究旨在描述真实临床环境中多语言医疗AI部署对患者安全的影响，并开发一种可审计的检测方法以识别不安全输出。方法我们评估了不同语言模型（LLM）和视觉语言模型（VLM）在四种真实临床任务（对话式问答、放射报告生成、青光眼诊断、ICU再插管预测）中，使用五种语言（英语、中文、马来语、泰语、波斯语）的表现。开发了词元级不确定性工具包以定位推理不稳定性，比较了三种推理范式（母语、英语思维链、回译枢轴），并开展了一项前瞻性研究（50次对话，150份经医生审核的记录）。结果在所有任务中，LLM/VLM性能从高资源语言到低资源语言持续下降。关键差距包括：HealthBench评分从0.3743降至0.3180；放射学宏F1从0.2938降至0.2149-0.2424，与选择性病理抑制一致；青光眼准确率从50.7%降至32.7%；ICU参数召回率从100.0%降至48.5%。多模态输入加剧了性能下降。Qwen3 VL 235B在青光眼分类中表现出衰减减缓且无资源顺序模式。词元级分析将不稳定性定位至中间链阶段（归一化轨迹的40-70%）；基于困惑度的置信度未能标记错误（AUROC 0.41-0.66）。回译枢轴持续恢复了性能。在前瞻性研究中，98.7%的记录需要医生编辑（总体修改评分53.6%）；泰语枢轴修正负担（59.0%）超过英语枢轴（50.7%，p=0.003）和中文直接（51.0%，p=0.004）。解释多语言部署产生了临床后果严重的失败，包括遗漏病理、扭曲生理参数提取以及放大多模态误分类，这些问题在单语言验证中不可见，且无法被模型置信度可靠标记。预训练数据构成可能加剧多语言安全风险。在非主导语言医疗环境中部署前应进行语言特异性安全审计；开源检测工具包无需模型重新训练即可实现此功能。
解决儿童白血病全球诊断差距：一项基于纳米孔自适应采样全基因组测序的全球多中心2型混合验证研究	Alexander, T. B.	2026-05-21	PDF	背景：儿童及青少年白血病的现代治疗需要基于基因组亚型的精准风险分层。尽管基于短读长二代测序（NGS）的方法在资源高度集中的有限环境中提供了全面的临床诊断，但其成本高昂、速度缓慢，且全球大多数儿童无法获得。亟需变革性方法以改善全球白血病诊断分类。方法：我们同步持续开发了分析流程NASVar（纳米孔自适应采样变异检测），并在不同诊断资源水平的医院中开展了一项多中心、二型混合临床验证研究，评估牛津纳米孔技术（ONT）自适应采样全基因组测序（asWGS）检测方法。为准备实施，全球专家组制定了基于白血病的标准化基因集及共识性实验室开发检测（LDT）验证指南。在收集检测有效性指标（与现有常规及正交NGS方法对比）的同时，同步采集了可行性、保真度、适宜性及成本等实施结局数据。结果：四个中心均成功完成LDT验证，仅需极少调整即可符合监管要求。共对457份标本进行测序（331例B-ALL、83例AML、43例T-ALL）。在210例经本地确认DNA变异定义的B-ALL基因组亚型病例中，asWGS的符合率为100%（210/210）。本地定义为B-other的病例中，47%（49/105）通过asWGS发现疾病定义性DNA变异而获得分型。另有41%（43/105）的本地B-other病例通过整合DNA甲基化数据完成分类，所有16例B-ALL患者来源异种移植对照均正确，最终该队列中96%（318/331）的B-ALL病例通过单一asWGS检测完成分型。在AML中，97%（56/58）经本地确认基因组亚型的病例通过自动化asWGS分析识别，另有两例经靶向人工复核后确认。在巴基斯坦信德省医院，B-ALL和AML的诊断性基因组亚型检出率从本地标准诊断检测的28%提升至asWGS的84%。美国地区试剂耗材成本（按三样本混合检测计算）为343美元/样本。基于混合验证结果，所有中心正独立准备临床结果回报。结论：ONT asWGS已在四个不同医院环境中成功验证为临床检测方法。作为单一多组学平台，该技术在高资源至资源有限环境中均能创造价值，为弥合全球癌症诊断公平性差距提供了颠覆性解决方案。
唾液疱疹病毒分析揭示HHV-6与长新冠严重程度之间的关联	Laxton, C. S.	2026-05-21	PDF	背景人类疱疹病毒（HHVs）的再激活，尤其是EB病毒，与更严重的急性SARS-CoV-2感染及长新冠（LC）的发生相关。在LC患者中观察到较高水平的抗EBV抗体，支持HHVs的慢性再激活可能参与LC病理过程的观点。此前研究还发现唾液中的HHV脱落与唾液激素水平存在关联。本研究旨在探讨唾液HHV DNA脱落与LC症状及皮质醇、睾酮、雌二醇水平之间的关系。方法我们招募了45名LC参与者和45名年龄性别匹配的对照组。通过调查问卷和经过验证的健康问卷收集人口学信息、病史及症状特征。唾液样本在连续两天的清晨醒来时、醒来后15分钟、30分钟、45分钟、8小时及16小时自行采集。检测唾液皮质醇、睾酮和雌二醇水平，并使用多重qPCR检测提取核酸中的EBV、HSV 1/2、HCMV和HHV-6 A/B，同时通过RT-qPCR检测SARS-CoV-2和RNaseP。结果唾液EBV和HHV-6 DNA的检出率在清晨最高。LC组与对照组在唾液皮质醇、睾酮、雌二醇水平以及EBV或HHV-6脱落方面无显著差异。然而，唾液HHV-6 DNA水平与更高的综合LC倾向评分、焦虑及抑郁评分呈正相关。解释观察到的唾液HHV-6脱落与症状严重程度之间的相关性提示HHV-6可能参与急性期后疾病的发生，但其机制尚不明确。尽管本研究未发现唾液EBV脱落与LC之间的关系，但EBV可能在疾病更早阶段或本研究未采样的其他部位发挥作用。这些发现强调了HHV-6在LC病理生理学中的潜在重要性，并提示需开展纵向、多部位的疱疹病毒再激活研究。
研究方案：飞利浦视觉患者化身对围手术期护理中生命体征偏差及可听警报负担的影响——一项双中心、准实验性前后对照大数据研究方案（纽约长老会医院/威尔康奈尔医学中心与苏黎世大学医院）	Jiang, S. Y.	2026-05-21	PDF	围术期患者监测要求临床医生在时间压力和频繁中断下整合多源生理数据。传统监护仪主要以独立数值和波形形式呈现生命体征，需依次解读并完成心理整合，对认知能力要求较高。听觉警报虽旨在提升安全性，却导致警报疲劳并增加工作负荷。关键生理变量超出预设安全范围的时间及过度警报负担均与不良预后相关，这促使研究者探索既能支持早期识别和情境感知、又不增加认知负荷的监测方案。飞利浦可视化患者化身技术通过在监护仪上显示基于化身的可视化界面，将多组生命体征和传感器状态整合为动态虚拟患者，同时保留传统数值显示。尽管实验室、模拟及定性研究提示基于化身的监测具有优势，但其对客观监测结局的影响尚未得到系统量化。
基于生成式医疗事件模型的腹痛患者急诊后轨迹预测	McCann, K. A.	2026-05-21	PDF	重要性：腹痛每年导致约1000万美国急诊科就诊，多数患者最终出院。出院后病程各异，但现有风险模型仅能预测是否发生急诊复诊，无法预判复诊结局。目的：评估生成式医疗事件基础模型Curiosity能否预测成人腹痛患者急诊出院后的病程轨迹，区分预期结局的时间与严重程度。设计：回顾性队列研究；纳入2022年1月1日至12月31日就诊病例；随访30天；分析于2026年进行。场所：Epic Cosmos研究网络（多中心、基于人群、去标识化电子健康记录）。参与者：急诊科因腹痛出院且未纳入训练集的成人（≥18岁）患者。从150,030例合格患者中随机抽取3,000例（女性65.3%；中位年龄47岁[IQR 36-60]）。暴露因素：腹痛评估后急诊出院。主要结局与测量指标：主要指标：Curiosity模型与分任务独立训练的XGBoost模型在72小时、7天、30天时，以入院告终的急诊复诊（入院复诊）、以出院告终的急诊复诊（出院复诊）及任意急诊复诊的受试者工作特征曲线下面积（AUROC）比较。次要指标：36种轨迹类别的轨迹级准确率及与XGBoost的编辑距离比较；45种转归中模拟与观察条件路径概率的校准度。结果：Curiosity识别需入院复诊高风险患者的能力优于XGBoost，并能区分可能无需入院复诊的患者。在3,000例患者中，Curiosity的30天入院复诊AUROC为0.83（95% CI 0.79-0.87），XGBoost为0.70（95% CI 0.65-0.75）（DeLong检验P<.001）；入院复诊AUPRC为0.37（95% CI 0.29-0.46），队列基线率为4.1%，XGBoost为0.13（95% CI 0.09-0.19）。Curiosity为45.9%的患者识别出36种可能轨迹中最可能的一种（XGBoost为41.0%；McNemar检验P<.001），中位编辑距离为1.28 vs 1.40（Wilcoxon检验P<.001）。45种转归的中位绝对校准误差为1.30个百分点（95% CI 0.32-2.49）。结论与相关性：生成式医疗事件基础模型可产生校准的轨迹级预测，在区分入院复诊方面优于任务特异性XGBoost基线模型，能有效区分复诊后入院与复诊后出院的患者。