2026-05-05 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
AlbumFill：基于专辑引导推理与检索的个性化图像补全	Yu-Ju Tsai	2026-05-04	PDF	个性化图像补全旨在修复个人照片中被遮挡的区域，同时保留身份特征和外观。现有方法要么依赖通用修复模型（往往无法保持身份一致性），要么假设已明确提供合适的参考图像。实际应用中，合适的参考图像通常不会明确给出，需要系统在个人照片集中搜索身份一致的图像。我们提出AlbumFill——一种无需训练的框架，能从个人相册中检索身份一致的参考图像用于个性化补全。给定一张被遮挡图像和个人相册，视觉语言模型推断缺失的语义线索以引导组合图像检索，检索到的参考图像随后被基于参考的补全模型使用。为促进该任务，我们引入包含5.4万个人体中心样本及其关联相册图像的数据集。跨多个基线的实验表明个性化补全的难度，并凸显了身份一致参考检索的重要性。项目页面：https://liagm.github.io/AlbumFill/
SpecKV：基于压缩感知伽马选择的自适应推测解码	Shikhar Shukla	2026-05-04	PDF	推测解码通过使用小型草稿模型提出候选令牌，再由大型目标模型验证，从而加速大语言模型推理。该过程中的关键超参数是推测长度γ，它决定草稿模型每步提出的令牌数量。现有系统几乎都采用固定γ（通常为4），但经验证据表明，最优值会随任务类型变化，且关键取决于目标模型应用的压缩程度。本文提出SpecKV——一种轻量级自适应控制器，利用草稿模型自身提取的信号，在每步推测中动态选择γ。我们针对4类任务、4种推测长度和3种压缩级别（FP16、INT8、NF4）对推测解码进行性能分析，收集了5112条步级记录，包含每步接受率、草稿熵和草稿置信度。实验表明，最优γ会随压缩模式变化，且草稿模型置信度和熵是接受率的强预测因子（相关性约0.56）。SpecKV使用基于这些信号训练的小型MLP，最大化每步推测的预期令牌数，在固定γ=4的基准上实现56.0%的提升，每次决策仅增加0.34毫秒开销（占步长时间<0.5%）。该改进具有统计显著性（配对自助法检验p<0.001）。我们已将所有性能分析数据、训练模型和代码笔记作为开源成果发布。
无监督机器学习用于检测欧洲区域统计中的结构性异常	Bogdan Oancea	2026-05-04	PDF	确保区域社会经济统计数据的连贯性是国家统计机构的核心任务。传统验证工具（如范围编辑、比率检验或单变量异常值检测）虽能有效识别单个序列中的极端值，但在高维场景下难以发现指标间的异常组合。本文提出一种无监督机器学习框架，利用公开的欧盟统计局数据识别欧洲范围内结构异常的区域特征。我们构建了涵盖2022年NUTS2区域的横截面数据集，包含四项关键指标：按购买力标准计算的人均GDP、失业率、高等教育完成率及人口密度。通过应用并比较五种异常检测技术（单变量Z分数、马氏距离、孤立森林、局部异常因子及单类支持向量机），将至少被其中三种方法标记的区域归类为结构异常。研究结果表明，机器学习方法识别出一组多变量特征显著偏离欧盟整体模式的区域，既包括高度发达的大都市经济体（布鲁塞尔、维也纳、柏林、布拉格），也涵盖长期面临社会经济劣势的地区（斯洛伐克中西部、匈牙利北部、卡斯蒂利亚-拉曼恰、埃斯特雷马杜拉），以及特征与欧盟首都区域显著不同的伊斯坦布尔。值得注意的是，这些异常未必反映数据质量问题，而是代表需要分析或政策关注的结构性差异。该框架完全可复现、可扩展，且兼容现有验证流程，为欧洲统计系统内早期识别异常区域配置提供了灵活工具。
MolmoAct2：面向实际部署的动作推理模型	Haoquan Fang	2026-05-04	PDF	视觉-语言-动作（VLA）模型旨在为机器人提供单一通用控制器，但当前系统在现实部署的关键指标上仍存在不足。前沿模型处于封闭状态，开源权重方案受限于昂贵硬件，增强推理的策略因基础能力不足而面临高昂延迟，微调后的成功率仍低于可靠使用的阈值。我们提出MolmoAct2，一个完全开放的动作推理模型，专为实际部署而构建，在五个维度上对其前代模型进行了改进。我们引入MolmoER，一个专为空间和具身推理优化的VLM主干网络，基于330万样本语料库，采用"专精化-再排练"的训练方案。我们发布三个覆盖低至中成本平台的新数据集，包括MolmoAct2-BimanualYAM——720小时遥操作双臂轨迹数据，构成迄今最大的开放双臂数据集，以及经过质量筛选的Franka（DROID）和SO100/101子集。我们提供OpenFAST，一个开放权重、开放数据的动作分词器，基于五种具身形态的数百万条轨迹训练。我们重新设计架构，通过逐层KV缓存条件化，将流匹配连续动作专家模块嫁接至离散分词VLM。最后，我们提出MolmoThink，一种自适应深度推理变体，仅对时间步间变化的场景区域重新预测深度标记，以先前延迟的一小部分代价保留几何基础能力。在迄今最全面的开放VLA实证研究中（涵盖7个仿真和真实世界基准），MolmoAct2优于包括Pi-05在内的强基线模型，而MolmoER在13个具身推理基准上超越GPT-5和Gemini Robotics ER-1.5。我们发布模型权重、训练代码和完整训练数据。项目页面：https://allenai.org/blog/molmoact2
复合材料力学中的多保真代理模型：从协同克里金到多保真神经网络	Haizhou Wen	2026-05-04	PDF	复合材料具有强烈的层次性和各向异性特性，其行为受跨组分、铺层、层合板、结构和制造历程的耦合机制支配。这种内在复杂性使得复合材料预测建模成本高昂，因为需要大量重复实验和高保真度模拟来覆盖材料、结构和制造的大设计空间。多保真度代理建模通过将丰富的低成本数据与有限的高精度数据相结合，恢复可靠的高保真度预测，从而应对这一挑战。本综述系统梳理了复合材料力学中的多保真度建模方法，涵盖基于高斯过程或克里金法的方法，包括协同克里金法、协同区域化模型、自回归公式、非线性自回归高斯过程、多保真度深度高斯过程以及多保真度神经网络。从跨保真度相关性、差异表征、不确定性量化和可扩展性角度分析了这些方法的差异。根据多保真度代理在工程问题中的作用，介绍了其在复合材料中的典型应用案例，包括用于快速探索材料设计空间的正向预测、在有限高保真度数据条件下进行复合材料参数识别与设计搜索的逆向优化，以及工作流集成——其中异构数据源、约束条件和验证需求共同决定模型效用。开放问题讨论聚焦于复合材料特有的持续性挑战，例如与非线性损伤和制造历程相关的保真度区间差异、仿真与实验之间的失配，以及多保真度模型间的不确定性传播。
EvoPoC：基于层次化知识图谱的DeFi智能合约自动化漏洞利用合成	Ruichao Liang	2026-05-04	PDF	去中心化金融中的智能合约漏洞每年造成超过数十亿美元的损失，然而安全社区面临一个关键瓶颈：识别漏洞并不等同于证明其可被利用。手动构建概念验证（PoC）的劳动强度过高，导致大多数已披露的漏洞未经验证，协议在应用缓解措施之前长期暴露于风险中。本文提出\sys，一种知识驱动的智能系统，用于端到端的合约漏洞检测与利用合成。我们的核心见解是：利用合成并非代码生成任务，而是一个需要基于协议语义、故障根本原因和利用原语的结构化推理问题。\sys将这些知识组织为分层知识图谱（HKG），作为LLM引导的多跳推理的结构化记忆。为验证超出代码合成的利用可行性，\sys采用两阶段验证框架，通过SMT求解检查利用路径可达性，并通过资产级状态模拟检查利润可实现性，确保生成的PoC同时满足逻辑和经济可行性约束。在88个真实DeFi攻击和72个审计项目（2573个合约）上的评估中，\sys在检测方面实现了98%的召回率和0.9的F1分数，利用成功率（ESR）达96.6%，复现了85个历史利用并恢复了超过1.162亿美元收益。\sys在ESR上比最先进的模糊测试工具（\textsc{Verite}、\textsc{ItyFuzz}）高出5倍，在可恢复价值上高出300倍，比基于LLM的利用生成器\textsc{A1}分别高出2倍和8.5倍。在漏洞赏金评估中，\sys识别了16个已确认的零日漏洞，帮助保护了超过7060万美元资产，并获得了2900美元赏金。
通过SHAP分析算法与超参数提升机器人强化学习的泛化能力	Lingxiao Kong	2026-05-04	PDF	尽管强化学习（RL）取得了显著进展，模型性能仍对算法和超参数配置高度敏感，而跨环境的泛化差距进一步阻碍了实际部署。虽然已有研究探讨RL的泛化问题，但特定配置对泛化差距的相对贡献尚未被定量分解并系统性地用于配置选择。为解决这一局限，我们提出一个可解释框架，利用SHapley加法解释（SHAP）评估机器人环境中RL性能，量化配置影响。我们建立了将Shapley值与泛化能力关联的理论基础，实证分析配置影响模式，并引入SHAP引导的配置选择以增强泛化性。研究结果揭示了算法与超参数的不同模式，且配置影响在多样化任务与环境中保持一致。通过将这些见解应用于配置选择，我们实现了RL泛化能力的提升，并为实践者提供了可操作的指导。
面向农村专题道路提取的拉普拉斯频率交互网络	Baiyan Chen	2026-05-04	PDF	农村主题路网构建旨在从农机运动轨迹图像中提取拓扑道路结构。然而，该任务面临现有研究中常用的降采样方法易模糊稀疏高频道路结构，且密集田间作业产生的强噪声常导致提取网络出现拓扑碎片化或冗余的挑战。针对这些问题，我们提出拉普拉斯频率交互网络（LFINet）。该网络首先通过拉普拉斯多尺度分离器（LMS）将图像解耦为低频语义上下文与高频结构细节，随后由跨频率交互模块（CFIB）通过双路径架构处理这些成分——其中高频模块（HFB）精炼局部结构，空间变换器（ST）捕获全局语义。接着，频率门控调制机制（FGM）利用语义上下文校准结构细节，融合双路径特征。最后，渐进式重建解码器迭代融合多尺度特征以确保拓扑一致性。在中国河南省真实农业轨迹数据集上的实验表明，LFINet达到了新最优水平：F1分数92.54%，IoU 86.12%，分别超过第二名方法0.64%和1.1%，证实了其从含噪稀疏田间数据中有效构建拓扑路网的能力。
像素完美：基于空间感知失真的关系型图像质量评估	Fadeel Sher Khan	2026-05-04	PDF	传统图像质量评估（IQA）方法依赖平均意见分数（MOS），这类数据收集成本高且无法针对特定图像失真提供可解释的局部反馈。我们通过将绝对质量预测转向关系型与方向性评估来突破这些局限。该方法采用自监督合成失真引擎生成训练数据，无需人工标注。失真预测网络通过反对称目标函数进行训练，生成具有空间感知能力的解耦映射图，可识别相对于参考图像的失真类型、强度及方向。随后，通过对比学习在有序排序图像集上训练评分网络，预测关系型质量分数。本方法为图像处理算法的定向优化提供了更细粒度、可解释的IQA方案，全程无需人工标注质量分数。
基于语义风险感知的动态环境下机器人导航启发式规划：一种受大语言模型启发的方法	Hamza Ahmed Durrani	2026-05-04	PDF	将大语言模型推理原理融入经典机器人路径规划，是当前快速发展的研究方向。本文提出语义风险感知启发式规划器，将受大语言模型启发的代价函数（惩罚几何拥挤或高风险区域）编码到A*搜索框架中，并在检测到动态障碍物时增加闭环重规划机制。我们在15×15网格世界（静态障碍物密度20%，含随机动态障碍物）中开展200次随机试验，将SRAH与两种基线方法（带重规划的广度优先搜索和无重规划的贪婪启发式）进行对比。SRAH任务成功率达62.0%，较BFS（56.5%）相对提升9.7%，较贪婪法（4.0%）提升显著。我们进一步分析了规划开销、路径效率与故障恢复次数之间的权衡关系，并通过障碍物密度消融实验证明，语义代价整形能在不同难度环境中持续改善导航性能。结果表明，即使轻量级的大语言模型启发式方法也能为自主机器人导航带来可量化的安全性与鲁棒性提升。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
腹侧和尾侧纹状体中的多巴胺支持奖赏-威胁冲突中的全局与局部评估。	Green, I.	2026-05-05	PDF	生存需要在追求奖赏与规避威胁之间取得平衡，但不同多巴胺系统如何协同支持这一过程仍不明确。通过采用自然觅食范式（小鼠在怪物物体威胁下追逐水源奖赏），我们研究了投射至腹侧纹状体（VS）和纹状体尾部（TS）的多巴胺通路的作用。消融投射至VS的多巴胺神经元会同时损害远端奖赏追求和威胁规避行为，其中威胁规避的受损程度与TS多巴胺消融的效果相当。然而，同步记录揭示了不同的活动规律：当动物在奖赏与庇护所目标间切换时，VS多巴胺追踪朝向当前目标的径向速度，符合空间价值的时间差分误差；而TS多巴胺编码与威胁物的距离和朝向，反映即时感官体验。综合来看，VS和TS多巴胺通过评估不同的状态信息实现规避行为：VS多巴胺促进异我中心的目标导向导航，而TS多巴胺促进自我中心的刺激驱动型威胁反应。
妊娠晚期等效酒精暴露导致成年期运动活动、焦虑风险行为的性别依赖性改变，并增强机械性异常性疼痛。	Villicana, E.	2026-05-05	PDF	产前酒精暴露（PAE）会导致胎儿酒精谱系障碍（FASDs），这是一种以行为失调、学习缺陷和认知僵化为特征的神经发育疾病。酒精暴露在人类妊娠的所有阶段（包括孕晚期）均具有危害性。这一发育窗口期以大脑快速生长、髓鞘形成和神经回路构建为特征，可能尤为脆弱，但该时期酒精暴露对行为和感觉的长期影响仍知之甚少。本研究对新生小鼠幼崽在出生后第4天至第8天（相当于人类孕晚期酒精暴露，TTAE）进行乙醇（EtOH）或空气蒸汽暴露。第8天测得的血乙醇浓度约为250 mg/dL，符合暴饮式暴露水平。待空气暴露组和乙醇暴露组小鼠成年至5-6月龄时，评估其自主活动能力、焦虑相关冒险行为、识别记忆，以及通过坐骨神经轻度慢性压迫损伤（mCCI）后对轻触刺激的敏感性（即外周神经病变易感性）。我们发现，TTAE足以产生性别依赖性的长期行为改变。值得注意的是，与对照组相比，乙醇暴露的雄性小鼠表现出自主活动增加和冒险行为增多，而雌性小鼠则表现出最小或减少的变化。然而，乙醇暴露的雄性和雌性小鼠在mCCI后均表现出显著的轻触刺激敏感性增强（即机械性异常性疼痛），而空气暴露对照组则无此反应。综上，这些发现表明TTAE对行为调节具有高度危害性，并会导致成年期神经病理性疼痛的易感性。
通过通道动力学实现细胞类型特异性的放电率统计感知与控制	Ramirez-Hincapie, A.	2026-05-05	PDF	神经元通过长时间尺度上对放电活动的稳态调节来维持功能。已知钙依赖性电导表达可调节平均放电频率，但这不足以确保放电活动的动态范围及对输入的敏感性。这引发了一个问题：放电频率的方差能否在细胞内被感知并调控。通过使用基于电导的模型，我们证明时间平均的细胞内钙动力学天然地提供了放电活动均值与方差的直接读数。因此，基于钙的膜电导密度反馈调节能够协同稳定放电频率的均值与方差以应对输入扰动。由于调节最大电导会改变速率统计量之间的潜在关系，细胞的稳态响应具有状态依赖性而非固定不变。因此，细胞类型特异性的离子电导组合会产生不同的稳态模式，这意味着细胞类型不仅决定了放电特性与整合特性，也决定了稳态行为。
核纤层蛋白与谱系相关转录因子在谱系发育过程中协同调控基因表达。	Debic, S.	2026-05-05	PDF	核纤层蛋白是中间丝蛋白，作为核纤层的普遍结构组分，与核纤层相关染色质结构域（LADs）相互作用并维持其组织。LADs在发育过程中发生重塑，而核纤层蛋白维持特定细胞类型的LADs及基因表达谱。目前尚不清楚普遍存在的核纤层蛋白如何在发育过程中实现细胞类型特异性功能。我们证实，核纤层蛋白A和B1是小鼠妊娠中期胚胎发生所必需的，并在卵黄囊内胚层（YSE）中维持LADs、三维染色质相互作用及基因表达。YSE细胞中受核纤层蛋白调控的基因及重塑的LADs均包含YSE相关转录因子的结合基序。通过分析核纤层蛋白A和B1敲除后染色质相互作用的变化，我们发现这些核纤层蛋白维持的染色质邻域可影响由YSE相关转录因子协调的基因表达。本研究揭示了普遍表达的核纤层蛋白如何与谱系特异性转录因子协同作用，以维持特定细胞类型的LADs及基因表达程序。
H3K9me3作为胚胎祖细胞中谱系特异性增强子的守门人	Ito, K.	2026-05-05	PDF	尽管许多关于发育调控的研究聚焦于基因激活，但关于调控程序在祖细胞中主动抑制的程度仍知之甚少。我们此前发现，当内胚层祖细胞向肝脏和胰腺β细胞命运转变时，组蛋白H3第9位赖氨酸的三甲基化（H3K9me3）作为一种抑制性标记，会在蛋白编码基因上发生重塑。然而，H3K9me3在启动子和增强子区域的动态变化尚未明确。本研究发现，肝脏特异性基因的启动子在未分化祖细胞中显著富集H3K9me3，而广泛表达的肝脏基因启动子则未观察到此类富集。进一步研究表明，分化组织（包括肝脏、胰岛和大脑皮层）特异性增强子在其对应的组织干细胞和祖细胞中均高度富集H3K9me3。在肝母细胞中，H3K9me3通过限制FOXA2和HNF4与多数增强子结合来维持未分化状态，但仍有数千个标记H3K9me3的增强子未被限制因子结合。我们的发现揭示了H3K9me3介导的异染色质化如何限制祖细胞中转录因子的结合，从而防止早期发育中的异常激活。允许转录因子结合的增强子上的H3K9me3可能反映了发育潜能。
野火导致美国西部森林活生物量净减少。	Zarakas, C.	2026-05-05	PDF	由于森林资源清查测量存在滞后性，量化近期森林碳变化仍具挑战性。美国国家森林清查每五至十年对样地进行复测，因此利用清查数据估算当前碳储量需基于最近一次样地测量结果进行外推。我们通过将Landsat卫星的空间显式火灾干扰与冠层覆盖数据，结合统计模型与森林清查数据融合，解决了这一外推难题。我们生成了2005至2022年美国西部活体森林碳的年度估算值，发现活体森林生物量在2005至2015年间持续增长，随后在2015至2022年间下降5%——这一信号被美国官方报告和地球系统模型双双遗漏。趋势逆转的首要驱动因素是野火导致的树木死亡率上升，次要因素是无干扰区域碳积累速率放缓。我们的研究结果凸显了核算快速变化干扰机制的重要性，有助于改进管辖区碳核算，并为联邦及州级气候减缓策略在多大程度上可依赖土地实现净零排放目标提供依据。
通过大规模平行报告基因分析鉴定影响阿尔茨海默病风险的功能性非编码变异	Hudgins, A. D.	2026-05-05	PDF	晚发型阿尔茨海默病（LOAD）的大多数遗传风险变异位于非编码基因组区域，提示它们通过破坏转录调控程序发挥致病作用。为系统鉴定功能性变异，我们在THP-1人单核细胞系中开展了无偏倚、高通量的大规模平行报告基因检测（MPRA），对24个LOAD全基因组关联研究（GWAS）位点中的2,231个单核苷酸多态性（SNP）进行筛选。我们鉴定出62个具有显著等位基因特异性转录调控活性的变异，包括MS4A位点中的rs636317。rs636317的风险等位基因破坏了CTCF结合基序，改变了精细尺度的染色质环化结构。为验证这些发现，我们利用CRISPR/Cas9技术在H9人胚胎干细胞中构建了rs636317 T等位基因的等位基因特异性缺失。从这些编辑细胞分化而来的单核细胞表现出MS4A4E、MS4A6A和TREM2表达升高，同时可溶性TREM2（sTREM2）水平显著上升。这些结果揭示了非编码遗传变异、MS4A家族转录调控与阿尔茨海默病发病机制中TREM2介导的免疫反应之间的机制关联。
藻类特异性免疫调节影响共生珊瑚对热和病原体挑战的响应	Da-Anoy, J.	2026-05-05	PDF	共生藻类在珊瑚生活史及宿主健康中的作用已有充分记载，但宿主容纳这些共生体所付出的免疫与生理代价仍鲜有探究。尽管已知与杜氏藻属（Durusdinium）的共生关系能赋予珊瑚耐热性，但该关联也被发现与应激状态下的珊瑚组织损失相关。本研究探究了藻类类型是否影响热带珊瑚 Pocillopora acuta 的宿主免疫与应激反应。与携带枝鞘藻属（Cladocopium）的珊瑚（C-宿主型）相比，携带杜氏藻属的珊瑚（D-宿主型）具有独特的转录组特征、更高的免疫相关基因表达水平以及免疫转录因子NF-κB的基础表达量升高。在热胁迫下，D-宿主型P. acuta出现组织损失、氧化应激、免疫与微生物失调，而C-宿主型P. acuta更易发生白化、代谢紊乱，以及固氮菌和抗氧化菌数量下降。此外，溶珊瑚弧菌（Vibrio coralliilyticus）感染导致D-宿主型珊瑚出现严重组织损失，但C-宿主型珊瑚未受影响。我们的研究结果揭示了杜氏藻属共生关系如何增强耐热性却使珊瑚在应激下更易发生组织损伤的机制性解释，揭示了在多重胁迫下可能损害宿主存活的免疫权衡。
一项新指标揭示了单细胞RNA测序数据降维中此前未被识别的失真现象。	Hamilton, T.	2026-05-05	PDF	高维数据在几乎所有科学领域正变得越来越普遍。开发分析这些数据并理解其含义的方法已成为紧迫问题，尤其对于单细胞RNA测序（scRNA-seq）技术而言——该技术可同时测量数千至数百万个单细胞中数万个基因的表达水平。主流分析流程通常先大幅降低数据集维度再进行下游分析，但这种方法存在一个问题：降维可能引入显著的数据失真，特别是破坏某些数据点的局部邻域结构。由于细胞类型聚类或轨迹推断等许多scRNA-seq分析依赖这些近邻关系，数据在该方面的失真可能显著影响分析结果。本文提出一种通过比较降维前后数据点局部邻域来量化失真的直接方法。我们发现，即使对于简单模拟数据集，t-SNE和UMAP等流行技术也会引入显著失真。对于scRNA-seq数据，局部邻域的失真程度常超过95%，且共识scRNA-seq分析流程各步骤间不存在一致的邻域集合。我们还发现这种失真对细胞类型聚类及其他下游分析结果产生深远影响。研究结果表明，在解读UMAP等工具生成的二维可视化结果时必须谨慎，亟需开发能更有效保留数据局部拓扑结构的新型降维工具。
MolGene-E：调控单细胞转录组学的逆向分子设计	Ohlan, R.	2026-05-05	PDF	设计能够将病变细胞恢复至健康状态的药物，是系统药理学中应对传统靶向药物发现范式未能满足医疗需求的新兴方法。单细胞转录组学可全面绘制病变与健康细胞状态间的差异，使其成为系统药理学的重要技术手段。然而，单细胞组学数据存在噪声大、异质性强、样本稀缺且维度高等特点，目前尚无机器学习方法能利用此类数据设计新药分子。我们开发了名为MolGene-E的新型深度生成框架以应对这一挑战。该框架整合了两个创新模型：1）跨模态模型，可协调并降噪化学扰动下的批量与单细胞转录组学数据；2）基于对比学习的生成模型，能依据转录组学数据生成新分子。在两种评估场景的基因表达谱中——L1000toRNAseq数据集的CRISPR敲除扰动谱与Sciplex-3数据集的单细胞基因表达谱——MolGene-E在零样本分子生成任务中始终优于基线方法，在多种全新分子生成指标上均表现卓越。广泛评估表明，MolGene-E在零样本分子生成领域达到了最先进水平，使其成为药物发现领域极具潜力的新工具。

medRxiv

标题	作者	发布日期	PDF链接	摘要
Patient2Sentence：基于大型语言模型的肿瘤试验资格筛选语义压缩方法	Yoshinari, G. H.	2026-05-05	PDF	肿瘤学临床试验的高效招募受限于对冗长、异构电子健康记录（EHR）的解读需求，这些记录大多为非结构化且难以自动化处理。我们提出Patient2Sentence（P2S）框架，该框架基于大语言模型，能将完整的肿瘤学EHR语义压缩为简洁、标准化的自然语言患者描述句，同时保留决定入组资格的临床逻辑。基于KATHERINE、MONARCH-E和OLYMPIA三项乳腺癌临床试验的75份全合成EHR数据，我们比较了从完整临床叙述中得出的入组资格分类结果与仅从压缩患者描述句中得出的分类结果。通过一致性指标和配对统计检验，将入组决策与专家裁定进行对比评估。基于描述句的分类结果与专家判断的符合率达94.7%（Cohen's kappa=0.83），与完整记录评估的诊断准确性无统计学显著差异（McNemar检验p=1.00），证明语义压缩在入组筛查中的非劣效性。针对不同试验的符合率分别为：MONARCH-E达100%，OLYMPIA达96%，KATHERINE达88%，表明该方法在异质性入组标准下均表现稳健。语义压缩使令牌消耗平均减少67.1%，计算效率提升三倍且未损失推理保真度。通过将复杂肿瘤学记录重构为人类可解读、语义密集的句子，P2S为AI辅助试验筛查提供了可解释、可扩展且保护隐私的解决方案。该框架通过实现非结构化临床叙述的互操作处理，推动生物医学计算发展，并支持将大语言模型整合到旨在加速临床试验招募的转化研究流程中。
人类性状中功能负担多效性与基因剂量反应的决定因素	Kazem, S.	2026-05-05	PDF	基因剂量多效性与单调性效应是理解发育性儿科及精神疾病共病机制的核心，但其潜在生物学过程尚不明确。我们开发了功能负荷分析（FunBurd）方法，对英国生物银行约50万参与者中全基因组所有蛋白编码拷贝数变异（CNVs）与43种复杂性状的关联进行研究。通过检测破坏172个组织或细胞类型基因集的CNV关联，我们观察到所有性状均存在显著关联，并在All of Us队列中验证了这些关联。功能负荷多效性（定义为与某基因集显著关联的性状数量）与遗传约束相关，且脑功能相关基因集的多效性显著高于非脑功能基因集（即使经遗传约束标准化后仍成立）。通过负荷相关性测量的多效性水平在缺失变异与功能丧失型SNV中相似，且高于常见变异与重复变异。多数基因剂量反应呈非单调性——缺失与重复变异呈现同向效应，而单调反应比例随遗传约束增强而降低。与这种单调性缺失一致的是，功能基因集与性状的关联通常仅出现在缺失或重复变异中，极少同时出现。此外，缺失与重复变异效应量呈负相关，表明性状与功能基因集的关联具有变异特异性。本研究揭示了遗传约束与脑特异性机制在塑造单调性与多效性中的关键作用，为神经发育及精神疾病中观察到的全身性多病共存提供了机制基础。
揭示百日咳暗物质：来自母婴纵向队列的无症状携带状态证据	Gunning, C. E.	2026-05-05	PDF	百日咳仍是一个未解之谜，部分原因在于无症状病例对传播的影响尚不确定。造成这一知识空白的原因是缺乏高质量的疾病监测，尤其是在疾病负担沉重的低收入和中等收入国家。本文基于我们对赞比亚卢萨卡市2015年期间（共8,704次独立研究访视）1,315名母亲及其新生儿组成的滚动队列进行的前瞻性纵向监测分析。我们详细描述了基于qPCR的IS481信号在个体受试者及母婴配对中的出现时间、持续时间和强度。研究发现IS481信号强度：A) 可预测母亲体内同时期及未来婴儿的IS481检出情况，B) 对母亲体内检出情况的预测能力较弱，C) 可预测婴儿的呼吸道症状但无法预测母亲症状。我们重点分析了50名婴儿和54名母亲组成的亚组，这些个体表现出持续定植证据（中位持续8周），其中大多数母亲完全无症状。我们还对qPCR检测在不同IS481信号强度下的可靠性进行了关键评估。研究结果表明，百日咳通常在轻微症状母亲与其新生儿之间传播，并证实了长期、轻微且症状不明显的百日咳感染的普遍存在。
细胞类型解析的遗传调控变异塑造了炎症性肠病风险	Alegbe, T.	2026-05-05	PDF	大多数与复杂疾病相关的遗传变异位于非编码区域，这增加了识别效应基因和相关细胞类型的难度。本研究对421名个体（包括125名炎症性肠病（IBD）患者）的血液和肠道活检样本中220万个单细胞进行了顺式表达数量性状位点（cis-eQTL）定位。与组织水平检测的eQTL相比，细胞类型水平的eQTL更远离转录起始位点，富集于增强子区域，调控邻近基因的可能性更低，且与IBD全基因组关联研究（GWAS）位点共定位的概率高出两倍以上。我们在超过半数已知IBD位点中确定了效应基因，包括髓系细胞中的MAML2、PSEN2和ZMIZ1，提示Notch信号减弱与肠道免疫功能障碍相关。此外，我们在上皮干细胞和祖细胞中识别出Wnt调控基因（如MYC），表明再生能力受损导致屏障功能破坏。本研究构建了将遗传风险与IBD中特定基因和细胞类型关联的机制图谱，并为复杂疾病的效应基因发现提供了框架。
针对需要心肌血运重建的高危特征人群（High-Risk REVASC），开展CABG与PCI对比的双臂、平行、分层实用随机对照试验的目标试验模拟。	Liao, W.	2026-05-05	PDF	目的本研究旨在探讨对于需要血运重建且具有高风险特征的冠心病患者，冠状动脉旁路移植术（CABG）与经皮冠状动脉介入治疗（PCI）的治疗效果是否一致。方法采用目标试验模拟（TTE）作为研究设计，使用医院病例统计（HES）的观察性数据。目标人群为需要多支血管血运重建且至少具备以下七项高风险特征之一的患者：年龄>75岁、女性、心力衰竭、慢性肾脏病、外周血管疾病、中度衰弱风险或急性冠脉综合征表现。干预措施为CABG，对照组为PCI。结局指标包括5年内的全因死亡、心血管死亡、心血管住院及主要不良心血管事件。本研究包含四个研究阶段：（1）潜在类别分析（LCA）识别代表不同临床表型的互斥患者聚类；（2）工具变量分析（IVA）估计整体人群及各患者类别的治疗效果；（3）在通过匹配既往心脏手术试验（富含高风险特征）与HES人群获得的模拟试验人群中重复IVA；（4）与多方利益相关者共同设计实用随机对照试验（RCT），以解决上述分析中识别的不确定性。结果目标人群共103,670例患者，其中62,048例（59.9%）接受CABG，41,622例（40.1%）接受PCI。LCA识别出七个患者类别为最佳解决方案。模拟试验包含3,124例患者，CABG组1,588例（50.8%），PCI组1,536例（49.2%）。年龄>75岁且无慢性肾脏病的患者（类别1）接受CABG后，所有主要及次要结局均显示一致获益。对于其他六个患者类别，CABG与PCI在临床结局中的获益与风险在类别间及类别内均存在异质性。采用贝叶斯方法解决剩余不确定性的RCT需纳入3,000名参与者，以检测风险比为0.7，且所有七个类别的家族性I类错误率<5%，统计功效达90%。结论对高风险特征人群进行冠状动脉血运重建方案的TTE显示，不同疾病表型间及表型内均存在混合的获益与风险。针对该目标人群中CABG与PCI适应症不确定性的试验具有可行性。
非节段型白癜风临床预后预测因素：一项前瞻性队列研究	Kumari, L.	2026-05-05	PDF	背景非节段型白癜风（NSV）在活动性、进展和治疗反应方面表现出显著异质性。目前缺乏能够预测预后和患者报告结局的可靠临床标志物。目的识别非节段型白癜风中疾病范围、进展、复色、治疗依赖性、可见性及心理社会影响的临床人口学及临床预测因素。方法本前瞻性队列研究纳入275例非节段型白癜风患者，随访12个月。记录16项基线变量，包括人口学特征、自身免疫病史及临床标志物（同形反应、碎纸屑样和三色模式、白毛、黏膜、肢端及口周受累）。结局指标包括体表面积（BSA）、疾病进展、复色情况、治疗依赖性、白癜风可见度量表（VNS）及生活质量指数（VIS-22、DLQI、C-DLQI、F-VIS）。在6个月和12个月时进行多变量分析和聚类分析。结果疾病活动性标志物（白毛、三色和碎纸屑样皮损、同形反应、黏膜、肢端及口周受累）与较大体表面积、复色不良、高可见性及治疗依赖性显著相关。白毛是复色不良和高VNS的持续预测因子。自身免疫家族史可预测疾病进展和治疗依赖性。早发型白癜风患者疾病范围较小，但家庭相关心理社会负担更重。聚类分析识别出具有不同治疗反应的严重、中等和轻度表型。结论简单临床标志物可将非节段型白癜风患者分层为不同预后亚组，有助于实现个体化治疗和咨询。
模拟国家层面人群抗菌药物耐药性的演变轨迹	Srimokla, O.	2026-05-05	PDF	抗菌药物耐药性（AMR）被公认为全球健康威胁，但耐药性流行率的时间趋势常因数据零散且异质性高而难以清晰呈现，尤其在低收入和中等收入国家。此前，针对此类地区估算国家层面耐药性轨迹的方法采用集成策略，将多种灵活的非线性算法均值函数嵌入高斯过程框架中，但未明确考虑数据源间的异质性。本研究在此基础上，通过明确纳入数据源变异，并采用基于时变参数逻辑增长模型的半机制方法，旨在克服上述重要局限。以全球范围内导致抗生素耐药性医疗相关感染的重要病原体——鲍曼不动杆菌为例，我们整合18个不同数据源，估算了2000至2022年间亚洲32个国家耐药性流行率的变化轨迹。在贝叶斯框架下，我们比较了六种基础模型变体，这些变体在数据源异质性处理方式、增长模型参数随国家与时间变化的假设、以及协变量与空间关系的依赖程度上存在差异。同时，我们构建了这六种模型的堆叠集成。通过留一法交叉验证信息准则评估样本外模型精度。在七种病原体-抗生素组合中，四种组合的堆叠模型样本外预测精度最高；其余组合中，考虑数据源异质性的模型始终优于未考虑者。该框架通过提供具有生物学合理性的结构，可量化协变量对耐药性动态的影响，有效处理异质性数据源，并易于扩展至更复杂的生物学驱动增长过程，从而改进了现有方法。这一方法论为深入理解AMR耐药性动态及评估公共卫生干预措施奠定了潜在重要基础。
全生命周期的疼痛：基于118个国家610万人的全球和区域参考曲线	Fillingim, M.	2026-05-05	PDF	疼痛是全球致残的首要原因，然而目前尚无基于人群的参考标准可用于对个体队列、临床人群或国家进行基准比较。本研究整合了来自118个国家894个人群数据源的6,075,021名参与者的个体自我报告疼痛数据，建立了覆盖全生命周期的全球疼痛参考轨迹，并开发了开放获取的基准评估平台。疼痛患病率从面部疼痛的2.5%到背部疼痛的45.0%不等，所有11个解剖部位中女性患病率均持续高于男性（风险比范围1.09至1.83），且在55岁前增长最为显著。与现有研究普遍认为人类发展指数（HDI）较高地区疼痛患病率更高的预测相反，本研究发现最低HDI国家的个体在晚年经历任何身体疼痛的患病率几乎是最高HDI国家的两倍（风险差异31.8个百分点）。全球范围内，18.3%的特定部位疼痛负担可归因于三种可改变风险因素（吸烟、肥胖和低收入），但这一比例从撒哈拉以南非洲的12.6%到东欧的27.1%不等，表明低HDI地区疼痛驱动因素的特征仍不明确。
关于AI智能体技术在中心供应室质量缺陷根因分析中的应用研究	Yi, M.	2026-05-05	PDF	目的探讨AI智能体辅助根因分析在消毒供应中心（CSSD）质量检查缺陷管理中的应用效果，并与传统人工分析方法进行系统比较。方法采用回顾性病例模拟比较研究。选取30例典型CSSD质量检查缺陷案例，分别由AI智能体辅助分析组和传统人工分析组独立进行根因分析。以高级专家小组的共识结果作为"金标准"，从分析质量、效率、实用性和过程体验四个维度进行量化比较，采用t检验和Mann-Whitney U检验。结果与传统方法相比，AI辅助组的根因识别准确率显著更高（85.6% vs. 72.3%，P<0.001），分析深度更优（4.4分 vs. 3.6分，P<0.001），单例分析耗时显著缩短（18.5分钟 vs. 35.2分钟，P<0.001），且生成的创新性纠正措施更多（1.8项/例 vs. 0.7项/例，P<0.001）。两组在提出措施的可行性方面差异无统计学意义（4.0分 vs. 4.2分，P>0.05）。结论 AI智能体辅助根因分析方法能显著提升CSSD质量检查缺陷分析的准确性、深度和效率，并有助于发现更多创新性解决方案，具有较高的应用价值和推广潜力。对护理管理的启示本研究为将AI智能体技术整合到CSSD质量管理中以提高缺陷分析效率和准确性提供了实证依据。护理管理者应考虑采用AI辅助工具来规范根因分析流程，减少对资深员工经验的依赖，并实现更快速、数据驱动的决策。培训负担的减轻和新手表现的改善表明，AI有助于解决劳动力技能差距问题。未来实施应聚焦于人机协作，管理者需确保充分培训、保持人工监督，并定期更新知识库以反映本地临床实际情况。
根据更新后的临床指南，晚期早产儿产前类固醇暴露情况	Clapp, M. A.	2026-05-05	PDF	引言：2021年，母胎医学会更新了晚期早产产前糖皮质激素使用指南，其中新增建议医患双方就风险与获益进行共同决策。本研究旨在评估该指南更新对美国当代出生队列临床实践的影响。方法：本回顾性队列研究采用中断时间序列设计，基于Premier医疗数据库的住院患者层面数据，纳入晚期早产单胎分娩病例。定义干预日期（选定为2022年1月1日）前后各3年观察期（2019年1月1日至2021年12月31日；2022年1月1日至2024年12月31日），量化指南发布是否与产科实践变化相关。采用泊松回归模型（对数链接函数）将糖皮质激素暴露作为患者层面二分类结局变量建模，在干预节点设置线性样条函数，分别估算干预前斜率及指南发布后斜率变化。节点处斜率变化为主要研究参数。时间以季度为单位测量。发生率比可解释为糖皮质激素使用率的季度百分比变化，并附95%置信区间。结果：共纳入342,925例晚期早产分娩：干预前176,938例，干预后165,987例。干预前57,372例（32.4%）接受晚期早产糖皮质激素治疗，暴露率随时间保持稳定（校正后季度百分比变化 1.01；95%置信区间：1.00-1.01）。指南发布后，糖皮质激素暴露率每季度下降3%（校正后季度百分比变化 0.97；95%置信区间：0.96-0.98），表明指南目标人群的糖皮质激素使用轨迹发生显著改变。2024年第四季度（研究期末）暴露率降至25.1%。结论：母胎医学会更新临床指南后，晚期早产糖皮质激素暴露率显著下降。该指南首次强调长期数据存在矛盾，并建议就风险与获益进行共同决策。未来需开展产前糖皮质激素长期风险与获益研究，为临床实践指南和共同决策提供依据。