2026-05-11 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
123D：大规模统一多模态自动驾驶数据	Daniel Dauner	2026-05-08	PDF	自动驾驶技术的研究催生了机器人领域最丰富的传感器数据集之一。然而，这些数据的规模和多样性仍未被充分挖掘。每个数据集采用不同的2D和3D模态（如摄像头、激光雷达、自车状态、标注信息、交通信号灯和高精地图），并具有不同的采集频率和同步方案。这些数据以碎片化格式存在，依赖复杂的依赖关系，无法在同一个开发环境中原生共存。此外，标注规范的重大差异阻碍了跨数据集的训练或泛化能力评估。我们提出123D——一个通过统一API整合多模态驾驶数据的开源框架。为解决同步问题，我们将每种模态存储为独立的时间戳事件流（不预设固定频率），从而实现对任意数据集的同步或异步访问。借助123D，我们整合了8个真实世界驾驶数据集（涵盖3300小时、9万公里里程）以及一个包含可配置采集脚本的合成数据集，并提供数据分析和可视化工具。我们开展了系统性研究，对比了标注统计信息并评估了每个数据集的位姿与标定精度。此外，我们展示了123D支持的两项应用：跨数据集3D目标检测迁移和规划任务的强化学习，并为未来方向提出建议。代码和文档详见https://github.com/kesai-labs/py123d。
LLMs改进LLMs：面向测试时扩展的智能体发现	Tong Zheng	2026-05-08	PDF	测试时扩展（TTS）已成为通过推理阶段增加计算量来提升大语言模型性能的有效方法。然而现有TTS策略大多依赖人工设计：研究者凭直觉手动设计推理模式并调整启发式规则，导致大量计算分配空间未被探索。我们提出环境驱动框架AutoTTS，将研究者的设计对象从单个TTS启发式规则转变为可自动发现TTS策略的环境。AutoTTS的核心在于环境构建：发现环境必须使控制空间易于处理，并为TTS搜索提供廉价且频繁的反馈。作为具体实现，我们将宽度-深度TTS建模为基于预收集推理轨迹和探测信号的控制器合成问题，其中控制器决定何时分支、继续、探测、剪枝或停止，且无需重复调用LLM即可低成本评估。我们进一步引入Beta参数化使搜索易于处理，并通过细粒度执行轨迹反馈帮助智能体诊断TTS程序失败原因，从而提升发现效率。在数学推理基准上的实验表明，发现的策略在准确率-成本权衡上优于强人工设计基线。发现的策略可泛化至未见基准和模型规模，而整个发现过程仅需39.9美元和160分钟。我们的数据和代码将开源在https://github.com/zhengkid/AutoTTS。
归一化轨迹模型	Jiatao Gu	2026-05-08	PDF	基于扩散的模型将采样过程分解为多个小的高斯去噪步骤——当生成过程被压缩为少量粗粒度转换时，这一假设便不再成立。现有的少步方法通过蒸馏、一致性训练或对抗目标来解决此问题，但在此过程中牺牲了似然框架。我们提出归一化轨迹模型（NTM），将每个反向步骤建模为具有精确似然训练的表达性条件归一化流。在架构上，NTM将每个步骤内的浅层可逆模块与跨轨迹的深层并行预测器相结合，形成可从零训练或从预训练流匹配模型初始化的端到端网络。其精确的轨迹似然进一步实现了自蒸馏：基于模型自身评分训练的轻量级去噪器可在四步内生成高质量样本。在文本到图像基准测试中，NTM仅需四个采样步骤即可匹配或超越强图像生成基线，同时独特地保留了生成轨迹上的精确似然。
保形路径推理：通过路径级校准实现可信的知识图谱问答	Shuhang Lin	2026-05-08	PDF	知识图谱问答（KGQA）在基于事实的可解释推理方面展现出潜力，但现有方法常无法为检索到的答案提供可靠的覆盖保证。尽管共形预测（CP）为生成具有统计保证的预测集提供了理论框架，但先前方法在校准有效性和分数可区分性方面存在关键缺陷，导致覆盖保证被违反且预测集规模过大。为解决这些问题，我们提出共形路径推理（CPR）这一可信KGQA框架，包含两项核心创新：首先，在路径级分数上执行查询级共形校准，在生成路径预测集的同时保持可交换性；其次，引入残差共形价值网络（RCVNet），该轻量模块通过PUCT引导的探索进行训练，以学习具有判别性的路径级非共形分数。基准实验表明，与共形基线方法相比，CPR将经验覆盖率提升34%，同时将平均预测集规模缩减40%。这些结果验证了CPR在满足覆盖保证的同时生成更紧凑答案集的有效性。
通过想象到聆听的脑磁图映射实现零样本想象语音解码	Maryam Maghsoudi	2026-05-08	PDF	从非侵入性脑记录中解码想象语音极具挑战性，因为想象数据集稀缺且难以在跨受试者和实验时段间实现时间对齐。本研究提出一种利用更丰富且标签更可靠的听觉语音记录来解码想象语音的新方法。我们采集了受过训练的音乐家对节奏性旋律和口语刺激的配对听觉与想象脑磁图记录，借助音乐家训练背景改善了跨条件的时间对齐。随后开发的三阶段解码流程揭示了想象与听觉相同刺激时神经活动之间一致且有意义的关联。第一阶段，我们训练了六个线性与神经网络模型，将想象脑磁响应映射为听觉响应。通过未参与训练的受试者数据建立零基线进行模型评估，验证预测的听觉响应保留了刺激特异性信息。第二阶段，我们仅基于听觉脑磁响应训练对比词解码器，并采用包含语义、声学和语音表征的四种嵌入策略进行评估。第三阶段，将未参与训练受试者的想象脑磁响应通过映射流程处理，计算对应的听觉响应后由听觉解码器进行解码。基于秩次分析表明，想象词汇的解码准确率显著高于随机水平。本文报告概念验证性想象语音解码实施结果，所有评估均在未参与训练的受试者数据上完成。同时证明性能随训练数据量提升而改善，表明该方法具有可扩展性，可直接应用于实际脑机接口场景。
GRAPHLCP：图上的结构感知局部化保形预测	Peyman Baghershahi	2026-05-08	PDF	共形预测（CP）提供了一种无需分布假设的不确定性量化方法，并具有有限样本保证。然而，将CP应用于图神经网络（GNN）仍面临挑战，因为图的组合特性常导致预测置信度不足和嵌入缺乏区分性。现有方法主要依赖嵌入空间邻近性进行定位，这在图数据中可能不可靠，且会产生低效的预测集。我们提出GRAPHLCP框架，这是一种基于邻近性的局部化CP方法，通过显式整合图拓扑结构和节点间依赖关系实现定位与加权。该方法引入特征感知的稠密化步骤以缓解稀疏图中的局部性偏差，随后基于个性化PageRank计算核函数来建模结构邻近性。这使得拓扑依赖的锚点采样和校准加权能够同时捕捉局部与长程依赖关系。在多个回归与分类数据集上的大量实验表明，GRAPHLCP在有限样本下保证边际覆盖的同时，能在多种条件场景下高效实现优越的测试条件覆盖。
EmambaIR：面向事件引导图像重建的高效视觉状态空间模型	Wei Yu	2026-05-08	PDF	近期基于事件的图像重建方法主要依赖卷积神经网络（CNN）和视觉变换器（ViT）处理互补的事件信息。然而，这些架构存在根本性局限：CNN难以捕捉全局特征相关性，而ViT会产生二次计算复杂度（如$O(n^2)$），阻碍了其在高分辨率场景中的应用。为解决这些瓶颈，我们提出EmambaIR——一种专为利用空间稀疏且时间连续的事件流进行图像重建的高效视觉状态空间模型。本框架包含两个关键组件：跨模态Top-k稀疏注意力模块（TSAM）和门控状态空间模块（GSSM）。TSAM通过像素级top-k稀疏注意力高效引导跨模态交互，生成丰富且稀疏的融合特征。随后，GSSM利用非线性门控单元增强线性复杂度（$O(n)$）SSM的时间表征能力，在避免典型计算开销的同时有效捕捉全局上下文依赖。在六个数据集上针对三项不同图像重建任务（运动去模糊、去雨、高动态范围增强）的广泛实验表明，EmambaIR在显著降低内存消耗和计算成本的同时，性能全面超越现有最优方法。源代码与数据已开源：https://github.com/YunhangWickert/EmambaIR
关于非负$L_1$逼近多项式的一个注记	Jane H. Lee	2026-05-08	PDF	$L_1$-逼近多项式（即在特定分布下以$L_1$范数逼近指示函数的多项式）在计算学习理论中广泛应用。本文研究高斯分布下\textit{非负}$L_1$逼近多项式的存在性。这一要求比$L_1$逼近更强，但弱于夹逼多项式（后者本身具有诸多应用）。这类非负逼近多项式近期在仅含正例的平滑学习中得到应用。本短文中，我们证明：在标准高斯分布下，任何高斯表面积（GSA）不超过$Γ$的集合类，均存在次数$k=\tilde{O}(Γ^2/\varepsilon^2)$的非负多项式，使其在$L_1$范数下$\eps$-逼近该类的指示函数。等价地，有限GSA意味着$L_1$逼近具有更强的逐点保证——逼近多项式的值域包含于$[0,\infty)$。在常数因子范围内，该结果与当前已知无非负约束的最佳高斯$L_1$逼近次数界相匹配。
VecCISC：通过推理轨迹聚类与候选答案选择改进置信度感知的自一致性	James Petullo	2026-05-08	PDF	扩展推理时缩放的标准技术是自一致性（Self-Consistency），即从大语言模型中采样多个候选答案并选择最常见的答案。近期研究表明，加权多数投票（例如置信度感知自一致性CISC）通过为每个候选答案分配置信度分数并选择累积得分最高的答案，在多种主流基准测试中往往表现更优。实际应用中，加权多数投票需要对每个候选答案的推理轨迹调用评论大语言模型以生成置信度分数。尽管具有潜在性能优势，但这种二次调用大语言模型会显著增加加权多数投票的开销和成本。为降低这一成本，我们提出VecCISC——一种轻量级自适应框架，通过语义相似度度量过滤与其他轨迹语义等价、退化或产生幻觉的推理轨迹，从而减少需要评论模型评估的候选答案数量。为确保实验充分性，我们在涵盖数学、化学、生物学、常识推理和人文学科领域的五个具有挑战性的广泛采用数据集上评估VecCISC。结果表明，VecCISC在保持或超越CISC准确率的同时，将总令牌使用量减少47%。
经验贝叶斯再偏置	Wanyi Ling	2026-05-08	PDF	我们研究了对大量有噪声且有偏估计进行同步分析的方法，每个有偏估计都配有一个噪声更大的自身偏差估计。分析者的目标是为每个参数构建短校准区间。标准的去偏方法是从每个有偏估计中减去偏差估计，这会增大方差并产生长区间。在本文中，我们提出了一种经验贝叶斯再偏策略，该策略从完全去偏的估计出发，通过估计未知的偏差分布，从数据中学习应重新引入多少偏差。我们提供了当使用非参数最大似然估计偏差分布时，区间覆盖率的收敛速度。此外，我们在预测驱动推断中展示了显著的精度提升，包括成对LLM胜率评估，以及基于家庭的GWAS中直接遗传效应的推断。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
基于单倍型的模型改进了具有复杂人口结构的古代群体中的选择扫描检测。	Sequeira, A. N.	2026-05-11	PDF	在人类中识别正选择信号的过程受到瓶颈效应、迁移和混合等人口统计学过程的干扰，这些过程可能扭曲或掩盖选择性清除产生的基因组模式。古DNA为过去的等位基因和单倍型频率提供了直接窗口，但大多数针对古代群体的清除扫描研究仍依赖等位基因频率或位点频谱（SFS）总结，对基于单倍型的方法使用有限。本研究评估了在反映古代和现代欧洲人复杂历史的人口统计学场景下，基于单倍型和SFS方法检测选择性清除的性能。我们将基于单倍型的似然框架saltiLASSI扩展至伪单倍体古基因组，使其能够利用截断的单倍型频率谱及其空间衰减来检测清除，无需依赖定相数据。通过正向时间模拟，我们考察了不同年龄的清除、两种不同来源比例混合脉冲，以及混合后选择持续或终止的情况，并将saltiLASSI与广泛使用的基于SFS的方法（SweepFinder2）进行比较。结果表明，在混合群体中，基于单倍型的似然模型比SFS方法保持更高的检测效能，尤其是当清除单倍型通过迁移引入，或混合后选择未获得足够时间重建清晰SFS信号时。这些发现凸显了基于单倍型推断在古DNA研究中的潜力，并展示了基于模型的方法如何改善对具有复杂人口统计学历史的群体中历史选择性清除的检测。
听觉感知专长：接近检测阈值的幅度调制率辨别	Garcia Ruiz, T.	2026-05-11	PDF	许多感知技能经过数天训练即可提升，但掌握复杂任务的专业水平可能需要数周或数月的练习（Watson, 1980）。本研究探讨沙鼠如何在困难任务中达到专业水平：在极浅的调幅深度下进行调幅速率辨别（与发声交流时使用的深度相似）。采用食欲性Go-Nogo程序，我们首先训练6只沙鼠在0 dB（参考100%深度）的调幅深度下执行调幅辨别任务（Nogo: 4 Hz; Go: 4.25-10 Hz）。随后，沙鼠被训练在逐渐变浅的调幅深度（-3至-18 dB）下进行辨别，每个深度平均需要5-10天练习才能达到d-prime绩效指标。最终发现，0至-12 dB深度下的调幅辨别阈值几乎相同，仅在-15 dB时略有升高。绩效提升伴随着程序学习阶段反应时间的大幅缩短，以及感知学习阶段反应时间的渐进式缩短（即使调幅深度变浅即难度增加）。沙鼠在调幅辨别任务中表现最佳的极浅深度与其最低调幅深度检测阈值相近。这些结果表明，完成具有挑战性的听觉感知任务需要长期练习，并伴随自动化程度提升（即反应时间缩短），一旦达到专业水平便会趋于稳定。
整合扩散模型与液态AI模型，用于从mRNA展示筛选结果预测肽亲和力	Leaf, C. M.	2026-05-11	PDF	体外筛选和定向进化技术（如mRNA展示）可探索大型文库（10^14个变体），并针对多种靶标生成数千至数百万个功能性多肽配体。利用展示技术衍生的深度测序数据训练的降噪扩散隐式机器学习模型（DDIMs）能将这些功能性序列大幅扩展至实验可及范围之外。然而，仍需开发预测肽类特性（如结合自由能{ΔG°}）的方法。本研究应用机器学习方法预测实验生成及DDIM生成的肽配体与目标靶蛋白（致癌蛋白Bcl-xL）的结合自由能。我们采用包含15,700个肽配体的数据集训练闭式连续（CfC）神经网络，以序列及其对应结合自由能（{ΔG°}）的配对数据作为输入。选择该模型因其能表征非规则序列。最终CfC模型能准确预测实验生成肽与DDIM生成肽的排序（误差范围内）及结合自由能（{ΔG°}），并识别出五个具有皮摩尔级亲和力的DDIM生成肽。将训练后的DDIM与CfC模型结合，为扩展实验配体发现范围、预测实验及生成配体的分子特性提供了统一路径，同时凸显了大规模定量数据集在精准预测高亲和力肽候选物中的价值。
慢速与快速θ节律同步性对人类海马-眶额网络工作记忆的相反效应	Gray, S. M.	2026-05-11	PDF	工作记忆（WM）使我们能够随时间维持和操作信息，但大脑如何在局部及跨网络层面组织序列信息仍不清楚。近期研究表明，慢速与快速θ振荡在记忆中发挥不同作用，然而它们对序列工作记忆的独特贡献尚不明确。基于海马体（HC）和眶额皮层（OFC）支持序列工作记忆，且较慢的θ周期为组织工作记忆项目提供最佳时间窗口的证据，我们预测这些区域将通过慢速θ动态进行协调。我们分析了21名神经外科患者（7名女性，年龄13-54岁；均值30岁，标准差11.2岁）在执行延迟匹配样本工作记忆任务时的颅内脑电图数据，涵盖HC、OFC及杏仁核（AMY）。我们评估了区域间的相位锁定、区域内的相位-振幅耦合，以及慢速（约1-4.5Hz）和快速（约4.5-8Hz）θ振荡的神经元相位编码。结果显示所有区域间均存在显著的慢速与快速θ同步，但相同的解剖通路根据振荡频率产生相反的行为效应，尤其在认知需求较高时。慢速θ同步与更快的反应时（RTs）相关，而HC与OFC间的快速θ同步则同时损害准确性和反应时。出乎意料的是，AMY通过需求依赖的慢速θ同步调节反应时——维持阶段AMY-OFC同步预测更快的反应时，而高认知需求下HC-AMY同步预测更快的反应时。各区域内慢速θ振荡与高频宽带活动的持续耦合表明，局部组织与有益的网络行为效应相吻合。这些结果确立了一种频率对抗机制，其中θ振荡频率决定了HC-OFC回路是促进还是损害序列工作记忆。
如何在良好的对话中达成一致？探究互动质量与多模态人际协调之间的关联	Dominguez-Arriola, M. E.	2026-05-11	PDF	对话有时会让人感到轻松投入，有时却显得困难且毫无收获。影响对话体验质量和结果的因素众多，其中对话者之间的协调程度尤为关键。本研究探讨了言语-言语、脑-言语及脑-脑协调作为人际协调标志物的作用，分析其与对话双方共同感知的互动质量及相互亲和力的关系。实验采用双人脑电图（超扫描）装置，同步记录互不相识的参与者（成对组合）在多次简短自由对话中的声音与神经活动，对话主题的趣味性各有不同。我们分析了每段对话中对话者的韵律适应、神经言语追踪及神经协调情况。在言语-言语层面，研究发现相互印象更积极的对话伙伴在实验过程中，其音量和音质会逐渐趋同，反映出更强的韵律收敛性。在脑-言语层面，未发现互动质量对任何脑区实时言语神经追踪存在可靠影响，但脑电地形图差异表明不同头皮位点存在相对调节。最后在脑-脑层面，研究显示更高的感知互动质量会增强跨频段（α波和θ波）及跨时间依赖（同步/近即时与循环/听者滞后）的脑间关联，其中同步α波耦合效应最为显著。这些发现表明，对话者体验互动质量与建立关系亲和力涉及不同的协调过程，为理解对话价值产生的机制提供了新视角。
环境富集的系统综述与转录组元分析揭示脑可塑性的核心分子程序	Kurowska, M.	2026-05-11	PDF	理由：环境富集（EE）范式在啮齿类动物中早已证明，增强的感觉、认知、社交和运动刺激对大脑功能产生积极影响，可改善学习、记忆和神经可塑性。这些效应对于理解认知发育以及延缓认知衰退和大脑衰老具有重要意义。尽管已有大量转录组学研究探索了EE诱导的分子变化，但对于持续受调控的基因和通路仍缺乏统一认识。方法：为填补这一空白，我们进行了系统综述和荟萃分析。我们在PubMed中全面检索了截至2025年2月发表的所有符合以下纳入标准的研究：（1）采用EE范式；（2）以啮齿类动物为研究对象；（3）使用全基因组转录组方法；（4）检测脑区或神经元群体。对检索到的323篇文章进行人工筛选，以确定其与研究目标和数据可用性的相关性。来自20个符合条件的RNA-seq报告的数据集使用统一分析流程重新处理，并采用三种互补统计方法进行荟萃分析。结果：尽管各研究间存在显著异质性，但我们的整合分析识别出与突触功能、可塑性及其转录调控相关的一致基因表达特征。这些分子层面的见解加深了我们对EE如何影响神经元和行为结果的理解，并可能为旨在复制或增强EE益处的治疗策略提供参考。为促进开放科学并推动进一步研究，我们开发了一个可访问的Web应用程序mEEtaBrain，使神经科学界能够浏览和查询我们的荟萃分析结果。
刺激所预测的内容，而非其呈现的内容，决定了纹状体的奖赏信号。	Sambuco, N.	2026-05-11	PDF	自由观看情绪图片会激活动机回路，其激活程度取决于唤醒度和效价，但由于未提供真实结果，无法区分预期性渴望与消费性喜爱。味觉神经影像范式虽能传递真实奖赏，但使用贫乏且情感中性的线索，无法引发自然的选择性注意。我们通过在同一fMRI扫描中呈现情绪图片与预测果汁输送（Food+）或不预测（Food-）的食物照片，弥合了这两种范式。在每个Food+试验中，参与者实时表明是否想要果汁，从而在个体内水平分离预期信号与消费信号。伏隔核对Food+线索表现出显著且选择性的反应，其激活程度超过了对愉悦（情色）和厌恶（残肢）高唤醒图片的反应，证实中脑边缘系统的参与追踪的是结果预测而非情绪唤醒、情感效价或视觉内容。时间分离分析进一步揭示，伏隔核在线索期承载主导性预期信号，而腹内侧前额叶皮层在果汁输送的结果期承载主导性信号，这一模式与"想要"和"喜爱"的区分一致。表征相似性分析证实，结果预测（而非情绪唤醒、情感效价或视觉类别）是整个感兴趣区域网络多变量神经反应的主导组织原则。综合而言，这些发现表明视觉刺激是否激活奖赏回路更多取决于其预测的内容而非描绘的内容，并为研究个体在食欲动机和线索诱发进食方面的差异提供了框架。
谷氨酸能系统紊乱对帕金森病中易损多巴胺能神经元亚型的性别依赖性影响	Cai, H.	2026-05-11	PDF	乙醛脱氢酶1A1阳性（ALDH1A1+）多巴胺能神经元（DANs）在帕金森病（PD）中具有优先易损性，但其突触前输入如何调控其活性仍不清楚。本研究通过条件性敲除ALDH1A1+ DANs中编码关键NMDA受体（NMDAR）亚基的Grin1基因，探究谷氨酸能输入的作用。Grin1条件性敲除（cKO）小鼠的运动能力和运动学习表现正常，但雌性小鼠在食物限制后表现出增强的操作性奖赏获取、过度摄食及伴随的短暂体重增加。为确定脑区特异性贡献，我们分别选择性敲低腹侧被盖区（VTA）或黑质致密部（SNc）ALDH1A1+ DANs中的Grin1。雌性小鼠VTA特异性敲低足以重现食物限制后的摄食与体重增加表型。全脑bulk mRNA测序揭示显著的性别依赖性转录变化，主要发生在食物限制后的雌性Grin1 cKO小鼠中。许多差异表达基因与线粒体功能、能量代谢及突触信号传导相关。综上，这些发现揭示了NMDAR介导的谷氨酸能输入对ALDH1A1+ VTA DANs的性别特异性调控作用，为理解该易损亚群功能障碍如何参与PD相关强迫性进食障碍提供了机制性见解。
压后皮质中的PV和SST中间神经元塑造自我中心空间精度与稳定性	Oh, D.	2026-05-11	PDF	精确导航需要自我运动持续更新环境几何的自我中心表征，同时保持其时间稳定性。压后皮层（RSC）在此过程中起核心作用，但局部抑制性回路如何支持这种平衡仍不清楚。我们发现小清蛋白（PV）和生长抑素（SST）中间神经元调控RSC中自我中心空间编码的不同组分。PV中间神经元受自我运动强烈调节，并表现出先于SST激活的朝向对齐同步性，将运动与自我中心编码精度联系起来。相比之下，SST中间神经元表现出微弱的自我运动调节，但具有稳定的边界锚定活动，其全局同步动力学随时间稳定表征。光遗传学沉默揭示了可分离效应：PV扰动降低了自我中心编码精度，而SST扰动破坏了全局群体组织。行为学上，PV沉默损害了初始自我中心定向，而SST沉默保留了初始定向但损害了其持续更新。这些发现识别了在导航过程中平衡快速更新与表征稳定性的可分离抑制机制。
信心密码：顶叶α振荡将期望转化为信念	Tarasi, L.	2026-05-11	PDF	元认知，即评估自身决策正确性的能力，对适应性行为至关重要。然而，信心判断并非无偏：预测性线索和信念会系统性地调节信心判断，使其偏向与预期一致的判断，同时不改变元认知精确度。本研究揭示了顶叶α活动是将预期与元认知偏差联系起来的因果机制。在研究1中，记录75名参与者执行视觉检测任务时的脑电图，任务中使用符号线索提示目标概率。线索在未改变元认知敏感性的情况下诱发了信心判断的元认知偏差，且右侧顶叶皮层上由线索驱动的α调制可预测该偏差的幅度。在研究2（N=88）中，对右侧顶叶皮层施加连续θ爆发刺激（cTBS）消除了线索诱发的α调制，从而选择性降低了元认知偏差，而假刺激则无此效果。综合这些发现表明，顶叶α介导的增益控制因果性地塑造了元认知判断，揭示了预测性元认知的振荡编码机制。

medRxiv

标题	作者	发布日期	PDF链接	摘要
基于群体免疫下的冠状病毒等位基因进化模型	Simon, C. P.	2026-05-11	PDF	大多数流行病模型在毒株层面描述病毒进化，直接将传播性和免疫逃逸能力赋予变异株。然而实际上，突变发生在特定基因组位点上，病毒进化的流行病学后果取决于这些等位基因层面的变化如何与群体免疫相互作用。我们建立了一个区室模型，其中病毒毒株由跨基因组位点的等位基因组合定义，而传播、免疫、免疫衰减和突变均在等位基因层面运作。该框架允许作用于单个基因组组件的进化压力在多个毒株间传播。即使在仅含两个位点、每位点两个等位基因的最小系统中，该模型也能产生丰富的动力学特征。初始引入毒株引发的流行波会形成一种免疫景观，这种景观往往有利于基因互补的毒株。更普遍而言，四种机制塑造了毒株的成功：因底层等位基因传播性增强或免疫逃逸能力提升导致的毒株流行率上升、群体免疫驱动的互补效应、间接有利于初始流行毒株的奠基者效应，以及与突变路径相关的邻接效应。这些结果表明，免疫结构能以毒株模型无法捕捉的方式改变病毒进化方向，并为连接病毒遗传学与流行动力学提供了简洁框架。
跨诊断精神病理学与共病的多基因风险模型：All of Us研究计划中的跨祖先分析	Lee, P. H.	2026-05-11	PDF	精神疾病具有显著的遗传共性，但跨诊断多基因风险评分（PRSs）的预测效用尚不明确。在102,091名"我们所有人"研究计划参与者中，我们比较了常见精神遗传（CPG）因子PRS与标准单疾病PRS及CPG残差化疾病特异性PRS在11种精神疾病和共病负担中的表现。CPG PRS与精神疾病诊断的关联比大多数单疾病评分更强且更一致，可解释高达24.6倍的表型方差，并与共病负担显著相关。CPG残差化疾病特异性PRS对多种疾病保留了较小的独立贡献，支持共享与疾病特异性遗传风险的互补性。跨祖先分析显示，共病负担的跨群体可移植性比单一疾病预测更一致，但仍凸显了以欧洲人群为中心的全基因组关联研究的局限性。这些发现支持跨诊断PRS作为广泛精神易感性和共病负担实用指标的价值，同时强调当前PRS模型作为疾病特异性诊断工具的效用有限。
基于机器学习的形态模式分析：用于即时诊断的含大肠杆菌静止尿液液滴干燥沉积物	Ganesh, M. A.	2026-05-11	PDF	尿路感染（UTIs）已成为日益严峻的全球健康问题，主要由大肠杆菌引起，对女性和老年人群影响尤为显著。尽管诊断技术近年来有所进步，但仍存在关键短板：诊断耗时、成本高昂以及假阳性预测。这推动了对快速、可靠且低成本即时诊断工具的需求。为应对这一需求，我们提出了一种基于机器学习的大肠杆菌感染静态尿液液滴干燥沉积物形态模式分析方法。将三种不同浓度的大肠杆菌接种至尿液样本后干燥处理，采用明场显微镜成像进行模式分析。本研究目标分为两方面：首先，开发监督式三元分类模型，通过细菌浓度识别干燥沉积物图像。该模型采用多卷积骨干网络进行互补特征提取，通过注意力融合机制优化特征表征，最终利用堆叠集成层预测结果。其次，通过将聚类有效性指标应用于训练分类模型提取的图像特征，评估定性严重程度因子。此外，我们采用扫描电子显微镜（SEM）从物理层面解析细菌存在相关的沉积模式形成机制。总体而言，本研究提出了一种分析含大肠杆菌干燥沉积物的稳健概念验证方法，为资源有限环境下整合至信息物理系统及实时即时诊断工具提供了快速、低成本且可扩展的基础。
基因突变剂量与6万例临床癌症样本的预后及转移倾向性相关。	Calonaci, N.	2026-05-11	PDF	体细胞突变与拷贝数变异之间的复杂相互作用深刻影响肿瘤演化及患者预后。然而，传统基因组分析常将这两类变异独立处理，忽略了基因突变剂量这一二者相互作用的关键涌现特性。本研究开发了一种创新计算框架，可直接从临床靶向测序panel中推断突变拷贝数与多重性，无需匹配正常样本。通过该方法，我们获取了涵盖39种癌症类型、6万例临床样本中超过50万个突变的基因突变剂量统计特征。基于突变剂量对2万余名患者进行分层分析（涉及多个癌基因与抑癌基因），我们鉴定出46种预测总生存期的肿瘤类型特异性生物标志物。值得注意的是，其中12种肿瘤类型的13种标志物无法通过标准二元突变/野生型模型检测。此外，26种标志物在10种肿瘤类型中与转移扩散显著相关，20种标志物可预测5种肿瘤类型的器官特异性转移倾向。本研究不仅验证了已知癌基因与抑癌基因的经典功能，更首次揭示基因突变剂量模式可作为独立预测因子，用于评估多种实体瘤的预后、转移潜能及器官特异性播散。这种对基因组驱动因素的增强认知深化了我们对癌症进展与转移的理解，有望显著推动生物标志物发现。
可解释性在实践中的应用：面向医疗表格模型局部解释的指标驱动评估	Qureshi, M. A.	2026-05-11	PDF	可解释人工智能（XAI）在临床机器学习中的应用日益广泛，但不同方法和数据集对解释质量的定量评估报告往往缺乏一致性。我们提出一个可复现、基于指标的可解释性评估框架，专门用于医疗表格数据。该框架将六类成熟指标——保真度、简洁性、一致性、鲁棒性、精确度和覆盖率——整合为明确公式，配合预设的焦点模型协议，并发布开源代码及方法-指标适用性映射表。我们使用LIME、SHAP、Anchors、EBM和TabNet五种方法，在四个公开医疗表格数据集上进行评估。后验解释器应用于单一选定的随机森林焦点预测模型以控制模型引发的变异性，而EBM和TabNet则通过其原生可解释机制进行评估。全局解释摘要仅作描述性报告。结果表明，SHAP/TreeSHAP在随机森林设定下能精确重构分数，而LIME生成的解释更简洁但保真度较低，且实例级变异性更大。LIME和SHAP在评估对中显示出最强的排名一致性，但一致性因数据集而异。TabNet常生成紧凑的原生解释，但需结合其数据集特定预测性能进行解读。EBM和TabNet在固定高斯抖动鲁棒性协议下灵敏度较低，而Anchors在更严格阈值下生成高精确度规则但覆盖率降低。总体而言，该框架在明确的方法-指标和焦点模型假设下实现受控比较，支持表格机器学习中更透明的XAI选择。尽管在医疗领域验证，该框架可迁移至其他高风险表格数据领域。
一项脑影像遗传学的多效性图谱揭示了生物学上不同的潜在内表型	Bhattacharyya, U.	2026-05-11	PDF	脑部扫描的全基因组关联研究（GWAS）因可用影像衍生表型（IDP）数量庞大且高度共线性而变得复杂。本文提出DIMPLE-GWAS（用于GWAS的降维与整合多表型景观探索器），这是一种旨在识别高维多效表型中潜在遗传架构的降维框架。该方法应用于英国生物银行约3.3万名欧洲血统参与者的约4000个IDP，产生了25个具有生物学可解释性的潜在表型；该结构在独立ABCD队列中得到验证。DIMPLE-GWAS聚类显示其遗传力显著高于输入IDP，并在位点发现方面展现出更强效力，包括104个既往个体IDP的GWAS未报道的全基因组显著位点。这些遗传定义的表型仅部分与传统基于脑回、细胞构筑或功能特征的脑图谱边界一致，反而揭示了独特的脑组织模式以及与神经、精神、认知和行为表型的新型遗传关联。
超过十年的血清学数据显示流感抗体滴度下降及疫苗免疫调节因素	Fenoy, L. E.	2026-05-11	PDF	年度流感疫苗接种是季节性防护的基石，但抗体反应在个体间及时间维度上存在显著差异。为系统评估这种异质性的决定因素，我们整合了来自14项新开展疫苗研究及50项既往研究（涵盖2010-2023年）中4,540名参与者的20,449份血凝抑制与中和抗体滴度数据。季节性效应占据主导地位：自2017年起，疫苗接种前后的抗体滴度持续下降，其影响程度超过年龄、性别或重复接种等因素。针对B/Yamagata系的抗体滴度在全部研究年份中保持稳定，提示其具有独特持久性，并为该谱系灭绝提供了依据。疫苗接种时机成为此前被低估的免疫决定因素——在流感季后期接种疫苗的个体表现出更高的接种后抗体滴度。在45%和68%的队列中，前一年未接种疫苗或接种减毒活疫苗FluMist可显著增强对灭活疫苗的应答，而抗原剂量与佐剂的影响相对有限。这些发现揭示了疫苗接种时机与季节性背景作为免疫原性驱动因素的重要性，并为优化流感疫苗接种策略提供了可操作的见解。
ARDS的生理亚表型：PEEP策略的预后与预测富集	Meza-Fuentes, G.	2026-05-11	PDF	背景急性呼吸窘迫综合征（ARDS）具有显著的生理异质性，这导致临床结局差异极大，进而造成对通气策略的反应不一致。本研究旨在外部验证既往基于常规通气和气体交换变量识别的ARDS生理亚表型，评估其在不同独立队列中的预后相关性，并检验不同PEEP策略下的治疗效应异质性。方法采用无监督高斯混合模型，基于通气力学和气体交换参数识别生理亚表型。随后利用XGBoost算法训练并验证有监督分类器。在三个独立队列（包括两项随机对照试验ALVEOLI和LOVS）中评估预后相关性。基于ALVEOLI和LOVS的个体患者数据（n=1,532），采用意向性治疗分析，分别应用单阶段和两阶段固定效应IPD荟萃分析方法，检验生理亚表型与PEEP策略之间的交互作用。结果在两个独立队列中成功复制出两种不同的生理亚表型，分别命名为高效型和限制型。在各队列中，限制型患者的28天全因死亡率均显著高于高效型患者。合并分析显示，限制型亚表型与死亡风险显著增加相关（合并比值比1.75，95% CI 1.36-2.24），且无研究间异质性。预测分析显示，在单阶段IPD模型中，生理亚表型与PEEP策略存在统计学显著交互作用（交互作用P=0.037），两阶段固定效应IPD荟萃分析结果一致（交互作用OR 1.91，95% CI 1.00-3.66；I²=0%）。较高PEEP与高效型患者死亡率增加相关，而与限制型患者死亡率降低相关，表明生理亚表型对治疗效果存在修饰作用。解释基于常规床旁数据得出的ARDS生理亚表型，在观察性研究和随机对照试验队列中均提供了稳健且经外部验证的预后分层。与PEEP策略的交互作用表明，潜在的生理特征可能影响治疗反应，支持以生理学为基础作为个体化医疗的起点，从而在未来临床试验中制定更优的通气策略。