2026-05-06 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
一种用于认证点云和图分类的闭式自适应地标核	Sushovan Majhi	2026-05-05	PDF	我们提出PALACE（持久性自适应地标分析分类引擎），作为PLACE的数据自适应配套方法，通过三个参数（预算、半径、带宽；每个参数≤5种选择）引入一个轻量级交叉验证层。基于覆盖理论的核心（地标覆盖的勒贝格数准则）给出了四个闭式保证。（i）在跨图非干扰条件下，关于$\mathcal{D}n$的结构性下界失真$λ(τ;ν)$，当图集中时，与均匀网格相比，预算减少$(D/L)^2$。（ii）等权重$w_k = K^{-1/2}$最大化$λ$，最远点采样位置$2$-近似最优$k$-中心覆盖半径；两者仅从训练标签推导，无需梯度训练。（iii）核-RKHS分类速率$O((k-1)\sqrt{K}/(γ\sqrt{m$具有选择一致性速率，来自（i）的$\widehatλ$提供独立的数据级信号（在COX2和PTC上为正）。（iv）每个预测的认证，包括非渐近Pinelis形式和渐近高斯形式，无需校准分割。实验上，PALACE是Orbit5k上最强的闭式基于图方法（$91.3 \pm 1.0\%$，与Persformer持平），在COX2和MUTAG上领先所有基于图的竞争者，在DHFR上具有竞争力（与ECP相差1个百分点以内）。在$8\times$域膨胀下，自适应放置保持$94\%$，而均匀网格崩溃至随机水平（4类数据上为$25\%$）。}}))$，二元必要性阈值$m = Ω(\sqrt K/γ)$来自匹配的Le Cam下界，以及闭式过滤选择规则。核-马氏距离边际$\hatρ_{\mathrm{Mah}}$是化学图池中最强的闭式排序器（平均斯皮尔曼$ρ\approx +0.60$）；各向同性替代量$\hatγ/\sqrt{K
大型基础模型中的视听智能	You Qin	2026-05-05	PDF	视听智能（AVI）已成为人工智能的核心前沿领域，通过连接听觉与视觉模态，使机器能够在多模态现实世界中感知、生成和交互。在大规模基础模型时代，音频与视觉的联合建模日益关键——不仅用于理解，更需实现对动态时序信号的可控生成与推理。Meta MovieGen和Google Veo-3等最新进展表明，工业界与学术界正聚焦于从海量多模态数据中学习的统一视听架构。然而，尽管发展迅速，现有文献仍呈现碎片化特征：任务类型多样、分类体系不一致、评估标准各异，阻碍了系统性比较与知识整合。本综述首次通过大规模基础模型的视角对AVI进行全面梳理。我们建立了涵盖AVI任务全景的统一分类体系，包括理解（如语音识别、声音定位）、生成（如音频驱动视频合成、视频转音频）及交互（如对话、具身或智能体接口）。在方法论层面，系统整合了模态分词化、跨模态融合、自回归与扩散生成、大规模预训练、指令对齐及偏好优化等基础技术。此外，我们梳理了代表性数据集、基准测试与评估指标，对各类任务进行结构化对比，并指出同步性、空间推理、可控性及安全性等开放挑战。通过将这一快速发展的领域整合为统一框架，本综述旨在为大规模AVI的未来研究提供基础性参考。
UniCorrn：跨2D和3D的统一对应变换器	Prajnan Goswami	2026-05-05	PDF	图像到图像（2D-2D）、图像到点云（2D-3D）以及点云到点云（3D-3D）的几何匹配构成了众多3D视觉任务的基础。尽管问题结构相似，现有方法仍采用任务特定设计，为每种模态组合使用独立模型。我们提出UniCorrn，首个共享权重的对应模型，统一了所有三种任务的几何匹配。核心洞察在于Transformer注意力机制天然捕捉跨模态特征相似性。我们设计双流解码器，分别维护外观和位置特征流。该设计通过可堆叠层实现端到端学习，同时支持跨异构模态的灵活查询式对应估计。架构采用模态特定主干网络，后接共享编码器和解码器组件，在融合深度图伪点云与真实3D对应标注的多样化数据上联合训练。UniCorrn在2D-2D匹配上达到竞争性能，并在7Scenes（2D-3D）和3DLoMatch（3D-3D）的配准召回率上分别超越先前最优方法8%和10%。项目网站：https://neu-vi.github.io/UniCorrn
大型语言模型是视觉生成的通用推理器。	Sucheng Ren	2026-05-05	PDF	文本到图像生成技术随着扩散模型的发展取得了快速进步，从基于CLIP和T5的条件控制演进到统一系统——由单个大语言模型主干同时处理视觉理解与生成任务。尽管架构实现了统一，这些系统在合成过程中仍频繁出现无法准确对齐复杂提示词的问题，即便它们在验证图像是否符合相同提示词时保持着极高的准确性。我们将此现象形式化为"理解-生成鸿沟"，并提出UniReasoner框架，该框架利用大语言模型作为通用推理器，将其理解能力转化为直接的生成引导。给定提示词后，大语言模型首先生成由离散视觉标记构成的粗略视觉草稿，随后通过评估草稿与提示词的一致性进行自我批判，生成定位修正需求的具象化文本评估。最终，扩散模型在提示词、视觉草稿和评估结果的联合条件下进行生成，确保生成过程受显式修正信号的引导。每个信号都弥补了另一方的局限性：视觉草稿提供了具体的场景级锚点，减少了纯文本条件控制中的欠指定问题；而评估则将验证转化为具象化、可操作的约束条件，修正了遗漏、幻觉和关系错误。实验表明，在相同扩散模型主干下，UniReasoner在保持图像质量的同时提升了组合对齐度和语义忠实度，展示了利用大语言模型推理能力弥合理解-生成鸿沟的实用方法。
在临床大语言模型中，安全性与准确性遵循不同的扩展规律。	Sebastian Wind	2026-05-05	PDF	临床大语言模型（LLM）的扩展通常通过增加模型规模、上下文长度、检索复杂度或推理时计算量来实现，其隐含假设是更高的准确率意味着更安全的行为。这一假设在医学领域并不成立——在医学中，少数自信的、高风险或与证据相矛盾的错误可能比平均基准性能更为关键。我们提出SaFE-Scale框架，用于衡量临床LLM安全性如何随模型规模、证据质量、检索策略、上下文暴露程度及推理时计算量变化。为实例化该框架，我们引入RadSaFE-200基准测试，包含200道放射学安全聚焦的多选题，并配有临床专家定义的清晰证据、矛盾证据以及高风险错误、不安全答案和证据矛盾的选项级标签。我们评估了34个本地部署的LLM在六种部署条件下的表现：闭卷提示（零样本）、清晰证据、矛盾证据、标准RAG、智能体RAG及最大上下文提示。清晰证据带来了最显著的改进，平均准确率从73.5%提升至94.1%，同时高风险错误从12.0%降至2.6%，矛盾从12.7%降至2.3%，危险过度自信从8.0%降至1.6%。标准RAG和智能体RAG未能复现这一安全表现：智能体RAG相比标准RAG提升了准确率并减少了矛盾，但高风险错误和危险过度自信仍居高不下。最大上下文提示增加了延迟却未缩小安全差距，而额外推理时计算量仅带来有限收益。最差情况分析显示，临床后果严重的错误集中在少数题目中。因此，临床LLM安全性并非扩展的被动结果，而是由证据质量、检索设计、上下文构建及集体失败行为共同塑造的部署属性。
OpenSeeker-v2：利用信息丰富且高难度的轨迹推动搜索智能体的极限	Yuwen Du	2026-05-05	PDF	深度搜索能力已成为前沿大语言模型智能体不可或缺的核心技能，但其研发仍被工业巨头主导。行业典型方案需要经过预训练、持续预训练、监督微调和强化学习等资源密集型流程。本报告表明，当配备信息丰富且高难度的轨迹数据时，简单的监督微调方法也能出人意料地有效训练前沿搜索智能体。通过引入三项简单的数据合成改进：扩展知识图谱规模以增强探索深度、扩大工具集规模以提升功能广度、实施严格低步数过滤，我们建立了更强的基线模型。仅使用10.6k数据点训练的OpenSeeker-v2，在4项基准测试中（基于ReAct范式的30B参数智能体）达到最优性能：BrowseComp 46.0%、BrowseComp-ZH 58.1%、人类最后考试34.6%、xbench 78.0%，甚至超越了采用重型CPT+SFT+RL流水线训练的Tongyi DeepResearch（对应得分43.4%、46.7%、32.9%、75.0%）。值得注意的是，OpenSeeker-v2是首个由纯学术团队仅通过监督微调开发的、在其模型规模和范式内达到最优水平的搜索智能体。我们兴奋地开源OpenSeeker-v2模型权重，分享这个简单而有效的发现，让前沿搜索智能体研究更易被社区获取。
基于多视角捕捉的大规模高质量3D高斯头部重建	Evangelos Ntavelis	2026-05-05	PDF	我们提出HeadsUp，一种可扩展的前馈方法，用于从大规模多摄像头设置中重建高质量3D高斯头部。该方法采用高效的编码器-解码器架构，将输入视图压缩为紧凑的潜在表示。该潜在表示随后被解码为一组UV参数化的3D高斯，这些高斯锚定在标准头部模板上。这种UV表示将3D高斯的数量与输入图像的数量和分辨率解耦，从而能够使用大量高分辨率输入视图进行训练。我们在包含超过10,000个主体的内部数据集上训练和评估模型，该数据集规模比现有多视角人类头部数据集大一个数量级。HeadsUp实现了最先进的重建质量，并且无需测试时优化即可泛化到新身份。我们广泛分析了模型在身份、视图和模型容量方面的扩展行为，揭示了质量与计算权衡的实用见解。最后，我们通过展示两个下游应用来突出潜在空间的优势：生成新的3D身份以及使用表情混合变形来动画化3D头部。
随时间保持一致：通过情境反思与隐私保护行为数据实现纵向人机对齐	Simret Araya Gebreegziabher	2026-05-05	PDF	当前针对大型语言模型（LLM）的人类对齐与评估方法，通常依赖交互结束后立即收集的偏好信号。这种实践隐含地将偏好视为静态特征，然而许多由LLM中介的决策会随时间展开，并在经历现实后果与观察结果后可能被重新评估。因此，我们主张方法论应从单次偏好采集转向纵向、情境化的对齐测量。我们提出一种方法论框架，通过结合（1）情境内偏好捕获、（2）情境触发的后续偏好反思，以及（3）有助于解释偏好变化的隐私保护行为轨迹，来收集具有时间维度的对齐信号。作为该方法的具体实现，我们推出BITE系统——一个基于浏览器的工具，可检测具有后果性的LLM交互，在后续决策节点触发反思，并支持渐进式、用户可控的行为数据共享许可。通过为期两周、8名参与者的纵向部署研究，我们的方法揭示了即时偏好与后期偏好在LLM输出的准确性、相关性及其他维度上的差异。研究结果凸显了单次偏好数据集的局限性，并强调了日常使用中纵向方法对于对齐评估的重要性。
Transformer能否预测动力系统中的系统崩溃？	Zheng-Meng Zhai	2026-05-05	PDF	Transformer架构近期作为非线性动力系统的有前景解决方案而兴起，被提出作为能够实现零样本动力学重建与预测的基础模型。尽管取得这一成功，但其能否真正作为动力系统的可靠数字孪生仍不明确——即它们是否能在不同参数区间（尤其是未参与训练数据的参数区间）捕捉底层物理动力学。对于非线性动力系统的参数空间外推，储层计算已展现出广泛成功：通过适当训练可将其转化为内在动力系统，不仅能捕捉目标系统的动力学气候，更重要的是能捕捉气候随参数变化的方式。相比之下，Transformer依赖置换不变注意力机制，这可能限制其捕捉时间结构随参数变化的能力。为判定Transformer是否具备动力学外推能力，我们以预测灾难性崩塌（当分岔参数跨越临界阈值时发生）作为基准任务。模型在正常参数区间的轨迹上训练，随后在包含系统崩塌的未见过参数区间进行测试。结果表明，不同配置的Transformer始终无法捕捉崩塌现象，而储层计算能可靠预测这些转变。这一惊人发现引发了对Transformer在动力系统中泛化能力的质疑，该课题值得未来深入研究。
重新定义智能体时代的人工智能红队测试：从数周缩短至数小时	Raja Sekhar Rao Dheekonda	2026-05-05	PDF	人工智能系统正进入医疗、金融和国防等关键领域，但仍易受对抗性攻击。虽然AI红队测试是主要防御手段，但现有方法迫使操作员采用手动、特定库的工作流程。操作员需花费数周手工构建工作流——整合攻击、变换和评分器。当结果不理想时，必须重建整个工作流。因此，操作员在构建工作流上耗费的时间远超对目标进行安全漏洞探测的时间。我们提出基于开源Dreadnode SDK构建的AI红队测试代理。该代理可创建基于45+对抗攻击、450+变换和130+评分器的工作流。操作员可探测多智能体系统、多语言和多模态目标，专注于"探测什么"而非"如何实现"。我们做出三项贡献：1. 代理接口。操作员通过Dreadnode TUI（终端用户界面）用自然语言描述目标。代理负责攻击选择、变换组合、执行和报告，让操作员专注于红队测试。数周工作压缩至数小时。2. 统一框架。单一框架即可探测传统ML模型（对抗样本）和生成式AI系统（越狱攻击），无需使用独立库。3. Llama Scout案例研究。我们对Meta Llama Scout进行红队测试，在零人工代码开发条件下实现85%攻击成功率，最高严重性达1.0。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
通过优化嗅觉记忆网络中的神经流形进行表征学习	Hu, B.	2026-05-06	PDF	认知脑功能依赖于经验驱动的相关信息内部表征。这些表征通过吸引子动力学或其他将群体活动约束在"神经流形"上的机制进行组织。由于表征流形可能具有复杂几何结构（尤其在缺乏吸引子状态时），对其进行定量分析较为困难。本研究训练幼年和成年斑马鱼执行气味辨别任务，并测量神经元群体活动，以分析端脑pDp区（梨状皮层同源区域）中行为相关气味的表征。未检测到明显的吸引子动力学特征。然而，气味辨别训练选择性地增强了代表任务相关气味的神经流形与其他表征的分离，这与具有精确突触平衡的自联想网络模型预测一致。采用流形容量框架的分析方法揭示了表征流形的多种几何结构修饰，这些修饰支持任务相关感觉信息的分类。相较于其他群体活动描述指标，流形容量能更准确地预测个体间的气味辨别能力，表明流形几何结构与行为之间存在紧密关联。因此，pDp区及可能相关的循环网络通过表征流形的几何结构存储信息，形成支持分布式学习过程的联合感觉-语义图谱。
乳房、乳晕和乳头的触觉定位	Long, K.	2026-05-06	PDF	触觉在我们感知身体和塑造与世界互动中扮演关键角色，从我们操控的物体到我们触碰的人。尽管手部的触觉敏感性已被广泛研究，但身体其他部位的触觉特性却鲜为人知。乳房在哺乳、情感及性接触中具有重要作用，但其感官特性仍相对未知。为填补这一空白，我们研究了女性定位乳房触点的能力，并将其与手部和背部（这两个身体区域覆盖了触觉辨别能力的范围）进行比较。首先，我们发现乳房的触觉精确度甚至低于背部——此前被认为是精确度最差的部位。其次，经历过更大程度扩张的乳房精确度更低，这与神经支配能力不随体型变化的假设一致。第三，乳头不同区域的触觉刺激基本无法区分，表明其神经支配密度稀疏。第四，定位误差系统性地偏向乳头方向。
MKado：自然选择McDonald-Kreitman检验工具包	Rivera-Colon, A. G.	2026-05-06	PDF	MKado是一个Python工具包，用于从比对编码序列执行自然选择的McDonald-Kreitman（MK）检验。它实现了标准MK检验及其多种扩展和相关统计方法，包括在考虑轻微有害突变的同时估计适应性替换比例（）的多种方法，并提供了统一的命令行界面和Python API。MKado支持对数千个基因进行近线性扩展的并行批量处理，并提供火山图、渐近曲线等可直接用于发表的图表。
梯度多喷嘴3D打印	Rosalia, L.	2026-05-06	PDF	直写打印技术兼容广泛的材料体系。这种材料多样性虽能支持多种应用，却给墨水配方带来显著瓶颈——项目过程中往往需要混合、打印和测试数十至数百种墨水配方。为加速墨水空间探索，我们引入梯度嵌入式多喷嘴打印头，将多喷嘴高通量并行打印与组合式墨水混合相结合。该打印头可同时混合双输入、三输入及四输入墨水，这些墨水被分配至打印喷嘴，从而构建具有墨水梯度成分的复杂三维结构。通过双通道GEM打印头，我们打印含不同浓度成纤维细胞的支架并观察非线性压实行为，验证了细胞相容性。随后测试三通道GEM多喷嘴，打印十种双功能化/多功能化聚乙二醇二丙烯酸酯水凝胶三叶瓣膜，优化其刚度、溶胀比和韧性。我们的GEM多喷嘴兼容开源打印机及压力/体积驱动挤出系统，有望加速迭代式墨水设计与测试。
间作对欧洲大豆和玉米自给自足具有高潜力贡献。	Chen, M.	2026-05-06	PDF	欧盟目前在大豆和玉米方面无法自给自足。本研究探讨了玉米-大豆间作在提升欧盟大豆自给率的同时，最小化对玉米及其他作物生产影响的潜力。假设每四年轮作一次，在630万、1310万和2010万公顷土地上实施间作，可分别产出910万吨（2880万吨）、1820万吨（6370万吨）和2720万吨（9900万吨）大豆（玉米），从而实现25%（34%）、50%（75%）和75%（116%）的自给率。若通过单作达到同等产量，需额外增加1110万、2470万和3650万公顷耕地，而间作可节省20-21%的土地。要满足欧洲100%的大豆需求，需每年在超过25%的欧洲耕地（2500万公顷）上推广间作。在氮肥投入和作物共生期差异较大的条件下，只要每公顷间作的大豆产量超过0.5公顷单作大豆的产量，上述估算结果依然成立。土地节约估算表明，需考虑作物产量的地理差异以评估间作的土地利用效率。研究结果强调，间作是同步提升欧洲大豆产量、满足玉米需求并节约耕地的有效策略。
情境不确定性下，后扣带回皮层中乙酰胆碱的协调释放与神经元表征的适应	Goodwin, D.	2026-05-06	PDF	准确学习需要大脑区分预期不确定性和非预期不确定性，以便新信息能适当更新记忆。研究提出神经调节物质乙酰胆碱能重构学习相关的神经网络，是传递不确定性信号的关键因子。本研究通过在小鼠面临预期与非预期的奖励位置不确定性挑战时，测量其后扣带回皮层的乙酰胆碱释放与神经元表征来验证该假说。乙酰胆碱释放随预期不确定性的变化而增加，但仅对伴随情境转换（改变预期不确定性）的非预期不确定性产生响应。与此同时，随着预期不确定性增加，神经元表征最初从位置参考框架转向聚焦于显著地标（如奖励位置）。当经历非预期不确定性时，预期不确定性的转变还会加速表征重映射与行为适应。因此，我们证实乙酰胆碱释放能区分不确定性类型，并与不确定环境中的学习速度呈正相关。
不同类别抗抑郁药对大脑的汇聚效应：基于海马体和皮层公共转录组数据的系统性荟萃分析	Geoghegan, E. M.	2026-05-06	PDF	抑郁症可通过靶向单胺能功能的传统药物、非传统药物类别及神经调控干预手段进行治疗。为识别临床有效抗抑郁治疗类别间共有的作用机制，我们对成年实验啮齿动物（大鼠、小鼠）的公开转录组学数据进行了两项系统性荟萃分析。结局变量为基因表达水平，通过微阵列或RNA测序技术从两个抑郁相关脑区（海马体、皮层）的批量解剖组织中测量。相关数据集通过预设检索词及纳入/排除标准，在经人工筛选与再处理的转录组学数据库Gemma中识别（海马体：2024年6月24日；皮层：2024年7月10日）。提取所有基因的差异表达结果以最小化偏倚。针对每个基因，采用随机效应荟萃分析模型拟合各研究中抗抑郁治疗组与对照组效应量（Log2倍数变化）的脑区特异性数据，并通过后续分析探索效应异质性的来源。在海马体中，共识别15项相关研究，包含22组抗抑郁治疗与对照组比较（总样本量n=313），其中约半数涉及传统与非传统抗抑郁药物。在分析的16,439个基因中，58个基因在治疗后呈现一致性差异表达（错误发现率<0.05）。抗抑郁效应富集于齿状回及与压力调节、脑生长与可塑性、血管与胶质细胞、免疫功能相关的基因集。与单细胞核RNA测序的比较证实了其对特定海马细胞类型的影响，包括齿状颗粒神经元的潜在年轻化。在皮层中，共识别13项研究，包含16组抗抑郁治疗与对照组比较（总样本量n=233）。在分析的15,583个基因中，仅一个基因（Atp6v1b2）呈现一致性差异表达（错误发现率<0.05），但整体表达模式与海马体中度相似。这些在治疗类别间呈现一致性差异表达的基因与通路可能成为新疗法的潜在靶点。未来研究应探索其与人类临床人群的相关性，以及性别与亚区可能引入的异质性。
背内侧纹状体神经状态转换的累积预测斑块觅食决策	Sutlief, E.	2026-05-06	PDF	具有时间分布回报的活动不仅需要决定做什么，还需要决定何时停止。尽管最优觅食理论预测离开斑块应取决于在斑块中投入的总时间，但跨物种的行为往往反映出对近期奖励的敏感性。背内侧纹状体（DMS）同时介导目标导向决策和间隔计时，这两种功能在斑块觅食过程中交汇——动物必须决定何时离开斑块以最大化奖励率。我们在自由活动小鼠执行斑块觅食任务时记录了DMS神经元的细胞外活动。小鼠采用奖励重置策略，主要依据上次奖励后的时间做出离开决策，并系统性地根据斑块停留时间和环境奖励率背景进行调整。DMS中的单个神经元在每次奖励后的特征延迟时间点发生离散的放电率转换。这些转换时间在群体层面覆盖了奖励后间隔，产生一个随每次奖励重置的累积至阈值信号，其速率对时间成本敏感——随着环境奖励率升高以及奖励在斑块中出现时间更晚而增加。这种累积在斑块离开时刻达到一致阈值，编码了动物预期的停止时间。综合来看，这些结果揭示了DMS中一种时间成本可变、奖励重置、累积至阈值的计算机制，该机制整合环境奖励率、从追逐开始经过的时间以及从奖励发生经过的时间，以决定何时放弃一个逐渐枯竭的追逐。
解剖约束与精选小脑纤维束成像（ACCURAT）：一个开放框架及通路特异性神经解剖学参考	Legarreta, J. H.	2026-05-06	PDF	小脑通路形成广泛的结构回路，将小脑与脑干、丘脑及大脑相连，支撑运动、认知和情感功能。弥散磁共振纤维束成像提供了在活体内无创绘制这些通路的唯一方法，但由于纤维交叉、脚部瓶颈、交叉投射、多突触回路以及定义通路起点和终点的众多小核团，小脑连接的重建仍具挑战性。本文提出解剖约束与筛选纤维束成像（ACCURAT），这是一个基于弥散磁共振数据、利用解剖先验和规则化流线查询重建小脑通路的开放框架。ACCURAT结合解剖分割、密集种子点纤维束成像以及沿流线轨迹的顶点级解剖约束评估，能够分离特定核团内的通路片段，同时阻止其跨越突触边界传播。为定义这些约束，我们基于实验性纤维追踪文献，提供逐条通路的简明小脑连接解剖学综合，并针对纤维束成像应用进行组织。我们识别通路特异性起点、轨迹、终点、交叉模式及纤维束成像挑战，并利用这些信息制定适用于纤维束成像的小脑通路定义。利用健康受试者的超高分辨率亚毫米弥散磁共振（0.76毫米gSlider采集），我们重建了多种小脑外部和内部通路，包括小脑下脚、中脚和上脚的具体成分；具有挑战性的交叉通路（如橄榄小脑和齿状核-橄榄投射）；以及小脑内部通路（包括浦肯野皮质核投射和皮质内平行纤维）。ACCURAT可泛化至不同纤维束成像算法，使用概率并行传输纤维束成像和确定性无迹卡尔曼滤波纤维束成像均能产生可比较的重建结果。综上，ACCURAT框架及配套神经解剖学参考为活体内小脑通路重建提供了基于解剖学、面向纤维束成像的资源，并支持未来小脑纤维束成像方法的开发与评估。
多变量脑-行为关联的可重复性取决于临床特征	Wang, M.	2026-05-06	PDF	近期研究表明，多变量脑行为分析需要数千名个体才能获得可重复验证的结果。但部分学者认为，若针对特定亚群进行研究，较小样本量可能同样有效。我们利用英国生物银行（N=40,514）数据，探究了样本量与队列构成对典型相关分析结果可重复性的影响。将典型相关分析应用于弥散加权磁共振成像表型与认知评估测试得分，根据临床特征划分四个参与者队列后发现：所有队列均需约500人样本量才能获得可重复的典型相关性与变量载荷。其中最具针对性的队列（含精神活性物质使用史个体）所需样本量远少于其他队列，却能实现相似甚至更强的相关性。本研究支持"针对特定队列的中等样本量足以获得可重复脑行为关联"这一观点。

medRxiv

标题	作者	发布日期	PDF链接	摘要
乌干达成年HIV感染者中重度抑郁症（MDD）的遗传决定因素。	Nsangi, O. T.	2026-05-06	PDF	背景重度抑郁症是一种复杂且具有中等遗传性的疾病，遗传率估计在30%至40%之间。重度抑郁症是HIV感染者中常见的共病，与抗逆转录病毒治疗依从性差、自杀相关行为风险增加等有关。本研究调查了乌干达成年HIV感染者中与重度抑郁症相关的遗传风险位点。方法本病例对照研究分析了282份样本（139例重度抑郁症病例和143例对照），使用迷你国际神经精神访谈评估重度抑郁症。研究参与者的DNA在南非蛋白质组学和基因组学研究中心使用H3Africa芯片（版本2）进行基因分型。数据分别使用PLINK2和GEMMA软件进行质量控制和全基因组关联分析，随后使用FUMA软件进行功能映射。结果虽然在全基因组阈值下未发现显著的单核苷酸多态性，但发现三个独立单核苷酸多态性与重度抑郁症存在提示性关联，其中最显著的是染色体2上的rs4375916（p=1.086x10-），其次是染色体3上的rs1075618（p=3.093x10-）和染色体13上的rs953855（p=4.906x10-）。这些单核苷酸多态性被发现与先前与其他精神疾病（如阿尔茨海默病、酒精使用障碍和双相情感障碍）相关的单核苷酸多态性存在连锁不平衡，尽管它们此前未与重度抑郁症相关联。基因集富集分析揭示了与关键生物学过程（包括突触组织）的关联，提示其可能参与重度抑郁症的病理生理学。结论本研究为非洲裔HIV感染者中重度抑郁症的遗传因素提供了初步证据。虽然需要更大规模、充分有力的研究，但我们的发现强调了在HIV人群中研究精神遗传学的重要性，因为抑郁症是影响治疗结果的关键共病。
使用机器学习从心电图中筛查无症状儿童的风湿性心脏病	Chuma, A. T.	2026-05-06	PDF	风湿性心脏病（RHD）的早期检测对于降低相关死亡率和晚期并发症至关重要。在资源有限的环境中，使用低成本心电图（ECG）传感器进行自动化检测可加强预防工作。然而，其作为高风险人群潜在RHD筛查工具的有效性尚未得到探索。本研究旨在调查机器学习在利用低成本ECG设备筛查的队列中对RHD进行分类的效用。使用KardiaMobile从611名高风险学龄儿童中采集ECG数据，其中47例确诊为RHD，564例为健康儿童。首先，使用公开的基于显著性的波形标注器对ECG特征点进行标注。然后，从六个导联中提取时间、频率、小波和基于可见性图的特征，并输入XGBoost分类器。采用10折交叉验证在不同预测分数阈值下获取筛查RHD的目标灵敏度（Se）。单导联评估（Lead-II）显示F1分数为60.9%，Se为59.6%，阳性预测值（PPV）为62.2%。然而，使用多导联改善了结果，F1分数为62.8%，Se为59.6%，PPV为66.7%。通过将阈值调整为0.6，模型达到最佳性能，Se和PPV分别为66%和51%。误差分析显示，T波和STT改变以及非风湿性二尖瓣病例属于假阳性病例。机器学习可通过利用相关ECG特征和基于筛查优先级及资源能力可调整的目标灵敏度来增强早期检测。测量无需胸部接触，仅通过手指和膝盖即可完成，从而允许非临床人员使用。该方法为高流行地区的RHD筛查提供了可扩展且经济高效的解决方案。
重大手术后炎症与术后并发症：一项双向双样本孟德尔随机化研究	Armstrong, R. A.	2026-05-06	PDF	背景：观察性研究报道了炎症与术后并发症之间的关联，但尚不清楚这些关联是否具有因果关系，也不明确术后结局是否与慢性全因疾病共享相同的因果结构。方法：我们采用双向两样本孟德尔随机化方法，探究19种基因代理的炎症标志物对术后急性肾损伤、房颤、谵妄、心肌梗死、卒中和手术部位感染及其全因对应结局的潜在因果效应。炎症标志物的遗传工具来自九项全基因组关联研究，共纳入204,402名欧洲参与者，结局数据来源于英国生物银行。结果：主要术后分析显示，IL-6信号下调对卒中风险具有保护效应（OR (95% CI) 0.27 (0.11-0.69)，p=0.006）。然而，在全因分析中未观察到对卒中的因果效应（OR (95% CI) 1.14 (0.75-1.24)，p=0.78），而IL-6下调对房颤在所有三项工具中均显示出稳健的保护效应（所有p<0.009）。在术后和全因分析中，CRP的全基因组变异对谵妄表现出保护效应，但该效应在顺式限制分析中未出现。结论：我们发现了支持IL-6信号在围手术期卒中中潜在因果作用的证据。然而，IL-6在术后与全因结局中的效应差异表明，急性术后并发症的炎症结构可能不同于慢性疾病状态。此外，我们的发现提示，既往报道的CRP与谵妄之间的关联可能代表水平多效性而非直接因果关系。未来研究应聚焦于局部组织反应及围手术期即时阶段。
坦桑尼亚使用PlGF和sFlt-1/PlGF比值进行子痫前期产前筛查的成本效益：一项试验前卫生经济学建模研究	Lovecchio, G.	2026-05-06	PDF	子痫前期（PE）是导致孕产妇和新生儿发病及死亡的主要原因。高收入国家的研究表明，基于生物标志物的PE筛查可改善高风险女性的及时诊断和管理。我们在坦桑尼亚开展了一项引入生物标志物筛查的预试验成本效益分析，以确定支撑完整试验经济评估的关键参数。我们构建了一个决策树模型，将现行实践与两种基于生物标志物的筛查策略进行比较：策略1引入胎盘生长因子（PlGF），策略2增加可溶性fms样酪氨酸激酶-1（sFlt-1）/PlGF比值。两种策略均假设对高风险女性实施早期阿司匹林预防和/或密切监测。针对三种方案，我们以医疗系统视角模拟了PE诊断及一年时间范围内的孕产妇和新生儿结局。健康结局以伤残调整生命年（DALYs）量化，成本以2023年美元计算。与现行实践相比，策略1每避免一个DALY的增量成本为410.45美元，策略2为1011.78美元。将新策略限定于未产妇时，增量成本效益比降至184.15美元（策略1）和413.33美元（策略2）。影响成本效益的关键参数包括PE患病率、生物标志物筛查准确性、预防性治疗和监测的依从性与有效性及相关成本。基于研究结果，生物标志物筛查在坦桑尼亚具有成本效益潜力，尤其在妊娠早期引入并针对未产妇时。需在资源匮乏地区开展进一步研究以填补当前数据和证据缺口。
基于mRNA的细胞与基因疗法制造成本分析	Lieberthal, R. D.	2026-05-06	PDF	背景：细胞与基因疗法（CGT）是一类变革性医疗干预手段，但其高昂的生产成本限制了患者的可及性。理解制造成本结构对于制定扩大疗法可及性的政策至关重要。目的：本研究开发并应用销售成本（COGS）模型，分析基于mRNA的CGT制造成本构成要素，并适用于当前及未来多种疗法。方法：基于CGT成本类别构建Excel版COGS模型。采用两种商业化规模的mRNA产品填充模型：mRNA疫苗与治疗性mRNA基因疗法。成本数据来源于供应商报价、同行评审文献、灰色文献及CGT制造专家咨询。针对六个成本类别（原材料、耗材、资本、劳动力、许可费与专利费）建模三种情景（最差、基准与最佳）。通过龙卷风图敏感性分析识别关键成本驱动因素。利用公开数据源以mRNA疫苗构建并验证模型结构，以治疗性mRNA疗法作为主要用例进行说明与敏感性分析。结果：在基准假设下，治疗性mRNA产品每剂预估成本为56.09美元，范围从3.68美元（最佳情景）至383.22美元（最差情景）。许可费与专利费合计约占基准COGS总额的83%（每生产批次分别为6,996,000美元与6,960,000美元，总成本16,825,597美元）。排除这些费用后，原材料成本占剩余最大份额（61%），其次为耗材（34%）、资本（4%）与劳动力（1%）。敏感性分析证实许可费与专利费假设是模型中不确定性的主导来源。结论：许可费与专利费是mRNA类CGT生产成本的主要驱动因素，也是通过政策干预实现成本降低的最大机遇。成本降低的战略重点应聚焦于优化试剂利用率、提升平台效力，以及扩大合同研发生产组织（CDMO）的使用以降低资本与劳动力成本。
流感免疫的诞生：生命最初两年内由母体抗体衰减、疫苗接种和感染驱动的高分辨率抗体动态变化	Lee, S. M.	2026-05-06	PDF	尽管婴儿常被描述为免疫学上的"白板"，但其首次免疫反应的强度、持久性以及对后续暴露的影响仍不明确。我们对245名儿童进行了为期两年的纵向研究，绘制了疫苗接种和感染后的流感抗体动态变化图谱。母体抗体能有效传递给婴儿，但表现出不同的动力学特征：乙型流感抗体比甲型流感抗体持续更久（半衰期约75天 vs 50天）。在首次接种时母体抗体尚未完全衰减的婴儿中，83-94%对甲型流感无反应，59-72%对乙型流感无反应。为解释这种母体抗体对婴儿疫苗反应的干扰，我们制定了个性化临床算法，通过单次母体血液检测和抗体半衰期预测母体抗体降至检测不到水平的时间。此外，不同疫苗株的抗体反应存在差异，大多数婴儿在首次接种时对H1N1或H3N2无反应，但在第二次接种后产生反应。因此，在流感病例高峰后的2-5月间满6个月并接种疫苗的婴儿，在下一个流感季节表现出增强的抗体滴度，提示该群体中约33%的婴儿可能受益于晚季接种。在记录的60次感染中，甲型流感感染引发强烈的亚型特异性反应，而乙型流感则产生较弱但交叉反应性更强的应答。无论既往感染情况如何，首次疫苗反应强烈是第二次疫苗反应强烈的预测因子，表明首次疫苗反应会影响后续流感免疫力。
SPARC：一种基于机制感知的空间表征方法，通过常规组织学预测癌症生存与治疗反应	Ayed, A.	2026-05-06	PDF	理解驱动治疗反应的分子机制是个性化癌症治疗的核心，但空间转录组学等检测方法在常规临床实践中尚无法大规模应用。因此，一个关键问题在于：能否直接从常规组织病理学中提取这种更深层次的分子信息？本文提出SPARC框架，该框架可直接从H&E染色切片中推断40个基因表达程序的空间解析活性图谱。将预测的程序图谱与形态学特征相结合，可在涵盖8,383名患者的18种癌症类型中改善17种的生存预测，其效果与需要配对RNA测序的多组学方法相当。SPARC还能对卵巢癌贝伐珠单抗治疗反应（比值比=8.08）和乳腺癌曲妥珠单抗治疗反应（比值比=3.44）进行分层，而仅基于H&E图像的基线方法在区分应答者与非应答者时无显著差异。对预测图谱的无监督分析可直接从组织形态学中揭示典型的肿瘤微环境分区和空间相互作用模式，将临床结局的预测性能与潜在生物学机制联系起来。
抗生素与支持治疗对住院儿童重症肺炎的实用临床试验	Isaaka, L.	2026-05-06	PDF	背景指导重症肺炎患儿选择注射抗生素和支持治疗的证据有限，且可能未反映疫苗接种和抗菌药物耐药性相关的流行病学变化。方法在这项在肯尼亚16家医院开展的务实、开放标签、析因随机试验中，将2-59月龄符合世界卫生组织定义重症肺炎的患儿分配接受三种注射抗生素方案之一：苄青霉素联合庆大霉素（标准治疗）、头孢曲松或阿莫西林-克拉维酸。符合条件的患儿还随机接受鼻胃管喂养或静脉输液。主要结局为入组后第5天全因死亡。结果共4393名患儿被随机分配至抗生素组，1064名患儿分配至支持治疗组。第5天时，接受苄青霉素联合庆大霉素的1463名患儿中87例死亡（6.0%），接受阿莫西林-克拉维酸的1458名患儿中82例死亡（5.6%）（校正风险比[aRR] 0.94；97.5%置信区间[CI] 0.67-1.31），接受头孢曲松的1462名患儿中81例死亡（5.5%）（aRR vs. 苄青霉素联合庆大霉素 0.95；97.5% CI 0.68-1.33）。第5天死亡发生在接受鼻胃管喂养的531名患儿中30例（5.7%）和接受静脉输液的532名患儿中35例（6.7%）（aRR 1.13；97.5% CI 0.71-1.79）。各组次要结局相似。结论在重症肺炎住院患儿中，苄青霉素联合庆大霉素的结局与头孢曲松或阿莫西林-克拉维酸相似，鼻胃管喂养与静脉输液在死亡率和安全性方面相当。试验注册：ClinicalTrials.gov：NCT04041791；泛非临床试验注册中心：PACTR202106720981298
基于新加坡纵向老龄化研究中常规实验室生物标志物构建的血液生物学年龄模型	Ye, J.	2026-05-06	PDF	临床实践中的风险评估主要依赖于临床表型，包括年龄、性别、体重指数、血压及合并症。尽管常规实验室数据易于获取且成本低廉，但其应用仍不充分。基于新加坡纵向老龄化研究数据（n=5,409；中位随访11.4年），我们开发了基于常规实验室生物标志物的死亡预测模型。通过推导生物学年龄（年龄商数，AQ）评分，我们探究了其在生活方式风险因素与死亡率之间的中介作用。该模型及关联分析在美国国家健康与营养调查（n=6,593）和英国生物银行（n=290,949）队列中得到验证。死亡个体的AQ显著升高（P<0.0001），且存在AQ加速现象（P<0.0001）。在总生存期判别中，AQ优于实际年龄（C指数0.629 [标准误0.011] vs 0.606 [标准误0.011]），显示出更优的预后预测能力。将AQ纳入包含实际年龄的基线模型后，模型拟合度显著改善（似然比检验，P<0.0001），表明AQ对死亡率的预测价值超越实际年龄。中介分析支持AQ在生活方式因素与死亡率关系中发挥部分中介作用。在57例患者亚组中，较高AQ与TET2克隆性造血负荷增加相关（β≈0.016/每增加1个AQ年），提示AQ加速、克隆性造血风险与衰老性疾病间存在潜在关联，需在更大规模队列中验证。我们发现了生活方式因素与不同生物学年龄组分之间的差异化关联，表明其对各生物系统具有选择性影响。这些发现为早期精准识别高风险个体提供了循证框架，并提供了实用易行的工具以指导预防策略。
一项关于斯威士兰性传播感染专科健康诊所中PrEP使用者和非使用者安全套使用及性传播感染患病率的横断面比较分析方案	Mafulu, Y. M.	2026-05-06	PDF	引言性传播感染（STI）是全球面临的重大公共卫生挑战，南部非洲地区的感染率尤为突出。在斯威士兰，包括HIV在内的STI负担令人担忧，亟需有效的预防策略。暴露前预防（PrEP）已被引入作为关键干预措施，但其对安全套使用和STI患病率的影响尚未得到充分探索。目的本研究旨在评估并比较斯威士兰一家STI健康诊所中，使用PrEP与未使用PrEP的求诊者在安全套使用模式及STI患病率方面的差异。方法将于2026年1月至5月在拉姆维拉塞STI健康中心开展一项前瞻性横断面定量研究。参与者将通过目的性抽样招募，纳入15岁及以上的HIV阴性个体。通过结构化问卷和医疗记录收集数据，评估安全套使用频率、性行为及STI发生率。将进行实验室检测以确认STI诊断。统计分析包括描述性统计和逻辑回归，以识别PrEP使用与STI患病率之间的关联。结果研究预计将揭示PrEP使用与安全套使用行为、STI患病率之间的关系，以及求诊者对健康营销策略的体验和偏好。研究结果将为斯威士兰降低STI感染率、改善性健康结局的公共卫生策略和教育项目提供依据。结论理解PrEP使用与性健康实践之间的动态关系，对于优化STI预防策略至关重要。本研究将为高STI患病率环境下的干预措施和卫生政策提供宝贵数据，并助力设计更有效的干预策略，最终支持斯威士兰减轻STI和HIV影响的努力。