2026-06-08 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
离散概率中的反直觉问题	Luca Avena	2026-06-05	PDF	本手稿收录了一系列离散概率中的反直觉问题及其详细解答。该数据集是更广泛研究项目的一部分，旨在探究最新一代大语言模型在解决离散概率问题方面的能力，以评估LLMs是否倾向于犯与已知认知偏差相关的系统性推理错误。此处收集的问题专门设计用于挑战启发式推理策略——这类策略常导致直觉上吸引人但数学上错误的结论。数据集融合了多种类型的问题：部分改编自经典概率悖论和认知偏差文献，另一些源于趣味数学资料，或由我们根据类似原则自行开发。本文档的主要目的是为我们在语言模型实验评估中使用的问题提供透明且公开的参考，同时附上人工制作的详细解答。此外，我们相信该数据集对未来的概率推理、认知偏差研究以及人工智能系统推理能力评估同样具有实用价值。
在掷骰子方面，大语言模型的可靠性如何？	Luca Avena	2026-06-05	PDF	我们通过一项针对离散概率问题的受控基准研究，探究了大型语言模型的概率推理能力。我们构建了两个数据集，分别包含一组标准习题和一组旨在触发启发式推理的反直觉习题，并评估了8个最先进的模型，每个模型均在有无思维链提示的条件下进行了测试。模型在标准问题上的平均准确率达到0.96，但在反直觉问题上仅为0.59。我们进一步提供了关于词元偏差的经验证据：当规范表述被替换为伪装变体时，性能下降超过20%。在提示中嵌入误导性建议会使性能降低高达34%，且没有模型能完全免疫。综合来看，这些发现表明，尽管当前的大型语言模型在高级数学问题上表现出色，但它们尚未成为真正的概率推理者。
UniSHARP：通用锐化单目视图合成	Meixi Song	2026-06-05	PDF	在本工作中，我们聚焦于扩展SHARP这一流行的逼真视图合成方法，使其适用于从传统透视相机到广角、鱼眼及全景等连续相机系统的通用单目渲染。为克服SHARP基于针孔模型的假设，我们的核心思路是将各类图像对齐至统一的球面潜空间。为此提出UniSHARP方法，在特征空间与高斯空间中实现隐式对齐。具体而言，高斯基元沿射线与径向距离排列于基于射线的通用表征中，同时通过UniK3D启发式编码器提取的2D语义与3D空间特征被联合解码以生成完整高斯云。为全面评估方法，我们构建了覆盖多场景多成像系统的基准测试集，并按视场角分层以实现通用单目渲染任务的细粒度评估。在基准测试上的大量实验表明，UniSHARP以显著优势超越其他方法。项目主页：https://insta360-research-team.github.io/Unisharp-website/
Agentopia：智能体社会中的长期生命模拟与学习	Xintao Wang	2026-06-05	PDF	人类从社会生活中学习。用大语言模型驱动的智能体模拟这一过程是一个有前景的研究方向，这自然引发了一个问题：大语言模型能否通过这种模拟的社会经验来更好地理解和复现人类行为？然而，以往的智能体社会模拟通常以天为单位运行，限制了社会互动的深度和长期成长。本文研究智能体社会中的长期生活模拟与大语言模型学习，目标有二：（1）探究终身模拟中涌现的社会行为；（2）通过数年的模拟社会经验，发展大语言模型拟人化能力，特别是社会生活智能。具体而言，我们提出Agentopia这一多智能体社会长期生活模拟的综合框架，其中100个智能体在10年模拟时间内自主追求个人成长、发展社会关系并满足自身需求与目标。我们定义生活奖励以映射人类福祉，并利用该奖励通过拒绝采样训练大语言模型。大量实验表明，智能体展现出丰富的涌现社会行为。此外，生活奖励训练有效增强了底层大语言模型，不仅提升了模拟中的智能体福祉，还泛化到下游角色扮演基准测试中，带来+15.6%的性能提升。
MemDreamer：通过分层图记忆与智能检索机制解耦感知与推理以实现长视频理解	Cong Chen	2026-06-05	PDF	当前的视觉-语言模型在处理数小时长视频时面临挑战，因为处理完整视觉序列会导致令牌爆炸和注意力稀释。为解决这一问题，我们提出MemDreamer，将感知与推理解耦，将长视频理解转化为智能体探索过程。作为即插即用框架，它逐步流式处理视频以构建分层图记忆——一种用于语义抽象的自顶向下三层架构，其基础图捕捉时空与因果关联。推理阶段，推理模型采用智能体工具增强检索，通过观察-推理-行动循环在层级间导航、搜索节点并遍历逻辑边。实验表明，MemDreamer在四个主流基准测试中达到最优结果，与人类专家的差距缩小至仅3.7个百分点。它将推理上下文窗口限制为完整上下文摄入的2%，同时实现12.5个百分点的绝对准确率提升。此外，统计分析揭示了视觉-语言模型在逻辑推理与长视频理解基准测试性能间存在强正线性相关，将智能体能力扩展确立为多模态理解的新范式。
基于流力控制的流式视频生成	Hanhui Wang	2026-06-05	PDF	我们提出StreamForce，一种通过连续力输入实现物理可控的流式视频生成框架。与以往需要为不同力类型训练独立模型、假设固定力或依赖非因果处理的视频模型不同，StreamForce是一个因果统一模型，能即时且连贯地响应局部与全局的时变力。为此，我们设计了统一的力表征作为控制信号，并开发了用于力可控视频生成的蒸馏流程。该模型结合了自回归效率与力响应能力，维持稳定的光度与动态真实性。StreamForce在单GPU上运行速度可达16.6 FPS，在力遵循度与运动真实性方面均达到最优性能。项目网站：https://neu-vi.github.io/StreamForce/
检测中的差异：在关键之处进行可解释性分析	Johannes Theodoridis	2026-06-05	PDF	我们提出“检测差异”（DnD）方法，这是一种直观比较两个目标检测模型的方案。基于相同的匹配算法，该方法在平均精度均值（$mAP$）和TIDE误差分析等标准指标基础上，补充了直接比较两个模型的能力。具体而言，我们计算两个模型共同识别的真实标签交集，随后获取对应的差异集，以及两个模型均未识别的真实标签补集。这种比较方式比独立汇总统计量的对比更直接、更直观，能够揭示个体错误与共享错误，尤其在与错误类型结合时更具价值。此时，检测误差的差异可自然地通过标准混淆矩阵进行分析。尽管该方法本身具有重要价值，但我们认为DnD的最佳应用之一，是引导ODAM等可解释性方法聚焦于与指标相关的样本，这些样本基于结构化子集。本方法的代码可在此获取：https://github.com/JohannesTheo/differences-in-detection
你的解嵌入矩阵实际上是文本嵌入的特征透镜。	Songhao Wu	2026-06-05	PDF	大型语言模型在各类下游任务中展现出令人印象深刻的零样本能力。然而，它们难以直接作为现成的嵌入模型使用，导致在大规模文本嵌入基准测试中表现欠佳。本文识别了导致这一缺陷的潜在原因。我们的动机源于一个意外发现：当文本嵌入投影到词汇空间时，往往会与高频但无信息量的标记对齐。我们认为，这种对高频标记的过度表达抑制了模型捕捉细微语义的能力。为解决这一问题，我们提出了EmbedFilter——一种简单的线性变换方法，可直接优化从大语言模型中提取的文本嵌入。具体而言，我们发现大语言模型中的解嵌入矩阵编码了一个潜在空间，该空间会主动将这些高频标记写入嵌入空间。通过过滤该子空间，EmbedFilter抑制了高频标记的影响，从而增强语义表征。作为一项引人注目的副产品，该方法实现了固有的维度压缩，在完全保留优化后嵌入质量的同时，降低了索引存储并加速了检索。我们在多个大语言模型骨干上的实验表明，即使嵌入维度显著降低，配备EmbedFilter的大语言模型仍能实现更优的零样本下游性能。我们希望这些发现能为基于大语言模型的表征机制提供更深入见解，并启发更规范的设计来改进文本嵌入训练。我们的代码已开源在https://github.com/CentreChen/EmbFilter。
面向任务无关持续学习的稀疏子空间到专家共享	Fatema Siddika	2026-06-05	PDF	大型语言模型（LLM）的持续学习受到可塑性-稳定性困境的制约：获取新能力往往导致对先前知识的灾难性遗忘。现有方法通常对所有参数一视同仁，未能区分特定任务知识与共享能力。我们提出面向任务无关持续学习的混合稀疏专家框架（SETA），该框架通过将参数自适应稀疏子空间分解为任务专属专家模块，解决了可塑性-稳定性的冲突。与标准更新中任务竞争同一参数不同，SETA将知识分离为独特专家（用于隔离任务特定模式）和共享专家（负责捕获通用特征）。该结构通过自适应弹性锚定和路由感知正则化来维持，两者在权重和路由层面共同保护共享知识，并使统一门控网络在推理时自动检索正确的专家组合。在多样化领域特定基准上的大量实验表明，SETA在LLaMA-2 7B和Qwen3-4B上相较于最先进的持续学习基线取得了具有竞争力或更优的整体性能，尤其在早期任务知识保持和反向迁移方面表现突出。
对比无监督数据增强的隐式数据合成	Patrick Kage	2026-06-05	PDF	科学观测产生大量未标注数据，人工标注耗时费力，这使得无监督学习技术对处理数据集具有重要价值。在这些方法中，对比学习为从未标注数据集中提取结构表征提供了便捷机制。对于自然图像而言，通用方法是采用多种数据空间增强方法生成合成样本；然而在科学观测中，数据空间扰动可能从根本上改变底层数据结构。我们提出的方法是通过扰动网络权重而非底层数据来生成对比样本，从而更完整地保留数据结构。我们采用基于SimCLR的流程对流星雷达观测数据进行验证，结果表明在匹配协议下该方法具有性能优势。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
糖尿病在痴呆症研究中为何重要。排除糖尿病状态会掩盖阿尔茨海默病中人类海马体、杏仁核和小脑的区域性线粒体DNA拷贝数变化。	Kaikini, A.	2026-06-08	PDF	糖尿病是阿尔茨海默病（AD）的主要风险因素，这两种疾病均涉及线粒体功能障碍。我们假设AD与易损脑区线粒体DNA拷贝数（mtDNA-CN）减少相关，且糖尿病会改变这些变化。研究分析了非认知障碍（NCI）和AD供体（伴或不伴糖尿病）的死后海马、杏仁核和小脑样本（N=66-77），通过绝对定量法测定mtDNA-CN。总体而言，AD患者的mtDNA-CN较低。然而，按糖尿病分层后呈现相反变化：非糖尿病AD病例的mtDNA-CN降低，而糖尿病病例在所有脑区均显示更高的mtDNA-CN，且与认知状态无关。这些结果证实AD脑内存在多脑区mtDNA-CN丢失，在无糖尿病情况下最为显著。糖尿病脑内较高mtDNA-CN的功能意义尚不明确，但糖尿病可能掩盖效应的证据对痴呆症研究具有重要启示。
切片内校准技术改善了解剖病理实验室内部及之间的免疫组织化学标准化。	Fernandes, G. M. d. M.	2026-06-08	PDF	免疫组织化学在肿瘤组织分析中的可重复性在不同参考实验室之间仍是一个持续挑战。我们测试了玻片内校准技术对胶质母细胞瘤（GB，IDH野生型）脑活检组织中p53免疫组化（IHC）反应在实验室间检测差异的缓解程度。玻片内校准技术采用0-100%浓度梯度，结合初级替代抗体和次级抗体，生成DAB沉淀的标准曲线。来自两家不同医院实验室的病理科独立对GB样本进行IHC检测，并使用Aperio Image Scope软件以40倍放大倍数数字化。特征提取（包括强度和纹理参数）通过R语言EBImage包完成，随后进行UMAP降维和DBSCAN聚类分析。结果显示，不同实验室处理的组织样本与玻片内校准技术标尺在强度和纹理聚类模式上存在显著差异。结合多项式回归分析的玻片内校准技术将数据协调性提升了约90%。我们的发现表明，采用玻片内校准技术的计算病理学在实现实验室内部一致性和实验室间可重复性方面具有关键作用。这些进展增强了诊断评估的可重复性，并支持神经肿瘤学中更客观、数据驱动的决策制定。
学习噪声中的规律性既涉及神经预测活动，也涉及表征变化。	Tirou, C.	2026-06-08	PDF	从嘈杂环境中提取结构化感觉模式的能力是认知的基础，但大脑如何学习复杂规律仍不清楚。通过一项视觉运动任务中的脑磁图记录，我们追踪了人类学习嵌入噪声中的非相邻时间依赖关系时的神经动态。研究发现学习过程由两种时间上可分离的机制支持。神经预测活动迅速出现，在刺激呈现前即表现出刺激特异性模式，并先于可测量的行为改善。随后是表征变化的缓慢积累，表现为统计依赖的非相邻元素间神经模式相似性增强。这两个过程均由分布式网络联盟支持，其中感觉运动网络和背侧注意网络发挥核心作用。这些发现表明，神经预测活动和表征变化共同促进规律学习，揭示了一个时间层级结构：神经预测活动先于行为改善，随后出现神经表征变化，可能促进知识逐步巩固为稳定的神经表征。
超越膨胀焦点：视网膜曲率作为朝向估计的功能信号	Zorpala, K. I.	2026-06-08	PDF	旨在解释朝向感知的主流模型假设，人类需要恢复膨胀焦点（FoE），同时考虑眼动引起的旋转。我们提出另一种方案：视觉系统利用注视点产生的平均视网膜旋度作为朝向的替代信号，从而无需显式恢复FoE。静止的受试者观看大屏幕上模拟的行走路径，同时注视投影地面纹理上不同偏心度的点——这种自然行为会诱发持续的视网膜旋度。受试者持续报告在3D场景坐标中感知到的朝向。为分离视网膜旋度的作用，我们采用实时操控技术：保持平移流场恒定，同时分别保持、消除或过度消除中央凹旋度分量。在自然条件（未操控）下，受试者表现出与注视方向相反的系统性朝向偏差。关键的是，当消除预期旋度时这些偏差消失，过度消除时偏差反转，证实视网膜旋度是感知偏差的特异性驱动因素。我们通过简单反馈控制器和具有注视依赖性抑制及“正前方”先验的环形吸引子神经网络建模了这些结果。这些发现表明，大脑利用注视稳定几何结构简化导航，将视网膜旋度视为功能性信号而非需过滤的噪声。
人类腹侧被盖区奖赏处理的电生理相关性	Ramaswamy, A.	2026-06-08	PDF	腹侧被盖区（VTA）是人类前额叶皮质多巴胺能输入的主要来源，被假设在基于奖赏的学习中发挥核心作用。然而，此前一直缺乏人类直接的电生理学证据。本研究利用在慢性丛集性头痛患者（n=13）接受深部脑刺激手术期间进行工具性学习任务时获取的颅内记录，发现VTA局部场电位选择性地编码奖赏结果（相较于损失或中性结果），且与行为学习是否发生无关。在学会偏好高奖赏选项的亚组参与者（n=8）中，VTA对意外奖赏的反应强于对预期奖赏的反应。在两名充分探索两种选项的参与者中，决策过程中VTA活动反映了所选选项的预期价值。这些发现提供了直接的电生理学证据，表明人类VTA编码与动物模型描述的强化学习机制一致的奖赏相关信号。
运动大脑中的空间注意力：神经α振荡与头部旋转的可分离作用	Woestmann, M.	2026-06-08	PDF	大脑是运动身体的一部分。关于神经活动与认知之间关系的大部分见解来自涉及运动受限参与者的研究。在此，我们测试了神经α振荡（约10赫兹）和头部运动在人类参与者（N=33）的听觉空间注意力中的作用。神经注意力过滤表现为脑电图（EEG）中对侧目标区域的α功率降低，而干扰物区域则相反。头部运动的陀螺仪追踪显示，头部会一致地转向侧方目标。侧方干扰物则引发了更多变的运动模式。即使在被要求不要移动的听众中，仍存在系统性的微小运动。头部旋转通过减少目标不确定性提高了任务准确性。逐次试验的神经过滤调节与头部旋转呈正相关，其中神经α调节之后伴随着侧方眼动和头部旋转。空间注意力源于对相关和无关刺激的神经编码，并与支持感官采样的侧方头部旋转同时发生。
差异宏蛋白质组学统计方法的综合评估	Hinzke, T.	2026-06-08	PDF	宏蛋白质组学通过综合运用统计方法分析群落中生物体的蛋白质表达谱，从而表征和比较其分子表型。然而，并非所有统计方法都适用于宏蛋白质组学分析中差异丰度蛋白质组的鉴定。宏蛋白质组学面临的统计挑战包括：数据稀疏性、非正态性、成分性以及样本间高度变异性。这些挑战可通过若干数据处理步骤解决，包括数据插补、归一化、转换以及选择合适的统计检验方法。不同处理方法间的潜在组合形成了复杂的分析选项矩阵，但目前尚不清楚这些组合如何影响宏蛋白质组学数据的统计检验结果。为确定识别宏蛋白质组数据集中差异丰度蛋白质的最佳数据处理方法和统计检验，我们构建了13个已知组成、已知差异且复杂度各异的宏蛋白质组样本。这些定义明确的宏蛋白质组通过模拟宏蛋白质组数据分析中的多种场景，应对了上述普遍挑战。我们比较了超过110种不同的统计分析组合方案，包括基于回归的工具、通用统计推断和机器学习技术。通过建立统计方法测试框架（包含完整的原始质谱数据和可复现的基准测试代码），本研究实现了对宏蛋白质组学统计方法的优化评估。研究发现，limma、edgeR、MaAslin2框架内的多种组合、自定义线性模型、贝叶斯线性模型以及随机森林均能提供合适的评估方案，并提出了宏蛋白质组差异表达分析的关键建议。
靶向细胞质降解I类组蛋白去乙酰化酶对于α疱疹病毒的高效复制至关重要	Ming, S.	2026-06-08	PDF	病毒感染会触发强烈的DNA损伤反应（DDR），重塑宿主染色质景观以促进病毒复制。本研究发现α疱疹病毒利用DDR通路的一种新机制。我们证实单纯疱疹病毒1型（HSV-1）和伪狂犬病病毒（PRV）能诱导I类组蛋白去乙酰化酶（HDAC1/2）的选择性降解，导致组蛋白过度乙酰化并激活后续的DDR反应。值得注意的是，病毒感染促进了HDAC1/2的核输出，随后在细胞质中发生MDM2介导的K63连接多聚泛素化及蛋白酶体降解。通过药物抑制DDR信号通路或HDAC1/2核输出，可显著影响病毒在体外和体内的复制效率。本研究揭示了病毒劫持宿主表观遗传调控以实现高效复制的独特策略，并确定了α疱疹病毒感染的潜在治疗靶点。
评估空间和时间滤波器对BirdNET监测鸟类群落性能的影响	Perez-Granados, C.	2026-06-08	PDF	被动声学监测等自动化技术的最新进展，为在广阔空间尺度上调查鸟类群落提供了强大框架。目前最广泛使用的鸟类声音自动识别人工智能工具是BirdNET，它能识别全球超过6000种鸟类。然而，用户自定义的关键设置（如物种过滤）的影响仍缺乏充分评估。本研究评估了不同物种过滤策略如何影响BirdNET描述全球鸟类群落的表现。我们分析了来自全球72个地点的5047分钟录音，涵盖鸟类学专家鉴定的1192种鸟类。比较了BirdNET工作流中三种常见的物种过滤方法（用于后处理输出结果）：无过滤、空间过滤（某地点全年存在的物种）和时空过滤（某地点某周存在的物种）。无过滤方法最大化BirdNET物种检测率（召回率），但精确度极低（存在大量误判），整体表现较差。相比之下，另外两种过滤策略虽适度降低了召回率，但大幅提升了精确度和整体表现。其中，时空过滤在全球多数数据集和区域中始终表现最佳。在此最优过滤方法下，我们还评估了另一个参数——出现概率阈值的作用。在群落层级分析中，该阈值的中间值（约0.05）使BirdNET表现最大化。我们的结果表明，物种过滤是BirdNET工作流中关键但常被低估的环节。希望这些发现能指导未来研究选择最优物种过滤器，同时强调过滤选择应基于研究目标和数据背景。
HNSW-MS：层级图索引实现存储库规模下精确的实时质谱相似性搜索	Semenov, A.	2026-06-08	PDF	谱相似性搜索是基于质谱的代谢组学的基础，支撑着库匹配、分子网络构建以及MASST等存储库搜索。此前，数据集规模有限，使得穷举成对比较可行，但这一情况已不复存在。GNPS等公共存储库如今包含超过十亿个谱图，而新兴的反向代谢组学范式（将实验谱图置于所有现有公共数据的背景下以推动注释和发现）要求搜索规模达到线性顺序比较不再可行的程度。我们引入了HNSW-MS，该方法原生实现了针对质谱相似性的分层可导航小世界图索引，可直接处理原始GC-MS和LC-MS/MS谱图，无需预处理或嵌入，从而确保最大可重复性。在840万个MS/MS谱图上验证，HNSW-MS相比线性扫描实现了高达560倍的加速，同时保持前1位召回率超过90%，在适中参数设置下可实现完美召回。这种加速消除了存储库规模下的搜索瓶颈，使得针对全部公共代谢组学数据的近实时谱图查询成为可能。

medRxiv

标题	作者	发布日期	PDF链接	摘要
利用结直肠癌筛查证据对具有结直肠癌家族史的人群进行个人风险分层：一项42年队列研究	King, D. W.	2026-06-08	PDF	目的确定是否能够评估因家族史而处于结直肠癌（CRC）高风险人群中的个体患病风险。设计/方法对连续转诊接受结肠镜检查的患者的前瞻性收集数据进行回顾性观察研究。1977年至2018年间，澳大利亚悉尼一家结直肠外科诊所共连续接诊2478名因CRC家族史转诊接受结肠镜检查的患者，其中1963人随访超过10年，成为本文研究对象。组织病理学结果分为正常（N）、非进展期腺瘤（NAA）或进展期肿瘤（AN），其中AN被证实为CRC的前驱病变。干预措施根据2006年之前的当代实践及后续澳大利亚国家健康与医学研究委员会指南进行结肠镜筛查。结果在首个十年内检查结果正常或低风险的患者，自筛查开始后30年内CRC风险持续较低。结论基于前10年监测中的结肠镜结果，可将高相对风险队列中的个体患者分层为CRC高个人风险或低个人风险。前十年未发现AN的患者，其30年内发生AN的风险低于普通人群。这为根据个体风险而非群体风险制定监测计划提供了可能，从而减少多数患者接受多次监测性结肠镜检查的需求，并提高CRC筛查在人群层面的成本效益。
针对本迪布焦埃博拉病毒的跨境防控策略存在局限性。	Middleton, C.	2026-06-08	PDF	刚果民主共和国持续爆发的本迪布焦病毒病（BVD）于2026年5月被认定为国际关注的突发公共卫生事件。为防止跨境输入，美国、加拿大、印度、泰国和肯尼亚等许多国家已提出防控策略，其他国家也可能效仿。筛查和隔离防控措施的效果如何？我们利用成熟的流行病学理论，建立了针对BVD的旅行者筛查和抵达后隔离的数学模型来回答这一问题。研究发现，通过症状筛查或分子检测进行的旅行者筛查将漏掉大多数受感染的旅行者，应辅以足够时长的抵达后隔离和监测，以发现潜伏期较长的病例。我们的研究结果凸显了边境筛查的局限性，以及抵达后隔离等补充措施对防止BVD本地输入的重要性。
提升患者视角：非美国出生者护理导航对潜伏性结核感染筛查及治疗依从性的定性评估	Ramzy, L. M.	2026-06-08	PDF	目的：本研究旨在探讨非美国出生者在初级保健机构中接受潜伏性结核感染（LTBI）诊断与治疗过程中遇到的障碍与促进因素，包括文化与语言匹配的护理导航的影响。设计：对25名非美国出生患者进行访谈，并对31名初级保健团队成员及管理层开展焦点小组与问卷调查。场景：研究在联邦合格健康中心（FQHC）诊所网络内进行。参与者：参与者为患有LTBI的成年非美国出生患者及FQHC护理团队成员。通过目的性抽样选取随机参与者的子样本进行访谈。干预：护理导航员对结核感染检测阳性后随机分配接受护理导航的参与者进行跟踪，提供健康导航及结核筛查与治疗重要性的教育。方法：数据收集后，以批判性意识形态范式为指导进行主题分析。结果：文化与语言匹配的导航在减少障碍、建立信任及改善治疗连续性方面具有核心作用。未获得导航支持的参与者报告了困惑与护理脱节，而拥有文化匹配导航员的参与者则描述了清晰与舒适感，整体受内在动机、关系支持及文化塑造的护理信念影响。结论：尽可能提供包含文化与语言匹配导航员的护理导航，可能有助于提高非美国出生人群的LTBI治疗完成率。研究局限性包括文化规范、权力动态及选择偏倚的潜在影响。
在范德比尔特生物银行（BioVU）和百万退伍军人计划中，白蛋白尿变化作为载脂蛋白L1介导的肾脏疾病的替代终点	Mamak, F.	2026-06-08	PDF	重要性：近年来，蛋白尿已被接受为局灶节段性肾小球硬化症（FSGS）和IgA肾病的临床试验替代终点。然而，蛋白尿在载脂蛋白L1（APOL1）介导的肾脏疾病（AMKD）中尚未得到评估。方法：对128名非洲裔APOL1高风险基因型、无糖尿病的患者进行真实世界数据分析，这些患者来自百万退伍军人计划（MVP；n=109）或范德比尔特大学生物样本库（BioVU；n=19），其尿白蛋白-肌酐比值（UACR）≥420 mg/g（PCR~0.9 g/g）且同时有GFR值。主要预测指标是12个月时log-UACR的变化。主要结局是24个月内年化GFR斜率。次要结局包括肾脏复合终点（持续30% GFR下降、终末期肾病（ESKD）或死亡）以及ESKD作为单一结局。采用线性回归和Cox比例风险模型评估UACR变化与结局的关系。结果：合并分析中，平均年龄为56.8（标准差15.5）岁，116名为男性（90.6%），3名患者基线时诊断为FSGS。基线平均eGFR为46.8（标准差16.1）mL/min/1.73m²，基线平均UACR为1240.8（1107.7）mg/g，平均eGFR斜率为-4.67[-6.00, -3.33] mL/min/1.73m²/年，12个月时UACR的几何平均百分比变化为-57.5%[-65.0%, -48.4%]。合并分析中，12个月时log（UACR）每增加1个单位，年化eGFR斜率下降-1.80[-2.56, -1.03] mL/min/1.73m²。Cox回归显示，12个月时log（UACR）每增加1个单位，肾脏复合终点风险增加61%（p=0.002），ESKD风险增加98%（p<0.001）。估计12个月时UACR降低50%与肾脏复合终点风险降低28%（校正风险比[aHR]=0.72；95%置信区间[CI]：0.59-0.88；p=0.002）以及ESKD风险降低38%（aHR=0.62；95% CI：0.49-0.80；p<0.001）相关。结论与意义：12个月时UACR的变化显著改变24个月内GFR下降速率及临床有意义终点，支持将UACR变化作为AMKD的替代终点。
采用多模态方法识别肌痛性脑脊髓炎/慢性疲劳综合征中的神经心理生理亚组及其对康复的意义：一项机制性横断面与纵向研究方案	Dooms, Y.	2026-06-08	PDF	引言：肌痛性脑脊髓炎（ME）/慢性疲劳综合征（CFS）是一种以严重疲劳和劳累后不适（PEM）为特征的衰弱性疾病。已报道的神经心理生理学异常提示ME/CFS具有多因素致病机制，但当前认知仍较为零散。本研究方案概述了一项多模态研究设计，旨在（1）比较ME/CFS患者与健康受试者的神经心理生理机制，（2）检验ME/CFS的整合模型，（3）识别患者群体中的神经心理生理亚组，以及（4）确定康复过程中症状反应的预测因子。方法与分析：本研究将纳入115名ME/CFS患者和55名健康受试者。两组在年龄、性别和教育水平上具有可比性，较大的患者样本量可支持亚组分析和纵向分析。两组将在基线期进行横断面评估。随后患者将在标准化认知行为疗法康复项目（作为常规护理实施）中接受纵向评估。基线测量指标包括：全身炎症及一般健康生物标志物、自主神经和中枢神经系统功能指标、神经炎症指标（磁共振波谱、亚组样本的[18F]DPA714 PET）、血清短链脂肪酸水平、肠道微生物组组成与功能，以及心理社会应激的神经内分泌和自我报告反应。疲劳严重程度（躯体性和认知性）及PEM将通过验证问卷、生态瞬时评估和实验室任务进行评估。这些指标将在治疗期间重新评估，所有非神经影像学测量将在康复项目结束后重复进行。统计分析将包括多变量方差分析、一般线性模型、分类算法、结构方程模型、最小绝对收缩选择算子主成分回归（LASSO-PCR）、聚类分析和潜类别增长分析（LCGA）。
2019-20年印度手术绝育接受率中的性别差异估算及实现公平的成本节约	Mande, S. u.	2026-06-08	PDF	背景：定性研究指出，印度的计划生育负担不成比例地落在女性身上。我们的主要目标是量化手术绝育实施中的性别差异。次要目标是计算印度输卵管结扎术和输精管结扎术的成本，并估算提高输精管结扎率所能节省的费用。方法：我们利用2019-20年度健康管理信息系统（HMIS）的数据，对输卵管结扎术和输精管结扎术的总实施例数、术后失败率及术后死亡率进行了回顾性分析。计算了每万名育龄男性（15-49岁）的输精管结扎手术率和每万名育龄女性的输卵管结扎手术率，并以女性与男性的手术率比值作为性别差异的代理指标。从政府数据和研究报告中提取并汇总了各州的特定手术费用、失败补偿及术后死亡赔偿。为估算提高输精管结扎率的财务效益，计算了将输精管结扎率提升至总绝育率50%的成本。所有费用已按2022年通胀调整，并以美元（USD）呈现。结果：2019-20年度，全国输卵管结扎率为96.5，输精管结扎率为1.4，女性与男性手术率比值为67.5。每例输卵管结扎手术费用是输精管结扎的3.5倍（89.1美元对比25.3美元）。在保持总手术率不变的情况下，将输精管结扎率提升至至少占总手术量50%（替代多余的输卵管结扎术）可净节省62,193,487至75,355,777美元。解释：我们的全印度分析证实，手术绝育方法的使用在女性中不成比例地偏高。提高输精管结扎率具有财务效益，并能改善性别公平。资助：无。
多病原体废水监测助力2025年非洲国家锦标赛足球赛期间实时精准公共卫生干预。	Nsawotebba, A.	2026-06-08	PDF	大规模集会通过促进传染病传播，对公共卫生构成重大风险。虽然基于废水的监测（WBS）已在高收入环境中广泛用于监测病原体，但在中低收入国家的大规模集会中，其作为实用的多病原体监测工具的应用仍然有限。本研究旨在评估在乌干达非洲国家锦标赛（CHAN）足球赛事期间，多病原体WBS的操作可行性、流行病学意义和公共卫生效用。2025年8月，在曼德拉国家体育场八个比赛日期间开展了废水监测。在体育场不同厕所设施排放废水的38个检修孔部署了Moore拭子，以采集代表性废水样本。使用Nanotrap(R)微生物组病毒颗粒浓缩病原体，随后进行核酸提取。通过定量PCR（qPCR）分析样本中包括猴痘在内的多种肠道和呼吸道病原体。进行描述性分析以表征病原体检测模式、阳性率和监测点的时间分布。共采集并分析了304份废水样本，其中259份（85.2%）至少检测出一种病原体阳性。多个病原体在采样日持续检出，以肠道病原体为主，特别是志贺氏菌属（53.6%）、轮状病毒A（35.9%）和肠道病毒（32.2%）。猴痘病毒也在多个采样日的相当比例样本（28.6%）中被检出。呼吸道病原体，包括SARS-CoV-2（11.8%）和乙型流感病毒（8.2%），以较低频率间歇性检出。病原体多样性随时间变化，单日最多检出八种病原体，且大多数阳性样本中观察到多种病原体共检出。Cq值分布进一步显示了不同病原体检测信号模式的变异性。监测结果为实时公共卫生干预提供了依据，包括加强卫生设施、强化卫生宣传、环境消毒和针对性风险沟通，加强现场分诊的症状监测，以及对食品处理和废水基础设施进行针对性环境卫生评估。这些发现证明了将多病原体废水监测整合到资源匮乏环境中的大规模集会准备和响应框架的操作可行性和公共卫生效用。通过在CHAN足球赛事期间捕获多样化的病原体信号并为针对性干预提供信息，WBS可以提供可操作的人群层面见解，支持疫情准备和响应。将WBS纳入国家准备系统可以加强疫情情报、增强早期预警能力，并在未来大规模集会和新兴传染病威胁期间支持数据驱动的公共卫生决策。
以液体活检为中心、泛癌种、开放式的下一代测序组合，用于支持临床决策（LION组合）	Feierabend, S.	2026-06-08	PDF	癌症治疗已转向基于分子分型的个体化治疗，尤其在晚期疾病中。现有循环肿瘤DNA检测组合通常范围广泛，会产生大量非可操作变异，且成本高昂，限制了其在分子肿瘤委员会中的常规应用。我们开发并验证了一种不依赖制造商的、以109基因液体活检为核心的泛癌开放新一代测序组合（LION组合），结合内部生物信息学流程以支持临床决策。共分析了87份样本，包括17份参考样本、21份健康献血者对照样本以及49份涵盖9种肿瘤类型的患者样本。LION组合在参考样本中实现了92%的敏感性和99%的特异性，与数字液滴PCR高度一致（r=0.99）。其可检测低至0.05%（肿瘤知情）和0.5%（肿瘤不知情）的变异等位基因频率。与基于血液的数字液滴PCR临床一致性达82%，与全外显子组织测序一致性达75%。在代表性病例中，变异动态与疾病进展相关，并揭示了额外可靶向变异。总体而言，LION组合通过识别可靶向变异、疾病监测及检测治疗耐药性（尤其在肿瘤组织不可获取时）支持临床决策。
用于个性化阿片类药物治疗的分层临床融合Transformer模型：在糖尿病手术患者中的开发与验证	Naderalvojoud, B.	2026-06-08	PDF	背景机器学习（ML）模型越来越多地被用于预测术后不良结局。然而，大多数模型依赖静态患者特征（如年龄、合并症），忽略了临床医生在治疗决策中可以主动调整的环节。出院阿片类药物处方是一个关键的可调整、由临床医生控制的决策，但在预测模型中，如何针对多种不良结局优化处方选择仍未被充分探索。本研究通过引入一种新颖的ML框架来填补这一空白，该框架明确区分固定的患者风险因素与可调整的处方选项，以支持个性化、基于风险的阿片类药物处方决策。方法我们开发了层级临床融合变换器（HCF-Transformer），这是一种ML模型，旨在估计患者针对四种术后结局的特定风险：长期阿片类药物使用（POU）、慢性疼痛（CP）、30天再入院以及阿片类药物相关结局（OAO）。该模型从固定的、不可调整的基线因素构建患者风险画像，随后通过一个变换器层进行处理。临床医生可控的出院阿片类药物方案被建模为替代干预候选方案，并通过临床融合机制与固定风险表示相结合，从而基于预测风险进行评估和排序。一个总相对风险（TRR）指标，根据每个结局的预测阈值进行校准，指导推荐过程。我们在糖尿病手术患者（一种常见的高风险人群）中评估了该模型。结果研究纳入了157,853名独特的糖尿病手术患者，结局发生率从47.2%（POU）到1.8%（OAO）不等。HCF-Transformer取得了最高的AUROC值：POU为0.798，30天再入院为0.712，CP为0.808，OAO为0.922，优于随机森林、FT-Transformer和基于ResNet的模型。与这些基线模型相比，HCF-Transformer生成了更稳定且更具区分度的风险估计，并在不同出院阿片类药物选项之间显示出显著的TRR评分差异（ANOVA p < .01，eta-squared > .01）。这使得能够一致地识别出针对患者特定画像的低风险方案。结论 HCF-Transformer引入了一种新颖的层级融合方法，通过整合静态患者风险画像与可调整的出院选项来优化阿片类药物处方。利用基于变换器的建模和可量化的TRR指标，该模型提供了个性化、基于风险的推荐。这种方法实现了针对个体风险的数据驱动型阿片类药物处方，并有可能改善高风险人群的术后结局。我们的研究结果表明，通过基于变换器的融合架构将可调整因素与结构化风险画像相结合，可以增强决策支持系统，为医疗领域更具可操作性和个性化的AI铺平道路。
阿根廷向脆弱人群提供基本药物的政策：REMEDIAR项目案例研究	Havela, M.	2026-06-08	PDF	基本药物是财务保障和健康公平的基石之一。REMEDIAR计划是阿根廷卫生部的一项倡议，旨在确保无保险人群在初级卫生保健中心就诊时能够免费获得基本药物。本研究分析了该计划在二十年（2002年至2024年）间的融资、采购和分配情况，评估了其应对经济和政治挑战的能力，从而在医疗服务下放至各省的联邦制国家中，确保护初级卫生保健层面的基本药物供应不间断。我们采用混合方法，考察了国际优惠贷款与国内财政资金之间的双重性。研究结果显示，国际融资提高了可预测性和效率，将采购周期从458天缩短至235天，但也通过外部条件限制了国内规划。相反，国家集中采购实现了更高的价格效率和更低的价格离散度，但在适应地方需求方面存在僵化。地域分配分析证实，REMEDIAR减少了无正式保险的弱势家庭获取药物的障碍。然而，该计划进入了稳定阶段，未能与地方政策建立稳固的协调机制，陷入了自身运作逻辑的固化。研究结论指出，计划的有效性不仅取决于资源规模，更取决于管理质量。为确保长期可持续性，向国家融资过渡需要进行深刻的制度重构。这必须将运营能力与联邦协调及国内法规相结合，确保初级卫生保健供应链能够抵御宏观经济波动和政治变化，并与地方战略保持一致。