2026-06-11 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
重路由而非移除：面向视觉语言模型的可恢复视觉令牌路由	Cheng-Yu Yang	2026-06-10	PDF	视觉语言模型（VLMs）将图像投影为数百至数千个视觉令牌，导致解码器在注意力计算和KV缓存内存方面成本高昂。现有的视觉令牌缩减方法大多遵循排序-移除范式：对视觉令牌评分，保留紧凑子集，并永久丢弃其余部分。我们证明这种不可逆操作存在脆弱性，因为视觉令牌的重要性会随解码器深度变化；在某一阶段评分较低的令牌可能在后续层中变得相关，尤其是对于需要精确定位的查询。我们提出Reroute，一种无需训练的即插即用方法，用可恢复路由替代永久移除。在每个路由阶段，选中的视觉令牌通过解码器模块，而延迟令牌则跳过该阶段，在下一个路由决策时重新进入候选池。Reroute复用现有的注意力评分排序规则和阶段调度策略，保留了其所增强的剪枝方法的理论TFLOPs和KV缓存预算类别。在基于LLaVA-1.5和Qwen骨干网络的FastV、PDrop及Nüwa变体上，Reroute在激进令牌缩减下提升了定位能力，同时保持通用VQA性能。这些结果表明，VLM令牌缩减不应仅被视为不可逆剪枝，而应视为可恢复路由。代码见：https://github.com/elmma/mllm-reroute/
上下文驱动的增量压缩用于多轮对话生成	Yeongseo Jung	2026-06-10	PDF	现代对话代理在每一轮对话中都会依赖不断增长的对话历史，导致冗余的注意力机制和编码成本随对话长度增加而上升。简单的截断或摘要会降低保真度，而现有的上下文压缩器缺乏跨轮次记忆共享或修正机制，导致信息丢失并在长对话中加剧错误累积。我们重新审视了对话动态下的上下文压缩问题，并通过实验揭示了其脆弱性。为提升效率与鲁棒性，我们提出上下文驱动的增量压缩方法（C-DIC），将对话视为交织的上下文线程，并在单一紧凑的对话记忆中存储每个线程可修正的压缩状态。在每一轮对话中，轻量级的检索、修正与回写循环实现跨轮次信息共享并更新过时记忆，从而稳定长程行为。此外，我们将截断式反向传播（TBPTT）适配至多轮场景，无需完整历史反向传播即可学习跨轮次依赖关系。在长对话基准上的大量实验表明，C-DIC在性能与效率上均表现优异；值得注意的是，C-DIC在数百轮对话中保持稳定的推理延迟与困惑度，为高质量对话建模提供了可扩展路径。
看似微不足道的设计选择如何决定病理学中大语言模型的性能	Kian R. Weihrauch	2026-06-10	PDF	通用大语言模型（LLM）在评估全切片病理图像（WSI）专用模型时，常被用作基线。由于WSI超出当前模型上下文限制，LLM基线通常采用独立处理的小尺寸高倍率图像块，通过多数投票法整合结果，而未系统评估图像块尺寸、数量及放大倍率等看似无关的设计选择。通用型LLM始终表现逊于专用系统，这强化了"处理WSI病理任务需领域特化训练或架构适配"的认知。本研究对四项输入设计因素（推理模式、图像块尺寸、放大倍率、图像块数量）进行系统析因分析。结果表明，既往研究因采用非优化输入配置，夸大了专用模型与通用LLM的性能差距。在MultiPathQA基准测试中，切换至单一平衡配置（低倍率大图像块联合处理）使GPT-5在癌症类型分类（TCGA）上从15.1%提升至39.5%，器官分类（GTEx）从38.1%提升至62.9%。任务级优化进一步将TCGA和GTEx性能分别提升至43.9%和71.6%。该配置可泛化至另外两种模型及完全保留的CPTAC队列，使Gemini 3 Flash在无需任务调优的情况下提升23.4个百分点。
事实2：学习商用机器人手臂的外部力感知可提升策略学习效果	Steven Oh	2026-06-10	PDF	接触丰富的操作需要力敏感性，但许多机器人手臂因成本高昂而缺乏专用力传感器。我们提出神经外力矩估计（NEXT），这是一种无需专用力传感器即可估计外部关节力矩的数据驱动方法。NEXT仅需1分钟训练，基于10分钟自由运动数据，即可达到与专用关节力矩传感器相当的估计精度。NEXT使低成本机械臂具备力反馈遥操作能力，并通过力信息重采样训练（FIRST）改进策略学习——在行为克隆过程中对预接触和接触片段进行过采样。在五项长时程任务中，FIRST的任务进度比先前的力感知策略提升超过17%。NEXT与FIRST共同为现成机器人带来力感知遥操作与策略学习能力，无需额外传感硬件。视频结果与代码见 https://jasonjzliu.com/factr2
世界飞行员：利用世界-动作先验引导视觉-语言-动作模型	Zefu Lin	2026-06-10	PDF	视觉-语言-动作（VLA）模型通过大规模预训练继承了语义基础，并在分布内的操作任务中表现出色。然而，这种语义基础建立在静态图像-文本对之上，而操作是一个连续的、富含接触的过程，其动态特性无法通过此类预训练捕捉。我们提出World Pilot，一种VLA框架，通过世界-动作模型（WAM）的先验知识增强策略，并通过两条互补路径将其引入决策链。潜在引导（Latent Steering）利用场景演化潜在变量对感知层进行条件化，动作引导（Action Steering）则提供预期轨迹作为动作生成器的运动先验。这两个先验共同赋予VLA对场景的预期视角、轨迹级运动提示以及语义条件化，即使由未经动作后训练的视频预训练世界模型提供，场景演化先验依然有效。World Pilot在LIBERO-Plus零样本OOD基准测试中达到84.7%的最优总成功率，并在四个操作任务的每个真实机器人设置中均取得最高成功率，在视角、几何、变形状态和位姿变化下优势最为显著。项目网站：https://world-pilot.github.io/
DIRECT：具身规划器中何时何地分配测试时计算？	Jadelynn Dao	2026-06-10	PDF	视觉-语言模型（VLMs）正越来越多地被部署为具身智能体的高层规划器，一种新兴策略是通过扩展测试时计算来提升能力。然而，我们观察到这种做法会增加延迟、token使用量和FLOPs，同时在下游任务中带来不均匀且往往递减的收益，限制了具身智能体的部署场景。我们认为，选择何时何地投入测试时计算是将前沿性能引入现实世界的关键。我们提出DIRECT，一种利用多模态场景上下文为每个提示分配计算资源的路由框架，在成功-成本帕累托前沿上优于固定模型选择。在链式思维深度、模型规模和记忆历史这三个主要扩展维度上，我们在VLABench和RoboMME上的实验表明，测试时计算并非均匀的杠杆：不同维度会产生性质不同的能力增益。我们在DROID设置中的物理Franka机械臂上验证了这些见解，涵盖零样本操作和长程链式任务，我们的路由器的成功率与更强模型相当或更优，同时平均延迟降低高达65%。最终，我们的结果表明，简单扩展测试时计算是浪费的，而DIRECT能够以极低的成本在机器人系统中实现前沿级别的具身规划。项目页面见jadee-dao.github.io/direct/。
Doc-to-Atom：学习编译与组合记忆原子	Xingjian Diao	2026-06-10	PDF	长输入序列对于大型语言模型中的文档理解和多步推理至关重要，但注意力机制的二次方复杂度使得推理过程既消耗内存又速度缓慢。上下文蒸馏通过将上下文信息压缩到模型参数中来缓解这一问题，而Doc-to-LoRA等近期工作将上下文蒸馏摊销为单次前向传播，为每个文档生成一个LoRA适配器。然而，为所有查询生成单一整体适配器会导致无关查询干扰、组合回忆能力受限以及长文档推理的可扩展性差。为解决这些挑战，我们提出Doc-to-Atom（Doc2Atom），一种组合式参数化记忆框架，将每个文档分解为语义类型化的知识原子。每个原子被编译为独立的微LoRA适配器和溯源检索键。在推理时，轻量级查询路由器选择并仅组装相关原子形成查询特定适配器，随后注入冻结的基础模型。整个系统通过多目标蒸馏框架进行端到端训练。在六个多样化问答基准上的实验表明，Doc2Atom在降低文档内化内存成本的同时，性能优于Doc-to-LoRA基线。
使用流形幂迭代重新设计混合专家路由器	Songhao Wu	2026-06-10	PDF	路由器是混合专家模型中的核心组件。作为专家代理，路由器矩阵的行向量计算其与MoE输入的相似度，以确定激活哪些专家子集。理想情况下，每个路由器行向量被设计为将专家矩阵编码为代表性向量，使其与令牌的点积能更好反映令牌-专家亲和度。然而，目前尚无设计原则来强制实现这种压缩。本文提出将每个路由器行向量与对应专家的主奇异方向对齐，因为该方向提供了矩阵最具表现力的数学描述。基于这一原则，我们提出采用流形幂迭代（MPI）的路由器重设计方法。具体而言，该方法引入"幂迭代-收缩"范式：先对路由器权重执行幂迭代步骤，再通过收缩施加范数约束以确保效率与稳定性。理论上，我们证明MPI驱动路由器行向量收敛至对应专家的主奇异方向。实验方面，我们预训练了从1B到11B参数规模的MoE模型，证实这种对齐能促进更有效的MoE模型。
VLGA：面向自动驾驶的视觉-语言-几何-动作模型	Jin Yao	2026-06-10	PDF	视觉-语言-动作（VLA）模型能够描述场景并用语言进行推理，但在将动作锚定于周围密集的三维世界时仍面临困难。现有方法要么从冻结的三维基础模型中注入特征，却缺乏确保策略使用这些特征的目标函数；要么通过稀疏的边界框和地图损失约束几何结构，无法提供密集的空间信号。我们提出VLGA，这是首个通过监督学习重建其驾驶场景中密集三维世界的视觉-语言-动作模型。VLGA将几何作为第四模态引入，与视觉、语言和动作并列，通过专用专家模块实现，该模块利用逐像素点图回归损失（以LiDAR为基准）进行监督。在nuScenes（开环评估）和Bench2Drive（闭环评估）数据集上的大量实验表明，VLGA优于同类VLA方法。具体而言，在开环nuScenes中，VLGA在无自车状态输入的VLA方法中达到新最优水平，L2误差最低（平均0.50米），3秒碰撞率最低（0.18%）。在闭环Bench2Drive中，VLGA以79.08的驾驶得分达到最优性能，较最强先前VLA方法提升0.71分，且效率与舒适性相当。
CCL25-Eval任务5系统报告：新数据集与LoRA微调Qwen2.5	Haotao Xie	2026-06-10	PDF	近期，大语言模型在古诗文翻译与古典诗歌生成领域取得了显著进展。然而，针对古典诗歌精准翻译与情感语义理解的专项研究仍较为有限。主要挑战在于：多数研究将诗歌鉴赏任务视为通用领域问题，忽视了诗歌鉴赏的独特特征，同时高质量领域专用数据集极度匮乏。为解决这一局限，我们将任务分解为三个子任务：术语解释、语义解释与情感推断。基于多个开源数据集，我们进行数据清洗与对齐，构建了古典诗歌指令对数据集（CCPoetry-49K），包含49,404条针对该领域优化的高质量指令-响应对。随后，我们通过低秩适配技术对Qwen2.5-14B模型进行微调，提出了领域专用大语言模型PoetryQwen。在CCL25-Eval任务5基准测试上的实验结果表明，PoetryQwen取得了0.757的评分，较Qwen2.5-14B-Instruct基线（0.690）提升了9.7%。这些发现明确表明，PoetryQwen在古典诗歌的精准翻译与情感理解方面显著提升了性能。我们提供了新的数据集与方法论思考，旨在支持大语言模型的领域专用优化。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
微生物组组成在环境梯度上的系统发育一致性	Chakraverti-Wuerthwein, M. S.	2026-06-11	PDF	跨生物群落的微生物群落全球调查显示，深度和pH值等环境变量是群落组成的关键决定因素。然而，我们尚不清楚单个分类群的性状及其进化保守性如何共同作用形成这些模式。利用表层土壤和海洋微生物组的大规模调查数据，我们采用典型相关分析（CCA）同时推断环境变化方向及相关的组成变化。研究发现，捕捉主导环境梯度的第一典型方向表现出强烈的系统发育信号：沿此方向对环境变化的物种响应，在具有共同进化历史的分类群中具有相似性。相比之下，次要典型方向显示微弱或缺失的系统发育结构。这些结果共同揭示了微生物群落组装的两种尺度视角：深度进化保守的性状主导了沿主要环境驱动因素的群落重组，而其他环境驱动的群落组成变化则反映了进化上更易变的性状。
从繁茂到生存：光波长调节管状绿藻Derbesia的光适应反应	Hossen, R.	2026-06-11	PDF	藻类需要特定的适应策略来应对浅海栖息地光谱变化。我们通过10天周期的光生物学和转录组学采样，研究了管状绿藻德氏藻在白光、蓝光、绿光、红光和远红光下的光合与代谢过程变化。结果显示两种截然不同的光适应策略：蓝光和绿光促进与生长相关的代谢活动，而远红光和红光则诱导类似弱光的生存策略，表现为生长减缓及核心代谢抑制。所有光照条件下的光合适应主要发生在光依赖反应阶段。蓝光和绿光促进早期适应，表现为光捕获复合体与关键转录调控因子MYB的即时激活，并通过持续激活ATP酶、ATP转运蛋白及激素信号组分实现更优适应。蓝光在长期暴露过渡期引发独特的转录转变，包括增强的环式电子传递、蛋白质合成关键调控因子、DNA复制及转录调控机制。相比之下，远红光（及程度较轻的红光）触发类似弱光适应的响应，表现为能量利用效率低下、天线系统扩大、叶绿体增殖聚集及生长速率降低。研究表明核心光色素积累与叶绿素a/b比值下降是远红光的适应响应，而白光下持续激活的核心代谢过程可能反映了德氏藻对以广谱光为主的浅海沿岸环境的进化适应。此外，本研究新测序的德氏藻株系基因组草图可作为未来羽藻目藻类分子光生物学研究的基因组资源。
亲代抚育是一种遗传电容器	Parey, E.	2026-06-11	PDF	亲代抚育在动物界普遍存在，对后代发育至关重要。然而，其更广泛的遗传与进化影响仍待深入探究。本研究以双亲抚育型埋葬甲虫Nicrophorus vespilloides为模型，揭示亲代抚育作为遗传电容器的作用机制：在抚育存在时允许遗传变异积累，在抚育中断时释放变异。通过实验调控抚育行为，我们证实亲代抚育抑制了与后代体型相关的遗传变异，而失去抚育后这些变异得以释放。为探究分子机制，我们构建了N. vespilloides染色体级别基因组组装，并建立了有/无亲代抚育条件下幼虫的单核基因表达图谱与表观基因组数据集。研究发现，亲代抚育缺失会诱发分子应激反应，破坏已知分子电容器蛋白Hsp83及其他潜在mRNA伴侣的表达。此外，结果表明亲代抚育通过维持开放可响应的染色质景观与冗余基因调控网络来缓冲发育过程。本研究揭示了亲代抚育如何塑造遗传变异的储存、表达与释放，对适应与进化具有广泛意义。
不同代谢应激模型对人源神经元网络的独特影响	Collo, L.	2026-06-11	PDF	不同的体外模型被广泛用作实验平台，用于评估神经元对代谢应激的反应，并测试缺血性卒中患者的潜在治疗方法。这些研究的结果取决于所使用的应激模型，而基于细胞活力的读数与电生理活动之间的联系仍鲜有探索。我们研究了由人诱导多能干细胞（hiPSCs）生成的人源神经元网络在三种常用代谢应激模型下的神经元网络活动：单独缺氧、氧糖剥夺（OGD）以及缺氧联合不同浓度谷氨酸。我们旨在阐明三种常用体外模型之间的差异，包括微观与电生理读数之间的关系。这些条件对神经元网络活动产生了不同的影响。单独缺氧导致活动随时间逐渐下降。相比之下，OGD引发了双相反应，其特征是活动先增加后下降。缺氧条件下高浓度谷氨酸暴露也改变了网络动态，诱导了三相模式，包括活动快速下降、短暂增加和随后下降。在所有病理条件下，神经元活动逐渐下降，并在长时间缺氧后趋向网络衰竭。再氧合后，恢复有限且依赖于条件：单独缺氧、OGD和高谷氨酸条件下的恢复有限。另一方面，低浓度谷氨酸与良好恢复相关。微观评估显示，不同条件下的细胞活力受到不同影响。OGD与最高水平的细胞死亡相关，而谷氨酸暴露，特别是高浓度，导致突触点显著减少，尽管细胞活力部分保留。这些发现表明，常用的体外缺血模型诱导了不同的神经元反应，并强调了整合电生理和结构分析以更好地表征人神经元网络中代谢应激的重要性。
高通量发现精氨酸缺失肽段，实现杜氏肌营养不良症的有效反义递送	Farquhar, C. E.	2026-06-11	PDF	磷酰二胺吗啉代寡核苷酸（PMOs）是获批用于杜氏肌营养不良症（DMD）的外显子跳跃反义疗法，但其临床效用受限于肌肉组织摄取能力差，需频繁高剂量给药。细胞穿透肽（CPPs）可增强PMOs的胞内递送，但传统富含精氨酸的CPPs常导致剂量限制性毒性（包括肾损伤），阻碍其临床转化。为应对这一挑战，我们开发了基于电荷的高通量色谱富集平台，可筛选超过15,000种合成肽（含非经典/非生物氨基酸序列）。该方法实现了新型低精氨酸CPPs的从头发现，其递送特性显著改善。四个先导候选物展现出高效的核内PMO递送能力，体外毒性较穿透素等标准CPPs降低约10倍。最优肽CXP1在细胞和动物模型中均表现出强效剪接转换活性与良好耐受性。在营养不良mdx小鼠中，CXP1-PMO偶联物在等效剂量下实现的外显子跳跃效果优于R6G偶联PMO。CXP1-PMO组织水平与外显子跳跃效率呈正相关，建立了明确的药代动力学-药效学关系。这些发现揭示了兼具机制创新性与转化潜力的发现策略，证明高通量平台可为DMD及相关神经肌肉疾病的反义疗法开发更高效的CPP递送载体。
基于虚拟对抗学习的稳健半监督单细胞RNA测序数据整合	He, C.	2026-06-11	PDF	仅依赖转录组数据的单细胞RNA测序整合方法，往往难以保留密切相关的细胞亚型之间的细微差异。这导致原始数据中可分离的细胞群在整合后可能出现过度混合，降低生物学分辨率和可解释性。整合标记基因信息有望解决这些问题，但现有标记集的变异性和复杂性限制了其有效应用。为此，我们提出scCRAFT+，一种通过虚拟对抗训练（VAT）创新性整合标记基因信息的半监督整合模型。通过联合优化标记驱动的监督信号和全转录组表征，VAT强制转录相似细胞间的局部预测平滑性，在提升整合质量和细胞类型自动注释的同时，增强了对噪声标记注释的鲁棒性。这种定向方法显著提升了注释准确性和鲁棒性，尤其在面对不完整或错误的标记基因集时表现突出。基准测试表明，scCRAFT+在整合质量和具有生物学意义的亚细胞类型自动注释方面，始终优于当前无监督和监督整合方法。
基于序列的治疗性肽分类与增强负采样	Ellerbrock, R.	2026-06-11	PDF	治疗性肽具有高靶点特异性、低毒性以及调控蛋白质-蛋白质相互作用的能力，然而其实验功能表征仍成本高昂且速度缓慢。直接从序列计算预测治疗功能可加速肽筛选并支持生成式设计流程，但需要可靠区分治疗性与非治疗性肽。现有多标签预测器覆盖功能较少、依赖有限数据集且假阳性率较高，限制了实际应用价值。我们提出一种轻量级CNN分类器，基于迄今最全面的治疗性肽数据库（54,655条肽，48个功能类别）进行训练。核心贡献在于采用基于马尔可夫模型的统计驱动负采样策略，生成多难度等级的多样化合成诱饵。在该受控诱饵基准测试中，我们的方法将假阳性率从先前模型的60%以上降至2.1%。经微调的五模型集成在仅需氨基酸序列输入条件下，实现了78.9%的Micro F1和54.6%的Macro F1。通过稀疏L1约束模型变体分析表明，卷积滤波器可捕获保守功能基序及统计上不可能出现的非治疗性模式，下游层整合这些信号，为网络学习生物学有意义结构提供了机制性证据。在TPpred-LE基准的泛化任务中，我们的模型达到55.3% Micro F1和38.6% Macro F1，与基于原生数据集训练的TPpred-LE（57.9%/38.1%）性能相当，同时预测的治疗功能数量是其四倍，参数量仅为四分之一。代码与模型将在https://github.com/terra-quantum-public/tq-therapep-ai公开。
FluoVolt染色在活细胞电压成像中诱导光损伤	Akyuz, E. M.	2026-06-11	PDF	荧光电压敏感染料（VSDs）能够对活细胞膜电位进行非侵入式、高通量的光学测量，但此类测量的分析可靠性关键取决于染料及相关成像条件是否干扰研究对象。本研究系统表征了广泛使用的VSD染料FluoVolt在癌细胞系（GIN31胶质母细胞瘤和SK-MEL-30黑色素瘤）及原代人巨噬细胞中的光物理性能与细胞扰动效应。光漂白动力学呈现强细胞类型依赖性：在标准宽场条件下，SK-MEL-30细胞在400秒内完全丧失荧光信号。FluoVolt染色联合激光激发导致细胞脱落率较未染色对照组增加约2.5倍，双波长激发（488+405 nm）使GIN31细胞活力降低约17.5%。关键发现是，在未进行任何激光照射的单纯染色条件下，即可检测到细胞形态从细长型向阿米巴样表型的转变，表明存在独立于光毒性的基线染料诱导扰动。将染料浓度和负载时间减半后，这些效应显著减弱，同时仍能保持可测量的荧光信号。这些发现揭示了FluoVolt染色与激发是此前未被表征的系统性测量伪影来源，并为光学膜电位成像中的方案设计、对照选择和数据分析提供了实用且可操作的指导。
漂变驱动了岛屿快速辐射中的表型演化	McCullough, J.	2026-06-11	PDF	理解表型多样性产生的过程，是解释新物种如何形成的核心。进化理论预测，信号特征（如羽毛颜色）的快速进化可能促进物种形成，但实证支持并不一致。这类特征的表型分化在物种形成过程中预期会发生，但这些微进化动态很少在宏观进化尺度上被检验，或与潜在种群人口统计学相关联。在此，我们利用一个标志性岛屿鸟类辐射的完整分类群采样——该辐射曾帮助塑造了异域物种形成的早期理论。我们将全基因组数据与全身羽毛颜色的全面精细尺度数据集相结合，直接检验信号特征进化是否与谱系多样化共变，并厘清选择和漂变的作用。我们发现，颜色进化速率更快的谱系多样化速度也更快。引人注目的是，随着基因组多样性下降，颜色进化速率加快，这直接证明了遗传漂变（而非强烈的性选择或生态选择）可以驱动小型孤立岛屿种群中的快速表型变化。综合来看，这些结果提供了有力证据，表明中性人口统计过程可以加速性信号的进化，并在岛屿辐射期间表型多样性的产生中发挥核心作用。
单次试验终点总结测量无法捕捉视觉Oddball范式中的P300耦合：一项伪试验控制、交叉验证研究	Biber, E.	2026-06-11	PDF	单次试验的事件相关电位分析有望获取平均处理所丢弃的逐次变异性，许多研究报告早期窗口的汇总指标与后续成分振幅存在协变关系。然而，这种耦合可能源于连续脑电的时间自相关而非刺激锁时处理。我们探究了传统终点汇总指标（包括平均振幅、均方根、方差、信号复杂度指标（排列熵、样本熵、Lempel-Ziv复杂度）及Hjorth参数）在控制自相关后，能否在主动视觉oddball范式中捕获关于P300振幅的真实刺激锁时信息。通过分析ERP CORE视觉P3数据集（N=27；1084次试验，含213次靶刺激和871次标准刺激，以实验条件为协变量），我们将每个早期窗口（0-150毫秒）指标与Pz电极P300振幅建立关联，并在同一记录中随机时点生成的伪试验上重新估计所有模型；诊断依据是这种替换下的变化方向而非原始效应量。跨通道振幅和能量耦合在伪试验替换后增强，表明其依赖于背景结构。大幅同通道耦合（R²≈0.31）在替换后保持不变，且存在于包括眼电通道在内的所有电极，表明这是试验内普遍的时间连续性而非P300特异性过程。复杂度指标在群体水平呈现近零耦合，但个体水平存在方向性分裂的斜率。独立数据集（不同实验室与硬件设备；相同实验范式）复现了同通道连续性结果（N=90名参与者；83名用于伪试验拟合）以及复杂度指标的方向性分裂个体模式。因此，在控制自相关后，终点汇总指标无法捕获一致的群体水平P300耦合；复杂度指标携带的个体特异性耦合在群体水平相互抵消，这提示需要采用对个体差异敏感的分析设计。

medRxiv

标题	作者	发布日期	PDF链接	摘要
日本糖尿病患者中身体成分、日常体力活动及握力与死亡率、心血管事件及癌症的关联	Hamasaki, H.	2026-06-11	PDF	目的：肌少症和肌少性肥胖与心血管疾病及死亡风险增加相关。本研究探讨了糖尿病患者中身体成分和日常体力活动与死亡、心血管事件及癌症的关联。方法：这项前瞻性队列研究纳入了2018年1月至2023年3月期间在日本一家专科诊所接受治疗的糖尿病患者。通过生物电阻抗分析法评估身体成分（包括内脏脂肪组织），采用非运动性活动产热问卷评估日常体力活动，并使用测力计测量握力。采用Cox比例风险模型评估与死亡、心血管事件及癌症的关联。结果：在2024例患者（平均年龄63.0岁，BMI 24.6 kg/m²，HbA1c 7.8%）中，非运动性活动产热、握力和内脏脂肪组织与全因死亡率无独立关联。较高的内脏脂肪组织与癌症风险增加相关（HR 1.485；95% CI 1.101-2.003；p=0.009）。较高的握力与心血管事件风险呈负相关（HR 0.951；95% CI 0.919-0.984；p=0.004）。非运动性活动产热与任何结局均无关联。结论：较高的内脏脂肪组织与癌症风险增加相关，而较高的握力对心血管事件具有保护作用。将身体成分和握力评估纳入临床实践可能改善糖尿病患者的风险分层和管理。
心肺适能的代谢组学和蛋白质组学特征用于预测全因死亡率和非传染性疾病风险：一项基于英国生物样本库的前瞻性研究	Miras Moreno, S.	2026-06-11	PDF	背景：心肺适能（CRF）是死亡率和非传染性疾病风险的强预测因子，但其潜在分子机制尚不明确。本研究通过分析完成风险分层次极量自行车测力计测试的英国生物样本库参与者数据，利用心率对递增负荷的反应估算CRF，识别出两种CRF特征谱（代谢组学与蛋白质组学）。方法：在包含代谢组学数据（n=354,222）和蛋白质组学数据（n=29,961）的独立英国参与者样本中验证这些特征谱，探究其与全因死亡率及非传染性疾病的前瞻性关联。采用经年龄、性别、种族、社会经济地位、生活方式因素（包括吸烟、饮酒、饮食和BMI）及相关病史调整的Cox比例风险模型评估前瞻性关联。结果：研究发现，较高CRF的特征表现为炎症、甘油三酯代谢、糖酵解和血管功能障碍相关通路下调，以及胆固醇转运、载脂蛋白颗粒大小和细胞骨架重塑相关通路上调。基于这些发现，我们开发了两种新型CRF特征谱（代谢组学与蛋白质组学），能稳健反映CRF水平（R²：0.50-0.60）。在平均9年随访期间，共观察到27,659例全因死亡。在发现队列与验证队列中，CRF代谢组学特征谱与全因死亡风险降低39-54%、2型糖尿病风险显著降低（均达90%）、心血管疾病风险降低42-47%及结直肠癌风险降低33-39%密切相关。此外，CRF蛋白质组学特征谱与全因死亡风险降低17%、2型糖尿病及心血管疾病风险降低22-39%相关。结论：综合表明，循环代谢物和蛋白质与CRF及后续死亡与非传染性疾病风险存在关联。
为什么美利坚合众国尚未批准《联合国儿童权利公约》？以否决权支点作为新的卫生政策分析框架	Harris, L.	2026-06-11	PDF	背景：《联合国儿童权利公约》（CRC）将健康列为儿童应享有的基本人权之一，各成员国通过批准该公约在法律上认可其原则。在所有联合国成员国中，唯有美国尚未批准《儿童权利公约》。目标：本研究旨在探究美国未批准《儿童权利公约》的原因。方法：研究方法包括文献检索与对全球健康、儿童权利、卫生政策及美国法律领域关键利益相关者的深度访谈。通过卫生政策三角模型将主题系统化为内容、背景、过程及支持或反对批准的参与者。结果：尽管多数已发表观点支持批准《儿童权利公约》，但关键文献聚焦于批准的利弊，而非美国未批准的原因。访谈对象扩展了主题，揭示了不批准的现状，且这一现状日益难以突破。运用否决者理论解释现状，并引入新的政策分析框架"否决支点"发现，在批准过程中，处于否决支点的单一强势参与者通过非民主决策阻碍了《儿童权利公约》的批准。结论：本研究构建了新的政策框架"否决支点"，用于分析政治系统中作为否决者的政治参与者拥有超越公众意见和良好卫生政策的行政决策权。
循环肿瘤DNA检测限的形式化：一种用于临床阈值规范的信号检测框架	Walinjkar, A.	2026-06-11	PDF	背景：循环肿瘤DNA（ctDNA）液体活检现已在肿瘤学领域确立，用于早期癌症检测、微小残留病灶监测和治疗监测。所有当前ctDNA检测方法的检测阈值均通过训练队列的受试者工作特征分析经验推导得出——这是一种统计上有效但理论上缺乏依据的方法，既未根据检测技术特性指定最小可检测肿瘤分数，也未确定增加测序深度何时不再提供额外临床信息。方法：我们将ctDNA检测建模为二元假设检验问题，其中突变等位基因计数服从二项分布，并存在测序错误噪声基底。应用内曼-皮尔逊引理推导出一致最优势检测器及最小可检测肿瘤分数的闭式解。将测序检测建模为二元对称信道，并计算香农信道容量。实证验证使用了来自美国及欧盟五家独立机构（2018-2025年）五篇已发表同行评审分析验证研究的61个数据点：Yu等人2022年、Stetson等人2018年、Frydendahl等人2023年、Northcott等人2024年及Cheng等人2025年。结果：最小可检测肿瘤分数的闭式解为f_min约等于(z_alpha + z_beta)乘以(epsilon除以N)的平方根，其中N为测序深度，epsilon为平台错误率，z_alpha和z_beta为指定假阳性率和假阴性率下的标准正态分位数。香农信道容量为C = 1减去H(epsilon)比特/读段，其中H(epsilon)为二元熵。实证验证显示单基因座检测的一致性为84.3%。多基因座肿瘤知情检测（NeXT Personal、双链全基因组测序）的不一致性与单基因座模型范围一致，并指出了所需的主要理论扩展方向。结论：该框架为ctDNA检测提供了首个正式的内曼-皮尔逊最优性证明、闭式检测限以及适用于NHS和监管标准化的平台无关效率指标。关键词：循环肿瘤DNA；液体活检；内曼-皮尔逊检测；香农信道容量；测序深度；检测限；微小残留病灶；信号检测理论
利用爱沙尼亚全国医疗记录来识别研究不足的疾病表型的遗传背景	Abner, E.	2026-06-11	PDF	将全国健康记录与人群生物库相关联，可扩展遗传发现至医院中心数据集难以充分捕获的临床表型。我们基于206,159名爱沙尼亚生物库参与者的1880万个单核苷酸及插入缺失变异基因型数据，对5,491个基于ICD-10编码的疾病表型进行了全基因组关联分析。在疾病表型组中，我们识别出3,222个全基因组显著位点，其中对门诊富集型、复发性及早发性疾病贡献最大。精细定位优先筛选出全研究显著位点中的候选因果变异，而编码变异分析则在HLA区域外识别出754个蛋白质改变变异-性状关联，包括多种皮肤病、贫血、先天性疾病及代谢性状中的高置信度信号。独立的HLA分析在感染、自身免疫及皮肤相关表型中识别出744个HLA-性状关联。以研究不足的表型为例，我们重点分析了花斑癣——一种浅表真菌感染，在EstBB-FinnGen荟萃分析中发现34个位点，包括一个罕见且富集于爱沙尼亚人群的TNFSF15剪接破坏变异。这些结果确立了EstBB作为解析临床多样化及未被充分研究疾病表型遗传架构的资源平台。
39个国家认知老化轨迹的社会决定因素	Gilles, V.	2026-06-11	PDF	区分正常与病理性认知老化具有挑战性，因为不存在典型的老年人。与年龄相关的认知衰退变化并非随机。若干不可改变（如遗传）和潜在可改变（如高血压、吸烟、听力损失）的风险因素与更快的认知老化相关。除个体层面风险因素外，越来越多的证据表明认知障碍与社会、经济及环境因素存在关联。这种关联在发展中国家更为显著，主要源于教育和社会经济地位的更大差异。本研究对39个国家593,746名参与者的人口学特征、社会、经济、环境福祉与空间认知老化之间的关联进行了分析。认知能力通过《海王星之谜》这款空间导航电子游戏进行评估，该游戏可预测现实世界中的空间能力。以全球年龄观察指数衡量的老年人社会、经济及环境福祉，与年龄相关的空间能力衰退呈负相关。其中，全球年龄观察指数的健康与环境子项得分与年龄对寻路表现的影响存在强相关性。我们还发现，空间导航能力的性别差异随年龄增长而扩大，在性别不平等指数更高的国家中尤为显著。研究结果表明，空间认知老化必须被理解为动态、异质的过程，与潜在可改变的环境和社会因素密切相关。
OmicsPred作为多组学性状遗传预测的集中化资源	Foguet, C.	2026-06-11	PDF	多组学数据的遗传预测已成为直接组学分析的经济高效替代方案，尤其适用于识别与疾病易感性相关的分子特征。然而，尽管多组学插补模型应用广泛，但现有研究中的模型分散孤立，阻碍了其可发现性、可访问性、互操作性和重复利用。为此，我们开发了OmicsPred平台（https://www.omicspred.org），这是一个用于存储和传播多组学性状遗传预测模型的集中式平台。OmicsPred整合了最常用的分子插补模型（如来自PredictDB的模型）及其他已发表研究，截至2026年5月共收录3,339,469个预测模型，涵盖转录组、蛋白质组和代谢组性状。每个模型均附有描述评分开发过程和预测性能的元数据，并以兼容PGS Catalog Calculator和MetaXcan等常用分析工具的格式发布。为展示该资源在系统性靶点发现中的应用价值，我们在百万退伍军人计划数据中开展了多组学全表型组关联分析。
超越注入检测：一种正向安全提示防火墙，可弥补医疗领域SOTA分类器遗漏的范围和PHI缺口	Schwoebel, J.	2026-06-11	PDF	嵌入自主智能体的大语言模型在同一上下文窗口中处理可信指令与不可信数据，这使得它们容易受到直接和间接提示注入攻击。在医疗领域这并非假设性威胁：2025年《JAMA Network Open》研究显示，商用医疗大语言模型在94.4%的模拟患者交互中遵循了注入指令，包括危及生命的建议[21]。但我们在此量化的临床关键问题有所不同。大多数真实临床威胁——受保护健康信息（PHI）泄露、跨患者访问、批量导出、超出范围建议——都是流畅且看似合法的请求，不携带任何攻击信号，因此即使最先进的注入检测器也会放行。现有运行时防护措施在安全性与延迟之间权衡：基于模型的审计器准确但需增加数百毫秒的Python推理时间，而词法过滤器快速但无法识别混淆或语义伪装的有效载荷。我们提出QFIRE，这是一个内联、供应商无关的提示防火墙，实现为单一自包含Rust工具链（代理、命令行界面和基准测试框架）。QFIRE结合三种机制：（i）正向安全范围约束，将模型调用限制在声明的自然语言用途内，即使没有明显攻击令牌也能阻止范围外漂移；（ii）异步检测器图，并发运行N条规则及其检测节点，优先执行最廉价检查；（iii）反混淆处理，在检测前解码Base64/hex/ROT13、折叠同形字和leet语、剥离零宽字符。QFIRE包含106条版本化防火墙规则和专用HIPAA安全港（18标识符）PHI面板，并通过嵌入式ONNX Runtime运行本地DeBERTa-v3注入分类器。在1,968个公开提示注入和越狱提示上，QFIRE的确定性混合方法达到F1值0.86，与Meta最先进的PromptGuard-2（0.86）统计持平，高于protectai DeBERTa-v3（0.83）；词法基线落后（0.16-0.50）。我们的核心结果基于QFIRE-HealthBench，这是一个我们构建并发布的新2,000条提示医疗基准测试，包含真实garak和Microsoft PyRIT[25]有效载荷。在此基准上，相同的PromptGuard-2仅恢复0.40召回率（DeBERTa-v3为0.57），因为大多数临床威胁不携带注入信号；QFIRE的组合范围+PHI链在0.08校准假阳性率下达到0.83召回率（F1值0.87）。因此，通用注入检测（即使最先进）对医疗智能体而言必要但不充分。裸大语言模型裁判也能缩小此静态语料库差距（F1值0.90）；QFIRE超越静态准确率的贡献在于可审计确定性、有界延迟和自适应鲁棒性，而裸裁判在[§]5.5中降至34-59%召回率。端到端测试中，在模拟EHR沙箱前放置QFIRE的工具体智能体，将有害动作率从0.38降至0.00，良性效用成本为0.13。所有代码、规则、语料库快照和脚本均已发布，每个表格均可通过单一make paper目标针对本地模型重新生成，无需付费API密钥。
芬太尼纯度与过量致死率下降：地理趋势的再审视	Dasgupta, N.	2026-06-11	PDF	美国芬太尼时代的药物过量死亡人数在近期下降前曾达到历史最高水平。一个合理的假设是，2023年开始的芬太尼纯度骤降（供应冲击）导致了过量死亡率的下降。我们通过使用考虑时间趋势和自相关性的模型，以及负对照指标来检验虚假相关性，并利用区域过量数据复制已发表的分析，评估了这一假设。在复制原始论文时，我们从美国缉毒局发布的图表中提取了芬太尼纯度数据；过量死亡率则来自标准生命统计来源。我们发现，当芬太尼纯度上升时，全国纯度序列并未追踪到大多数地区的过量死亡增加，仅在西海岸地区显示出微弱关联。当纯度和死亡率随后双双下降时，观察到的关联也与具有相同时间模式的不相关宏观经济指标一致。加拿大研究显示，在省级以下区域，芬太尼纯度与过量死亡之间的关联强度和方向存在差异。执法机构纯度评估中的差异性选择偏差可能损害DEA数据的纵向和地理普适性，尤其是2023-4年对高纯度批发样本的模拟报告。仅凭全国芬太尼纯度不足以充分解释近期过量死亡下降的原因。局部纯度降低可能影响过量死亡减少，但必须考虑其他原因，包括毒品供应变化、公共卫生干预、人口结构变化、行为改变、贩毒集团内部动态以及新吸食者减少。
预测恰加斯病进展的小分子生物标志物	Liu, Z.	2026-06-11	PDF	恰加斯病（CD）由原生动物寄生虫克氏锥虫引起，全球约1050万人受其影响，至今仍是拉丁美洲感染性心肌病的主要病因。虽然未经治疗的感染会持续终生，但仅有20%至30%的慢性感染者会从无症状阶段发展为具有临床意义的心脏疾病，而现有抗寄生虫疗法受限于毒性和疗效差异。能够预测疾病进展的可靠生物标志物将改善临床风险分层并支持治疗开发。本研究通过代谢组学分析，旨在鉴定可预测无症状感染向心脏CD进展的血清生物标志物。采用互补色谱平台进行非靶向液相色谱质谱分析，结合单变量统计、机器学习特征选择及受试者工作特征曲线分析，筛选候选生物标志物，并通过靶向分析进行验证。我们鉴定出8种单一代谢物标志物和45种可预测进展状态的组合标志物，其中10种组合符合CD治疗反应生物标志物目标产品特征中定义的灵敏度和特异性标准。这些发现表明基线循环代谢物可预测未来心脏疾病进展，为慢性恰加斯病临床预后工具的开发奠定了基础。