2026-06-06 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
TailLoR：在参数高效持续学习中保护主成分	Marius Dragoi	2026-06-04	PDF	基于谱分解的参数高效微调方法推动了持续学习的发展。本文提出TailLoR方法，利用预训练权重的奇异基U和V作为固定参考框架，学习应用于奇异值矩阵的低秩更新。软谱惩罚机制抑制与主导奇异方向对齐的更新，在减少干扰的同时将细粒度适配引导至高度灵活的长尾谱坐标中。
HANDOFF：基于蒸馏互补教师的人形机器人任务空间全身控制	Lizhi Yang	2026-06-04	PDF	人形机器人要在现实世界中部署，指令空间（即任务规划与全身控制之间的接口）的选择至关重要。现有全身控制器通常需要规划器难以从任务语义中生成的密集运动学或空间参考。我们提出一种紧凑、显式的接口，该接口直观、通用、模块化且具有足够的表现力，可支持多种操作技能。为此，我们引入HANDOFF——一种遵循该接口的单一全身控制器，通过多教师KL蒸馏，在上下文条件门控机制下，从三个互补专家（基于安全过滤数据的全身运动追踪、行走和跌倒恢复）中蒸馏出混合专家学生模型。在Unitree G1上，HANDOFF达到了最先进的速度追踪性能，并提供了最大的鲁棒操作工作空间之一。我们进一步通过多个自然语言驱动的任务执行演示了硬件可行性，这些任务由VLM驱动的智能规划器支持，无需特定任务数据或控制器微调。
Code2LoRA：软件演化下代码语言模型的超网络生成适配器	Liliana Hotsko	2026-06-04	PDF	代码语言模型需要仓库级别的上下文来解决导入、API调用和项目约定问题。现有方法通过长输入（通过RAG或依赖分析检索）或通过每个仓库的微调和LoRA注入这些知识——这在仓库规模下成本高昂，且对不断演变的代码库适应性差。我们提出Code2LoRA，一个超网络框架，能够生成仓库特定的LoRA适配器，在零推理时令牌开销下有效注入仓库知识。Code2LoRA支持两种使用场景：Code2LoRA-Static将单个仓库快照转换为适配器，适用于理解稳定的代码库；而Code2LoRA-Evo维护一个由GRU隐藏状态支持的适配器，该状态随每次代码差异更新，适用于活跃开发的演进代码库。为评估Code2LoRA与参数高效微调基线的性能，我们构建了RepoPeftBench，一个包含604个Python仓库的基准测试，设有两个赛道：静态赛道包含4万训练和1.2万测试的断言补全任务，演进赛道包含21.5万次提交衍生的训练和8.7万次提交衍生的测试任务。在静态赛道上，Code2LoRA-Static实现了63.8%的跨仓库和66.2%的仓库内精确匹配，达到了每个仓库LoRA的上限；在演进赛道上，Code2LoRA-Evo实现了60.3%的跨仓库精确匹配（比单个共享LoRA高出5.2个百分点）。Code2LoRA的代码可在https://anonymous.4open.science/r/code2lora-6857获取；模型检查点和RepoPeftBench数据集可在https://huggingface.co/code2lora获取。
TempoVLA：学习速度可控的视觉-语言-动作策略	Dong Jing	2026-06-04	PDF	机器人操作在低风险过渡阶段需要快速执行，而在高风险接触阶段则要求缓慢精确的运动。然而，现有的视觉-语言-动作模型（VLAs）仅从训练演示中继承单一固定速度。先前通过模型压缩、KV缓存复用或强化学习加速VLA的努力，仅将策略从一种固定速度切换至另一种，几乎未涉及减速机制。我们观察到每个预测动作的幅度已能控制机器人移动速度，这为可控执行速度提供了直接路径。基于此发现，我们提出TempoVLA——一种通过显式条件控制执行速度的单一VLA模型。TempoVLA包含两个耦合组件：（1）数据侧的变速轨迹增强模块（VSTA），通过合并或拆分动作将演示重新定时至任意目标速度，同时保持运动语义；（2）模型侧的条件机制，将速度信息输入策略网络。统计显示VSTA能以可忽略的运动误差达到指定速度。仿真与真实任务实验表明，TempoVLA实现了双向灵活速度控制，而VSTA通过更优数据利用进一步提升了默认1倍速性能。此外，与大型多模态模型协同工作时，TempoVLA可实现动态速度控制：在低风险阶段加速，在高风险阶段减速。
在重复博弈中与自适应对手进行遗憾最小化	Mingyang Liu	2026-06-04	PDF	本文研究在具有自适应对手的重复博弈中的遗憾最小化问题，对手能根据博弈历史做出反应。在线学习中标准的外部遗憾指标已知无法捕捉这种适应性。为考虑玩家的反事实推理，我们提出重复策略遗憾（RP-Regret）这一博弈论指标，该指标衡量当所有玩家都能对博弈历史做出反应时，实际累积效用与事后最优累积效用之间的差异。与现有该场景下的遗憾概念相比，我们的指标更契合重复博弈特性，能在保持所有玩家最小化该指标时发现更优均衡可能性的同时，支持更强的比较对象和约束更少的对手。我们首先确定了在时间上实现次线性RP-Regret的必要条件，这些条件涉及遗憾定义中玩家比较策略的变化幅度，以及比较对象和对手策略的记忆长度。随后我们研究了最小化RP-Regret的附加条件和可证明算法——该指标在策略空间中天然具有非凸性。为应对这一挑战，我们提出三种算法：（i）基于优化预言机的算法（类似部分在线非凸学习先前工作的假设）；（ii）每次迭代最小化RP-Regret的凸线性化替代函数的算法；（iii）当对手策略缓慢变化时直接最小化RP-Regret的算法。此外，当所有玩家都能运行最小化RP-Regret（或其线性化变体）的算法时，重复博弈的某些子博弈完美均衡可被学习。实验表明，最小化我们的遗憾指标能在猎鹿博弈等场景中引导出更高效用的合作解。
PAR3D：一种具有部件感知表示的统一三维多模态大语言模型，用于场景理解	Shaohui Dai	2026-06-04	PDF	近期，三维多模态大语言模型（3D-MLLMs）的进展为三维场景理解任务（包括视觉问答、描述生成和指代分割）提供了统一解决方案。然而，现有3D-MLLMs仍以物体为中心，难以建模对三维环境具身交互至关重要的细粒度部件结构。本文提出PAR3D——一个统一的部件感知三维多模态大语言模型框架，使模型能够理解、推理并定位三维场景中的物体及其部件。为支持部件感知三维场景理解的训练与评估，我们构建了ScenePart——一个包含部件级标注和语言指令的合成三维场景数据集。我们进一步开发了部件感知三维表征学习，以细粒度部件级语义丰富三维视觉表征，并提出层级分割查询生成机制，通过层级化物体-部件查询定位部件目标。大量实验表明，本方法显著提升了部件级问答与指代分割性能，同时在物体级视觉-语言任务中保持优异表现。
操作引导的渐进式人机文本转换基准：面向多粒度AI文本检测	Sondos Mahmoud Bsharat	2026-06-04	PDF	随着AI写作助手越来越多地融入实际的起草和修订流程，许多文档不再纯粹由人类或AI单独完成，而是人类与AI渐进式协作编辑的产物。然而，现有的AI文本检测基准主要关注最终输出，对AI作者身份信号在修订过程中如何产生、累积或消失的理解十分有限。我们提出OpAI-Bench，一个基于操作引导的基准，用于研究从人类到AI文本在文档、句子、词元和跨度粒度上的渐进式转换。OpAI-Bench从人类撰写的文档出发，在预定义的AI覆盖级别和五种代表性AI编辑操作下，为每个样本构建九个顺序修订版本，涵盖四个领域，同时保留多个粒度下的完整作者身份溯源。该基准支持对8个文档级检测器、7个句子级检测器和2个细粒度词元/跨度级检测器进行全面评估。实验表明，AI文本的可检测性不仅受AI编辑内容比例的影响，还受编辑操作、领域和累积修订历史的影响。有趣的是，我们注意到混合作者身份的中间版本往往比完全人类撰写或大量AI编辑的端点版本更难检测，这揭示了现有基准未能捕捉的非单调检测模式。OpAI-Bench为分析在现实渐进式编辑场景下AI辅助写作是否、何时以及如何变得可检测提供了受控测试平台。我们的代码和基准可在https://github.com/VILA-Lab/OpAI-Bench获取。
DNQ：面向部分可观测n人博弈的深度纳什Q网络	Qintong Xie	2026-06-04	PDF	许多现实世界的竞争系统要求多个决策者在共享约束、有限信息和重复互动下同时行动，例如拍卖、资源分配和安全竞争。我们以多轮同步竞价为受控测试平台研究此类问题，并提出DNQ——一种基于求解器在环的均衡监督框架，用于训练竞价智能体。DNQ交替进行轨迹收集、基于评论家的收益估计、均衡计算和策略模仿。在每个访问状态中，共享评论家预测成对收益矩阵或精确的N玩家收益张量，外部求解器计算均衡策略，智能体通过最小化其掩码策略与求解器推导的均衡目标之间的KL散度进行训练。我们聚焦于可扩展的成对公式，与精确公式相比，该公式大幅降低均衡求解成本和训练时间，同时共享评论家跨智能体和状态分摊收益学习。实验通过评论家损失、策略熵、竞价资源使用和训练成本对比成对变体与精确变体，结果表明成对方法可扩展至更多智能体，而精确方法在联合博弈规模增长时变得计算上不可行。这些结果揭示了重复竞争环境中策略保真度与可扩展性之间的权衡。
无需递归的预训练循环网络	Akarsh Kumar	2026-06-04	PDF	训练循环神经网络（RNN）需要在整个长序列计算过程中分配信用。标准的时间反向传播（BPTT）在此问题上表现不佳：其时间维度上的顺序性限制了并行性，且存在梯度消失或爆炸问题，导致难以学习长程关联。我们提出监督记忆训练（SMT），该方法通过将RNN训练简化为单步记忆转换标签$(m_t, x_{t+1}) \rightarrow m_{t+1}$上的监督学习，完全规避了循环信用传播。SMT通过训练基于Transformer的编码器实现预测状态目标——仅保留预测未来所需的过去信息——来获取这些记忆标签。通过解耦"记忆什么"与"如何更新记忆"，SMT实现了时间并行的RNN训练，任意两个token间具有稳定的$O(1)$长度梯度路径——且无需展开RNN。我们发现，在语言建模和像素序列建模等任务上预训练各类RNN架构时，SMT的性能优于BPTT。SMT使非线性RNN能够更好地捕捉长程依赖关系并进行并行训练，这为构建过去经验时间抽象模型的规模化发展提供了可能。
复杂度平衡扩散分裂	Noam Issachar	2026-06-04	PDF	标准连续时间生成模型依赖单一架构，必须处理从各向同性噪声到复杂数据分布等差异极大的信号状态。虽然扩大模型容量能提升性能，但在整个生成时间线上均匀部署大规模网络本质上效率低下。本文提出复杂度均衡分割（CBS），这是一种基于原则的时间容量分配框架，通过多个专用子网络分配生成工作负载。CBS基于函数逼近理论和de Boor等分布原理，将扩散时间线划分为近似负担相等的片段，为生成动力学建模更困难的区域分配更多表征容量。为估计局部复杂度，我们引入两种互补且易处理的监控函数：基于流Dirichlet能量的空间度量，以及基于采样轨迹加速度的几何度量。通过轻量级辅助模型估计这些复杂度分布，该方法无需启发式时间分割或计算昂贵的搜索过程。在多种架构（SiT、JiT和UNet）和数据集上的广泛评估表明，CBS在不增加单步推理成本的情况下持续提升合成质量。特别地，在带CFG的SiT-XL上，CBS相比朴素时间分割将FID提升约35%。项目页面见https://noamissachar.github.io/CBS/。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
一种层解析诊断方法识别深度神经网络中的偏差驱动决策	Nakuci, J.	2026-06-06	PDF	深度神经网络即使在输入支持有限的情况下，仍可能保持高度置信。然而，现有方法（如校准和特征归因）虽能提供关于错误概率和显著特征的互补信息，却无法量化决策边界或置信度受支持的程度。为解决这一局限，我们提出偏置主导指数（BDI），这是一种逐层解析的诊断工具，可将决策边界分解为输入依赖特征和输入无关的偏移分量（即偏置）。BDI能够判断模型置信度主要受特征支持还是偏置驱动。在卷积神经网络、视觉Transformer和Transformer语言模型上的实验表明，当特征支持减弱时BDI值升高，且高置信度可能与偏置主导决策共存。逐层分析定位了偏置主导支持出现的区域，揭示了不同架构特有的位置特征。扰动分析进一步表明，当读出权重退化时，偏置分量可稳定模型性能。最终，我们将决策构成操作化为一个结合置信度与BDI的接受规则，用于机制感知审计。这些结果将BDI定位为一种通用的决策构成诊断工具，能够跨模型家族区分特征支持型与偏置驱动型决策。
病毒在抑制甲烷的泥炭微宇宙中帮助重新布线碳代谢。	Riddell, J.	2026-06-06	PDF	人类活动正在加速永久冻土融化，并因微生物活动增强导致甲烷排放增加，这促使人们将微生物组工程作为减排策略。我们近期证明，儿茶素添加可通过富集降解儿茶素的原核生物（这些原核生物在氢竞争上胜过产甲烷菌），使泥炭微宇宙中的甲烷排放大幅降低（>80%）。然而，病毒对此类微生物组水平响应的贡献尚未被探索，我们假设病毒动态可能通过营养物添加改变细胞生理状态、诱导裂解性病毒活性，从而塑造微生物组响应。本研究对先前从儿茶素添加泥炭微宇宙中获取的时间分辨多组学数据进行了病毒生态基因组学分析。我们保守鉴定出900个推定裂解性病毒操作分类单元（vOTUs），其中41%预测感染活跃宿主基因组，包括转录活性最高的vOTUs（预测感染关键儿茶素降解菌属——梭菌属和未描述的Bacillota门JAGFXR01属）。值得注意的是，一个靶向JAGFXR01的vOTU主导了病毒响应（占群落病毒转录本的40%以上；丰度比宿主高20-156倍），我们将其解释为诱导产生的强烈裂解活性，可能向其他群落成员释放儿茶素降解中间产物。与此一致，基因表达分析显示34个额外多酚降解宏基因组组装基因组中儿茶素中间产物降解和氢化酶信号增强。这些发现支持一个类似病毒分流的过程模型，扩展了我们先前以原核生物为中心的模型：快速生长的儿茶素降解菌被病毒裂解后，酚类中间产物重新分配给多样化的酚降解类群，这些类群通过消耗氢维持甲烷抑制效应。除在该系统中的碳循环重要性外，阐明营养物和益生元干预引发的非预期病毒介导响应，将有助于在土壤、海洋和人类生态系统中实现更可预测且有效的微生物组工程策略。
利用遗传结构化的黑云杉（Picea mariana）共同园地测试基因组偏移	Fijarczyk, A.	2026-06-06	PDF	北方森林通过碳的储存与释放在气候调节中扮演关键角色。预期气候变化将导致许多北方树种死亡率上升、生物量减少，威胁该生态系统的功能及其碳汇作用。基因组偏移方法利用基因组多样性的空间分布及其与环境变量的关联，预测种群对未来气候变化的脆弱性。本研究分析了北方森林优势树种黑云杉（Picea mariana (Mill.) B.S.P）的60余个种群和1400多个个体，通过梯度森林模型和冗余分析（RDA）计算的种群基因组偏移，与四个长期（>40年）同质园实验中测定的多维度适应性性状进行比较。在同质园内，我们发现基因组偏移预测基本不受模型选择、训练标记数量或类型的影响，仅在LFMM气候关联标记中观察到显著差异。当训练集种群数量或规模减少时，模型性能保持相对稳定，表明这些模型可可靠预测新种群的基因组偏移。但模型性能在不同同质园间存在差异，部分同质园的适应性预测高度准确，另一些则出现矛盾结果。模型性能受气候预测因子选择、其与适应性性状的关系以及模型评估的遗传簇影响。总体而言，我们的研究结果凸显了在具有遗传结构的物种中，由于适应环境驱动因子的空间变异及其复杂相互作用，跨大空间尺度预测基因组偏移面临挑战。通过综合验证，我们确定了预测未来气候情景下黑云杉适应性衰退的最稳健模型。
通过糖异生进行的代谢补偿解释了糖原磷酸化酶作为小菜蛾杀虫靶标的非必需性。	Zhou, Y.	2026-06-06	PDF	糖原磷酸化酶（GP）催化糖原分解的限速步骤，在昆虫碳水化合物代谢中占据核心地位，为几丁质生物合成提供前体。与苯甲酰脲（BPU）类杀虫剂结构相关的酰脲化合物是哺乳动物GP的有效抑制剂，这引发了一个问题：昆虫GP能否作为独立的杀虫靶标。本研究以小菜蛾（Plutella xylostella）为对象系统评估了这一可能性。我们发现，哺乳动物GP抑制剂（GPI）能有效抑制重组PxGP（IC50 = 2.96 nM），而BPU类杀虫剂除虫脲（DFB）则无此作用。分子对接和MM/GBSA分析表明，这种选择性源于侧链相互作用的差异：GPI通过七个跨亚基接触位点结合二聚体界面的变构位点（ΔG = -34.63 kcal/mol），而DFB的二氟苯甲酰基团未能建立有效的蛋白质接触（ΔG = -29.29 kcal/mol）。尽管体外抑制效果显著，但GPI未表现出杀虫活性，且通过RNAi介导的PxGP敲低（酶活性测定证实每只幼虫GP-a活性降低约27-30%）并未影响发育或存活。我们证明昆虫通过多层代谢响应进行补偿：糖异生酶（PEPCK、G-6-Pase）上调、糖原分支酶（GBE）选择性激活（而非α-淀粉酶），以及提供糖异生底物的蛋白质分解代谢。适应性评估显示幼虫体重短暂下降（24-48小时），但蛹重、成虫翅形态和雌虫繁殖力完全恢复，证实代谢补偿最终有效。这些发现表明由于糖异生补偿机制的存在，GP在功能上并非必需，并强调了在基于靶标的杀虫剂设计中考虑代谢网络冗余的重要性。
TNBC中基于AHP加权的外泌体蛋白质组学恢复了一个ECM侵袭模块，并提名AGRN作为研究不足的候选分子。	Nguyen, T. M.	2026-06-06	PDF	背景：三阴性乳腺癌（TNBC）因缺乏已验证的分子靶点及有限的非侵入性早期检测策略，仍是临床最具挑战性的乳腺癌亚型。肿瘤来源外泌体已成为有前景的液体活检分析物，但其蛋白质货物的功能组织及具有生物学意义的候选标志物的识别仍未被充分阐明。方法：我们提出复合驱动评分（CDS）框架，该框架整合差异表达幅度、蛋白质-蛋白质相互作用网络拓扑结构及基于层次分析法（AHP）的多准则加权，以优先筛选外泌体蛋白候选物。该框架应用于公开的无标记定量蛋白质组数据集（比较MDA-MB-231（TNBC）与MCF-10A（非致瘤性）外泌体组分），并在独立蛋白质组数据集中进行跨数据集验证。结果：CDS优先排序对蛋白质组深度和参数权重的变化表现出稳健性，持续富集细胞外基质（ECM）和粘附相关蛋白。网络和通路分析揭示整合素受体、同源ECM配体及相关共受体的协同共富集，这与功能整合的侵袭模块的选择性包装一致。聚糖蛋白（AGRN）——一种在TNBC外泌体生物学中几乎无先前表征的硫酸乙酰肝素蛋白聚糖—— exemplifies the class of candidate the framework is designed to surface: independently nominated through network integration alone, yet supported by emerging evidence of oncogenic and immunosuppressive roles across cancer types. 结论：CDS框架提供了一种可转移的整合性外泌体生物标志物优先筛选策略，将统计证据视为候选物优先级的连续贡献因素而非二元过滤器。这些发现为TNBC靶向液体活检组合开发提供了系统层面的基础。
细胞外水杨酸通过细胞表面受体激活免疫信号	Li, Q.	2026-06-06	PDF	水杨酸（SA）是一种核心免疫激素，在病原体感染期间会在细胞内和细胞外区室中积累。尽管细胞内SA信号传导机制已明确，但细胞外SA（eSA）是否直接激活免疫反应仍未知。本研究发现，eSA可作为细胞外信号，可能被拟南芥质膜定位的凝集素受体激酶LecRK-I.8和LecRK-VI.2感知。两种受体的胞外结构域均能以微摩尔级亲和力结合SA，SA能快速诱导LecRK-I.8磷酸化，且LecRK-I.8和LecRK-VI.2的激酶活性对下游信号传导至关重要。此外，对LecRK-VI.2中计算预测的结合口袋进行诱变后，SA结合能力与免疫功能均丧失，这为受体介导的感知机制提供了证据。遗传分析进一步表明，LecRK受体是SA诱导的抗性、转录重编程和磷酸化蛋白质组响应所必需的。这些发现揭示了经典免疫激素潜在的受体介导的细胞表面感知机制，拓展了现有SA信号传导模型。
胞外NAD(P)通过LecRK-VI.2介导的NPR1磷酸化激活系统获得性抗性。	Liu, C.	2026-06-06	PDF	系统性获得性抗性（SAR）是一种由初级感染位点产生的信号诱导远端组织产生的持久、广谱免疫反应。尽管多种可移动免疫信号参与SAR，但这些信号如何被感知并机械耦合至系统组织中的转录重编程仍不清楚。胞外NAD(P) [eNAD(P)]作为关键整合性SAR信号，通过质膜定位的凝集素受体激酶LecRK-VI.2和主免疫共激活因子NONEXPRESSOR OF PATHOGENESIS-RELATED GENES1（NPR1）激活免疫。然而，连接eNAD(P)感知与NPR1激活的机制仍未知。本研究发现LecRK-VI.2与NPR1组成性结合，并在感知eNAD(P)后直接磷酸化NPR1的T359位点及可能的S356位点。NADP+诱导的NPR1磷酸化在体内快速发生且依赖LecRK-VI.2。非磷酸化NPR1变体消除eNADP+诱导的局部和系统免疫以及生物学诱导的SAR，而磷酸模拟变体保留NPR1功能。机制上，LecRK-VI.2介导的磷酸化促进NPR1与TGACG结合转录因子（TGAs）及中介体亚基MED15的相互作用，从而增强防御基因表达所需的转录激活复合物组装。进一步证明NPR1以磷酸化依赖方式促进TGA-MED15结合。这些发现建立了直接连接胞外免疫信号感知与转录激活的受体-共激活因子信号机制。该工作填补了SAR信号通路的关键机制空白，揭示了受体介导的共激活因子激活作为系统免疫中快速转化胞外免疫信号为协调转录输出的机制。
利用两个连续生长季的时间序列数据，研究木薯育种群体中无人机获取冠层性状的可重复性与遗传力	Quiros-Vargas, J.	2026-06-06	PDF	木薯是热带地区（尤其是撒哈拉以南非洲）的主要粮食作物，但其生产力仍受遗传和农艺因素制约。木薯育种的主要瓶颈在于，使用传统劳动密集型方法在田间条件下准确鉴定农艺性状存在困难。本研究评估了基于无人机表型分析在真实田间条件下量化冠层生长性状及其遗传相关性的潜力。为此，我们在尼日利亚国际热带农业研究所的田间种植了46个木薯基因型，并在两个生长季（2018-2019和2019-2020）采集了多时相无人机影像。在小区水平提取了冠层高度、冠层体积及其相对生长速率，并进一步评估了这些性状的季节动态及冠层-产量关系在不同发育阶段和环境条件下的变化。通过线性混合模型估计了重复性和广义遗传力，该模型分解了遗传、基因型-年份互作及残差方差组分，从而评估了测量可靠性和遗传信号。总体而言，无人机获取的生长动态在不同基因型间呈现相似模式，反映了共同的季节性生长轨迹，而冠层-产量关系则随发育阶段和环境条件变化。在遗传指标方面，所有无人机衍生性状的重复性均较高，表明在重复和季节间基因型水平评估可靠。相比之下，不同性状的广义遗传力差异显著：冠层体积和冠层高度表现出中到高的遗传力，反映了强基因型效应和相对适中的基因型-年份互作；而它们的相对生长速率因基因型-年份互作主导而呈现接近零的遗传力，表明环境主导影响。这些结果表明，无人机衍生的冠层高度和体积为不同环境下木薯基因型的遗传分化提供了稳定基础，支持其在选择中的应用，而生长速率性状更适合表征生长可塑性和基因型-环境互作。
肌醇焦磷酸介导莱茵衣藻高光适应过程中叶绿体脂质重塑与核基因抑制	Bedera-Garcia, R.	2026-06-06	PDF	微藻是能够进行自养生长的光合生物。由于它们能将CO2固定为高附加值有机产物（如脂肪酸和类胡萝卜素），其在多个工业领域的应用潜力已得到广泛研究。然而，我们对控制碳通量和环境胁迫适应的细胞信号网络仍缺乏完整认知。本研究利用莱茵衣藻突变株vip1-1（该菌株携带六磷酸激酶功能缺失突变，该激酶负责合成焦磷酸肌醇InsP7和InsP8，即PP-InsPs），探究这些分子在高光适应过程中的作用。结果表明：PP-InsPs参与调控以淀粉形式储存的碳分配，其缺失会提高藻细胞中甘油三酯水平；同时通过脂肪酸去饱和及甘油脂组成变化影响膜成分与流动性，从而重塑叶绿体特异性脂质。此外，我们发现PP-InsPs参与叶绿体-细胞核通讯，协调抑制光合相关核基因、脂肪酸去饱和酶及脂质合成酶的转录，促进细胞对高光的适应。研究还发现PP-InsPs的调控效应延伸至蛋白质合成及卡尔文-本森-巴沙姆循环中间体的积累。因此，我们提出PP-InsPs作为整合分子，响应高光等环境信号，平衡碳在储存库与结构库之间的分配。这些数据揭示了PP-InsPs在高光适应及叶绿体-细胞核通讯中的新功能，为培育更具抗逆性和高效性的藻株提供了新思路。
番茄果实RALF肽的基础特征揭示SlRALF家族内的结构与功能特化	Montano, J. A.	2026-06-06	PDF	快速碱化因子（RALF）肽调控植物生长和细胞壁信号传导，但其在果实发育中的作用尚不明确。本研究对番茄（Solanum lycopersicum）果实相关RALF肽及其与富含亮氨酸重复序列伸展蛋白（LRXs）的互作进行了表征。表达分析鉴定出SlRALF5、SlRALF7和SlRALF10是果实中主要表达的RALF。SlRALF10与早期果实发育相关，而SlRALF5和SlRALF7在成熟过程中持续表达。序列分析显示SlRALF5/7保留典型RALF的保守基序，而SlRALF10呈现差异化的结构特征和电荷分布变化。合成SlRALF5和SlRALF7可抑制根生长并诱导胞外碱化，而SlRALF10缺乏这两种活性。免疫共沉淀实验表明三种肽均与果实表达蛋白SlLRX2和SlLRX5互作。结构模型预测SlLRX5/SlRALF10复合物与SlRALF5相比具有独特的静电特性。这些结果揭示了番茄果实RALF肽的结构与功能特化，提示不同SlRALF可能在果实发育和成熟过程中对细胞壁重塑产生差异化响应。

medRxiv

标题	作者	发布日期	PDF链接	摘要
使用基于熵的不确定性分诊的患病率自适应四模型贝叶斯集成进行围手术期死亡率预测	Pandey, A. K.	2026-06-06	PDF	背景：资源有限环境下的围手术期死亡率预测面临严重类别不平衡（16.9:1）和并发症路径异质性的挑战。现有工具需要术前无法获取的术中变量，且无法提供不确定性量化。我们提出了一种基于患病率自适应的四模型贝叶斯集成方法，结合基于熵的三级分诊系统，在包含697例真实患者（39例死亡，原始患病率5.59%）的930例普外科手术队列中训练，通过VAE数据增强处理类别不平衡（1,935样本集；不平衡比从16.9:1降至1.94:1）。方法：基于67项术前和术后早期特征，训练了四个概率模型——变分自编码器（VAE；AUC=0.9449）、Flipout M1（AUC=0.9009）、概率M2（AUC=0.9598）和贝叶斯蒙特卡洛（AUC=0.9115；100次迭代，种子=42）。采用性能归一化集成权重（Rokach 2010: w_k = (AUC_k - 0.5) / sum(AUC_j - 0.5)）：VAE=0.2587，M1=0.2337，M2=0.2679，贝叶斯=0.2398。通过多数3/4门控和香农熵调整（gamma=0.10，Focal Loss类比），基于无结局标签的Gamma_Adjusted评分定义了三个分诊区域——危重区（>=0.8649）、灰色区（0.6987-0.8649）和安全区（<0.6987）。结果：在验证队列（n=233；13例死亡）中，A阶段（Post_Gate_Score）达到AUC=0.9577，灵敏度=76.9%，特异度=90.0%，J=0.669。B阶段（Gamma_Adjusted，gamma=0.10）达到AUC=0.9586，灵敏度=100%（95% Wilson CI 77.2-100.0%），特异度=83.2%，J=0.832，假阴性=0，假阳性=37（FP/TP=2.8倍）。危重区（n=16）：10例死亡，6例存活，FP/TP=0.6倍。不同分诊区的香农熵存在显著差异（Kruskal-Wallis H=46.072，p=9.90x10^-11，epsilon-squared=0.192）；死亡患者熵值低于存活患者（Mann-Whitney p=0.0002）。该集成方法优于所有对照工具：RCRI（AUC=0.879）、ASA分级（AUC=0.829）、PMP评分/Vaid 2012（AUC=0.777）、CCI（AUC=0.646）和mFI-5（AUC=0.661）。结论：基于患病率自适应的四模型贝叶斯集成方法结合熵引导分诊，在临床可接受的警报负担（FP/TP=2.8倍）下实现了100%灵敏度，优于所有传统围手术期风险评分。三级危重区/灰色区/安全区方案已部署为开源Streamlit应用程序，可在无结局标签情况下提供可操作的实时风险分层。推广前需进行外部多中心验证。
按时间分层的人口学、生命体征、临床实验室及微生物学变量的顺序应用，用于快速准确识别脓毒症。	Navalkar, K. A.	2026-06-06	PDF	背景脓毒症的早期准确识别仍是重大临床挑战，因其临床表现异质性高，且与非感染性全身炎症反应综合征（SIRS）的体征存在重叠。及时鉴别对改善患者预后、满足脓毒症集束化治疗要求及减少抗菌药物不合理使用至关重要。我们假设患者就诊后3小时内可获取的临床实验室数据能够以可操作的准确度识别脓毒症患者，替代传统微生物学结果（至少需12-24小时才能获得）。本研究利用两项独立研究的数据，量化三个时间点可获取的人口学、生命体征、临床实验室及微生物学数据对回顾性诊断的危重症患者（脓毒症或非感染性SIRS）的鉴别诊断价值。研究重点评估了SeptiCyte RAPID（美国华盛顿州西雅图Immunexpress公司）作为脓毒症诊断辅助工具的价值，该检测可在1小时内提供可操作数据。方法分析两项独立研究队列数据。"510k队列"包含419例重症监护室（ICU）成年患者（来自MARS、VENUS和NEPTUNE研究）。"安达卢西亚队列"包含353例来自PANGEA研究的ICU患者。采用贪婪搜索算法筛选变量、重复交叉验证验证的Logistic回归模型，确定不同变量对诊断准确性的贡献。通过受试者工作特征曲线下面积（AUC）量化诊断效能。结果在510k队列中，基于就诊即刻（T1时间点）评估的5-7项生命体征和人口学变量，基线AUC为0.69-0.73。加入就诊后1-3小时（T2时间点）的临床实验室变量（尤其是SeptiCyte RAPID）后，AUC提升至0.83-0.85。最终加入就诊后12-24小时（T3时间点）的微生物学数据后，AUC进一步改善至0.90-0.91。安达卢西亚队列获得相似结果：T1时间点仅基于生命体征和人口学变量的AUC=0.67；T2时间点基于生命体征+人口学+SeptiCyte RAPID±其他临床实验室数据的AUC=0.87；T3时间点基于生命体征+人口学+SeptiCyte RAPID±其他临床实验室数据+微生物学结果的AUC=0.93。两个队列中最显著的变量包括体温、平均动脉压、呼吸频率、疑似感染部位、SeptiCyte RAPID、降钙素原、确诊细菌感染及血培养阳性确认。结论随着人口学与生命体征数据补充临床实验室信息，并最终加入微生物培养结果，脓毒症识别准确性显著提升。最快改善发生在就诊后3小时内，此时实验室数据（尤其是SeptiCyte RAPID结果）可获取。将SeptiCyte RAPID快速宿主反应检测整合至基于时间的诊断框架中，可增强脓毒症早期识别、改善抗菌药物管理，并支持指南驱动的临床决策。
“结扎意外”：澳大利亚输精管切除术与生育率的回顾性研究	Janetzki, J.	2026-06-06	PDF	背景近几十年来，澳大利亚生育率持续下降，2024年总和生育率降至每名妇女1.48胎的历史最低水平。与此同时，输精管结扎术作为永久性避孕选择仍广泛可及且日益常态化。尽管关于生育率下降的评论众多，但尚无当代澳大利亚研究考察输精管结扎率与生育率随时间变化的相对关系。本研究旨在比较澳大利亚各辖区及年龄组的人群输精管结扎率与生育率。研究设计全国性回顾性时间序列研究。基于医疗保险福利计划项目37623的回顾性人群研究，识别2015年7月至2024年12月期间实施的输精管结扎手术。使用澳大利亚统计局季度人口估计值计算每10万男性人口的比率，并汇总为滚动12个月平均值。生育率采用匹配的澳大利亚统计局数据，按相同年龄分层（18-24岁、25-34岁、35-44岁）计算女性生育率。结果全国输精管结扎率从2016年的每10万人32例上升至2023年的每10万人55例，2024年略有下降。同期生育率从每10万人5200例降至3800例。各州及年龄组趋势一致，其中35-44岁男性输精管结扎率增幅最大。结论澳大利亚正经历输精管结扎率上升与生育率下降并存的人口结构转变。尽管输精管结扎率仍低于生育率，但两者趋同表明生育意愿和避孕行为正在改变。持续监测永久性和长效避孕措施对理解人口动态演变及制定生殖健康政策至关重要。
一项关于保护易感人群在感染SARS-CoV-2后免于患病、住院或死亡的替代疫苗接种策略比较：一项元种群建模研究	Feng, Z.	2026-06-06	PDF	背景：美国疫苗接种政策制定者最初优先考虑医护人员、其他一线关键岗位工作者以及重症COVID-19风险最高的人群。保护作用既可通过降低暴露后的感染易感性实现直接保护，也可通过为他人接种疫苗降低暴露风险实现间接保护。方法：我们在已发表的SARS-CoV-2传播模型基础上，纳入免疫调节疾病机制，更新部分参数并引入时变参数。随后推导了亚群再生数及相关分析量值，比较了2020年12月14日疫苗接种启动至2024年5月11日公共卫生紧急状态结束期间，直接与间接保护高危人群的各自影响。结果：在2021-22学年学校复课前，青少年（尤其是青少年群体）的核衣壳蛋白抗体阳性率高于成年人，但其疫苗接种进度远落后于老年人（尤其在奥密克戎流行时期），且造成更多感染。尽管如此，我们发现：虽然以降低传播为目标的疫苗接种策略能避免更多感染，但实际实施的疫苗接种策略避免了更多疾病、住院和死亡。解释：由于重症COVID-19存在年龄依赖性（这正是政策设计所要缓解的问题），为老年人接种疫苗比接种可能感染他们的年轻人更有效。若与现有证据相反，疫苗效力或疫苗诱导免疫持续时间与年龄呈负相关，则该结论不成立。
基于宏转录组学的疾病风险评分作为预防、诊断和治疗支持工具	Hu, L.	2026-06-06	PDF	背景：慢性疾病及症状综合征常由长期生物学变化发展而来，这些变化可能早于正式诊断。基于RNA的宏转录组学可捕获活跃的微生物和人类基因表达，为疾病风险评估提供功能层面的信息。为弥合这一转化缺口，我们开发并验证了疾病风险评分（DRS）框架，该框架整合了粪便、唾液和血液样本中宏转录组衍生的通路活性评分，并评估其作为辅助风险评估工具的潜在临床实用性。方法：DRS使用疾病特异性通路活性评分集，这些评分源自粪便和唾液微生物功能、粪便和唾液微生物分类群以及血液人类基因表达。针对每种疾病，通过评分水平比值比、统计显著性及文献支持的生物学相关性，将“非最优”通路评分汇总为标准化累积比值比（cOR），该过程基于由22,369名个体组成的开发队列。cOR≥5定义为高风险。在由15,908名个体组成的独立验证队列中，以自我报告疾病为参照评估性能。疾病支持需同时满足自我报告与未报告组间cOR显著分离（Cohen's d≥0.2）以及高风险个体中自我报告疾病的风险比富集（风险比95%置信区间>1）。结果：在初始评估的20种疾病中，15种在独立验证队列中达到预设验证标准：注意缺陷多动障碍、焦虑症、慢性疲劳综合征、抑郁症、胃食管反流病、高血压、炎症性肠病、腹泻型肠易激综合征、便秘型肠易激综合征、失眠症、代谢相关脂肪性肝病、肥胖症、阻塞性睡眠呼吸暂停、干燥综合征及2型糖尿病。五个临床场景示例展示了DRS如何辅助临床决策，包括肠易激综合征亚型重新分类、改善腹泻型肠易激综合征诊断接受度、代谢相关脂肪性肝病及早期2型糖尿病的个性化生活方式指导，以及非典型胃食管反流病的诊断不确定性。结论：DRS是基于宏转录组学的风险分层框架，可将活跃的微生物和人类通路信号整合为可解释的疾病特异性风险估计值，覆盖多种疾病状态。在独立队列中针对自我报告疾病标签的验证显示，15种疾病均存在显著风险富集。DRS旨在作为临床评估的辅助工具：在常规诊疗面临不确定性、延迟或患者参与度低的情况下提供决策支持。未来需开展使用临床判定终点的前瞻性研究以评估校准效果及临床结局。
左旋多巴治疗对伴有轻度帕金森体征的老年人步态的影响	Pongmala, C.	2026-06-06	PDF	背景伴有轻度帕金森征象（MPS）的老年人步态缓慢是一种复杂的多因素现象，源于亚临床年龄相关病理的累积负担。这种衰退反映了多巴胺能系统中与年龄相关的神经元损失。近期一项研究表明，左旋多巴治疗可能改善步态参数。本小型初步研究旨在探索左旋多巴治疗对伴有MPS的老年人步态缓慢的影响。方法本研究是一项随机、安慰剂对照的临床初步试验。招募无临床帕金森病证据的步态缓慢老年人，并随机分为两组（活性治疗组或安慰剂对照组）。活性组参与者先接受卡比多巴预处理三天，随后接受卡比多巴-左旋多巴治疗七天。在基线及干预后评估时空步态参数。结果步态因子分析识别出三个主要因子，解释了基线时的步态特征，包括步态效率、步态节律性和步态转向。安慰剂组未观察到治疗效应（p=0.111，p=0.616），安慰剂组与活性组在基线时无组间差异（β=0.310，p=0.547），但活性治疗组显示出治疗相关增加的强烈趋势（β=0.506，p=0.076）。结论我们的初步数据表明，在伴有MPS的步态缓慢老年人中，持续一周的左旋多巴治疗联合卡比多巴预处理及伴随卡比多巴补充是可行的。此外，数据提示潜在疗效，显示步频和步幅持续时间有所改善。
基于MIMIC-IV-WDB v0.1.0中三种光电容积描记法衍生微血管反应性信号的AI辅助可行性评估	Landry, T. C.	2026-06-06	PDF	背景。毛细血管再充盈时间是一项依赖检查者的床旁远端微循环灌注评估指标，已成为脓毒性休克的复苏目标[1,2,3,4]，这促使研究者从光电容积描记图（PPG，即每例ICU患者监护仪已记录的光学波形）中计算连续替代指标[5,6,7,8]。目的。我们尝试在MIMIC-IV波形数据库（MIMIC-IV-WDB v0.1.0）中提取三种基于PPG的候选指标，并通过检查随机抽取的样本，在开展下游建模前验证各指标是否反映其预期生理学意义。方法。将MIMIC-IV-WDB v0.1.0[9]与MIMIC-IV[10]关联。信号包括：袖带锚定的灌注指数恢复（袖带与探头同侧肢体时的反应性充血）、灌注指数的慢速Mayer波频带功率比（交感血管舒缩张力）、以及每搏舒张期指数衰减时间常数（类似再充盈的恢复时间）。对每个信号，我们以固定随机种子抽取10个随机样本，并对照预先设定的检查表进行验证。由作者及本地运行的多模态医学语言模型MedGemma 1.5分别判读。通过已知时间常数的合成测试验证第三个信号。结果。袖带锚定信号在19例患者中15例的6236个可评估袖带周期中，268个周期（4.30%）呈现预期的闭塞-再灌注形态，这与探头和袖带置于对侧肢体的操作一致。慢速频带比呈现稳定的队列数值，但仅4/10的随机窗口出现清晰的稳态峰值。每搏拟合在10/10的心搏中达到拟合优度阈值，但心搏频率启发式算法提示7/10的心搏可能存在心率振荡拟合，且在17例患者中5例的时间常数处于指数曲线与直线无法区分的区间。0.5Hz高通预滤波器植入约318毫秒的固有时间常数，与真实值无关。语言模型在明确阳性样本中与人类判读一致，但每次调用均报告"模式存在"，从未报告"模式缺失"。结论。三个候选信号中有两个在多数样本中未能反映预期生理学意义，第三个受限于传感器放置位置。在基于PPG的微循环信号下游推断前，通过预先设定的检查表随机检查原始输入是一种低成本的上游验证方法。
从负担图表到工作流信号：ICU复杂性与长期住院风险的文档密度指标回顾性验证	Collier, A.	2026-06-06	PDF	背景电子健康记录文档记录模式可能反映重症监护环境中的工作流程复杂性、监测强度及运营压力。然而，文档衍生特征可能对本地文档记录文化、数据采集系统及结局定义敏感。因此，在将这些信号用于工作流智能或临床人工智能治理工具前，需进行跨数据集回顾性验证。目的评估文档密度与文档时间特征是否能在去标识化重症监护数据集中，对ICU工作流复杂性与长期住院代理结局展现出可复现的回顾性信号，同时区分工作流与长期住院关联性，避免对死亡率预测、负担减轻或部署就绪性提出无依据的主张。方法我们综合了通过预设文档密度验证项目生成的去标识化ICU及工作流数据集的回顾性验证结果。特征族包括文档负担评分风格特征、班次末文档记录率风格特征、文档可靠性风格元数据及可用时的全文档特征集。结局包括ICU长期住院代理指标、可用时的死亡率及工作流代理终点。模型对比了基线特征集与包含文档密度或工作流特征的增强模型。性能通过受试者工作特征曲线下面积、报告时的布里尔分数、AUROC差值、报告时的自助法置信区间及可用时的标签洗牌对照进行总结。结果最强的外部长期住院代理证据来自NWICU图表事件分析，包含28,612次ICU住院、20,267次有图表事件的住院及9,619,759个图表事件。对于ICU住院时间大于中位数的情况，基线AUROC为0.5252。增强AUROC在文档负担评分特征中为0.9512，班次末文档记录率特征中为0.9214，文档可靠性风格特征中为0.8470，全文档特征中为0.9517。对应的标签洗牌增强AUROC接近随机，范围从0.4897到0.5064。对于ICU住院时间大于第75百分位数的情况，基线AUROC为0.5155。增强AUROC在文档负担评分特征中为0.9433，班次末文档记录率特征中为0.9194，文档可靠性风格特征中为0.8118，全文档特征中为0.9427，标签洗牌增强AUROC范围从0.4836到0.4999。在eICU工作流分析、HiRID首24小时文档密度分析、MIMIC-IV HF ICU内部分析、MIMIC-IV-Note元数据扩展及护理图表或实验室密度代理分析中观察到额外回顾性支持。然而，未经重新校准的跨机构判别迁移能力较弱，且多项分析仍为代理验证而非最终临床验证。结论文档密度与文档时间特征在ICU工作流复杂性与长期住院代理结局方面展现出有前景的回顾性信号，尤其在NWICU图表事件及特定内部数据集分析中。这些发现支持进一步预先注册的前瞻性静默模式验证文档衍生工作流智能。它们并未确立前瞻性临床性能、死亡率降低、临床医生负担减轻、自主恶化预测或部署就绪性。
BodyMAE：一种面向体表面积感知的掩码自编码器，用于从3D人体扫描中估计身体成分	Zheng, Y.	2026-06-06	PDF	准确评估身体成分对于代谢、肌肉骨骼及衰老相关疾病的风险分层和管理至关重要，但双能X射线吸收测定法（DXA）等参考方法成本高昂且不便于频繁监测。商用3D身体扫描提供了一种低成本、无辐射的替代方案，但由于点密度不均匀、体型差异大以及设备间差异，从扫描中提取有意义的预测性形状特征仍具挑战性。我们提出BodyMAE，一种面向公制尺度3D身体扫描的自监督、表面积感知掩码自编码器。该流程整合了面积调整采样、长距离聚焦编码器以及轻量级解码器（通过正则化促进局部均匀重建）。在917对配对3D身体扫描与临床DXA报告的训练和评估中，BodyMAE在体脂率（均方根误差3.825个百分点，R² 0.908）、脂肪量（均方根误差3.694千克，R² 0.968）和瘦体重（均方根误差3.608千克，R² 0.901）上实现了高精度，在骨矿物质含量（均方根误差0.284千克，R² 0.754）上表现具有竞争力。我们还评估了预训练基线间的特征稳定性，发现我们的表示具有更高的检索准确率（Top-1 90.131%）。这些结果表明，结合公制感知采样、长距离关系编码和局部几何正则化，能够从3D身体扫描中准确估计身体成分，并通过与DXA测量值的比较得到验证。
超越注入检测：一种正向安全提示防火墙，可弥补医疗领域SOTA分类器遗漏的范围和PHI缺口	Schwoebel, J.	2026-06-06	PDF	嵌入自主智能体的大语言模型在同一上下文窗口中处理可信指令与不可信数据，使其面临直接和间接提示注入攻击。在医疗领域这并非假设：2025年《JAMA Network Open》研究发现，商业医疗大语言模型在94.4%的模拟患者交互中遵循了注入指令，包括危及生命的建议。但我们在此量化的临床决定性问题是不同的。大多数真实临床威胁——受保护健康信息（PHI）外泄、跨患者访问、批量导出、超出范围建议——都是流畅、合法的请求，不携带任何攻击信号，因此即使最先进的注入检测器也会放过它们。现有运行时防护栏在安全性与延迟之间权衡：基于模型的审计器准确但增加数百毫秒的Python推理时间，而词法过滤器快速但对混淆或语义伪装的有效载荷视而不见。我们提出QFIRE，一个内联、供应商无关的提示防火墙，实现为单一自包含的Rust工具链代理、CLI和基准测试工具。QFIRE结合三种机制：(i) 正向安全范围约束，将模型调用限制在声明的自然语言目的内，并阻止超出范围的漂移，即使没有明显的攻击令牌；(ii) 异步检测器图，并行运行N条规则及其检测节点，最便宜的检查优先；(iii) 反混淆处理，在检测前解码Base64、十六进制、ROT13，折叠同形字和Leetspeak，并剥离零宽字符。QFIRE附带106条版本化的防火墙规则和专用的HIPAA安全港18标识符PHI面板，并通过嵌入式ONNX Runtime运行本地DeBERTa v3注入分类器。在1968个公开提示注入和越狱提示上，QFIRE的确定性混合方法达到F1 0.86，与Meta最先进的PromptGuard 2的0.86统计持平，高于protectai DeBERTa v3的0.83；词法基线落后0.16至0.50。我们的核心结果在QFIRE HealthBench上，这是一个我们构建并发布的新2000提示医疗基准，包含真实的garak和Microsoft PyRIT有效载荷。在那里，相同的PromptGuard-2仅恢复0.40召回率，DeBERTa v3为0.57，因为大多数临床威胁不携带注入信号；QFIRE的组合范围加PHI链在0.08校准假阳性率下达到0.83召回率和F1 0.87。因此，通用注入检测（即使是最先进的）对于医疗智能体是必要但不充分的。裸大语言模型评判器也缩小了大部分静态语料库差距（F1 0.90）；QFIRE在静态准确性之外的贡献是可审计的确定性、有界延迟和自适应鲁棒性，而裸评判器在5.5节中降至34%至59%的召回率。端到端地，将QFIRE放置在模拟EHR沙箱上使用工具的智能体前，可将智能体的有害动作率从0.38降至0.00，同时带来0.13的良性效用成本。所有代码、规则、语料库快照和脚本均已发布，每个表格均可通过单个make paper目标针对本地模型重新生成，无需付费API密钥。