2026-05-16 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
EntityBench：面向实体一致的长程多镜头视频生成	Ruozhen He	2026-05-14	PDF	多镜头视频生成将单镜头生成扩展为连贯的视觉叙事，但在长序列中保持角色、物体和场景的一致性仍是挑战。现有评估通常使用独立生成的提示集，实体覆盖有限且一致性指标简单，难以进行标准化比较。我们提出EntityBench基准，包含源自真实叙事媒体的140个片段（2,491个镜头），提供显式的逐镜头实体调度表，同步追踪角色、物体和场景，覆盖简单/中等/困难三个层级，最多包含50个镜头、13个跨镜头角色、8个跨镜头场景、22个跨镜头物体，以及跨度达48个镜头的重现间隔。配套的三支柱评估体系解构了镜头内质量、提示遵循对齐度和跨镜头一致性，并设置保真度门控，仅将准确的实体外观纳入跨镜头评分。作为基线方法，我们提出EntityMem记忆增强生成系统，在生成开始前将已验证的逐实体视觉参考存储于持久记忆库中。实验表明，现有方法中跨镜头实体一致性随重现距离急剧下降，而显式的逐实体记忆在评估方法中实现了最高的角色保真度（Cohen's d = +2.33）和存在率。代码与数据见https://github.com/Catherine-R-He/EntityBench/。
ATLAS：主动式还是潜在视觉推理？一个词足以涵盖两者。	Ziyu Guo	2026-05-14	PDF	视觉推理常与中间视觉状态交织，已成为该领域颇具前景的研究方向。一种直接方法是在推理过程中通过统一模型直接生成图像，但这种方式计算成本高昂且架构实现复杂。近期替代方案包括通过代码或工具调用的智能体推理，以及使用可学习隐层嵌入的潜在推理。然而，智能体方法因外部执行导致上下文切换延迟，而潜在方法缺乏任务泛化能力且难以通过自回归并行化训练。为融合两者优势并规避局限，我们提出ATLAS框架——将单个离散"词"（称为功能标记）同时作为智能体操作单元和潜在视觉推理单元。每个功能标记关联内化的视觉操作，既无需视觉监督，又是分词器词汇表中的标准标记，可通过下一标记预测生成。这种设计避免了冗长的中间视觉内容生成，同时保持与标准可扩展SFT和RL训练的兼容性，无需修改架构或方法论。针对强化学习中功能标记稀疏性问题，我们引入潜在锚定GRPO（LA-GRPO），通过静态加权辅助目标锚定功能标记以稳定训练，提供更强的梯度更新。大量实验与分析表明，ATLAS在保持清晰可解释性的同时，在挑战性基准测试中取得卓越性能。我们期待ATLAS能为未来视觉推理研究提供新范式。
RefDecoder：通过条件视频解码增强视觉生成	Xiang Fan	2026-05-14	PDF	视频生成支撑着大量下游应用。然而，当前事实上的标准——即潜在扩散模型——通常采用强条件去噪网络，但其解码器往往保持无条件状态。我们观察到这种架构不对称性会导致细节显著丢失，且与输入图像的一致性降低。为解决此问题，我们认为解码器需要同等条件化以保持结构完整性。我们提出RefDecoder，一种参考条件化的视频VAE解码器，通过参考注意力机制将高保真参考图像信号直接注入解码过程。具体而言，轻量级图像编码器将参考帧映射为富含细节的高维令牌，这些令牌在每个解码器上采样阶段与去噪后的视频潜在令牌协同处理。我们在多个不同解码器骨干网络（如Wan 2.1和VideoVAE+）上验证了持续改进效果，在Inter4K、WebVid和Large Motion重建基准测试中，相比无条件基线实现了最高+2.1dB的PSNR提升。值得注意的是，RefDecoder可直接替换现有视频生成系统而无需额外微调，我们在VBench I2V基准测试中报告了主体一致性、背景一致性和整体质量分数的全面改进。除图像到视频生成外，RefDecoder还能良好泛化至风格迁移、视频编辑优化等广泛视觉生成任务。
VGGT-$Ω$	Jianyuan Wang	2026-05-14	PDF	近期，诸如VGGT等前馈重建模型已被证明与传统基于优化的重建方法具有竞争力，同时还能提供对其他任务有用的几何感知特征。在此，我们证明这些模型的质量会随模型和数据规模的扩大而可预测地提升。为此，我们引入了VGGT-Ω，该模型在静态和动态场景的重建精度、效率及能力方面均有显著提升。为了以前所未有的规模训练该模型，我们引入了提升训练效率的架构改进、支持动态场景的高质量数据标注流程，以及一种自监督学习协议。我们通过使用单一密集预测头配合多任务监督，并移除高分辨率卷积层，简化了VGGT的架构。同时，我们利用寄存器将场景信息聚合为紧凑表示，并引入寄存器注意力机制，将帧间信息交换限制在这些寄存器内，部分替代了全局注意力。通过这种方式，在训练过程中，VGGT-Ω的GPU内存消耗仅为前代模型的约30%，使我们能够使用比先前工作多15倍的监督数据进行训练，并利用大量未标注视频数据。VGGT-Ω在多个基准测试中针对静态和动态场景的重建取得了优异成果，例如在Sintel数据集上，相机估计精度较此前最佳结果提升了77%。我们还展示了学习到的寄存器能够改进视觉-语言-动作模型，并支持与语言的对齐，这表明重建可以成为空间理解中一种强大且可扩展的代理任务。项目页面：http://vggt-omega.github.io/
对齐潜在几何以实现图像生成中的球形流匹配	Tuna Han Salih Meral	2026-05-14	PDF	图像生成的潜在流匹配通常沿线性路径将高斯噪声传输到变分自编码器的潜在表示。然而，两个端点的分布都集中在薄球壳上，即使预处理对齐了半径，欧几里得弦仍会偏离这些球壳。通过将每个潜在令牌分解为径向分量和角度分量，我们通过分量交换探针实验证明，解码后的感知和语义内容主要由方向承载，半径的贡献微乎其微。因此，我们将数据潜在表示投影到固定令牌半径上，将高斯噪声的径向投影作为球形先验，在冻结编码器的条件下微调解码器，并用球面线性插值替代线性插值。由此得到的测地路径在每个时间步都保持在球面上，其速度目标在构造上纯属角度变化。在匹配训练条件下，该方法在不同图像分词器上持续改善类别条件ImageNet-256的FID指标，不改变扩散架构，且无需辅助编码器或表征对齐目标。
RAVEN：基于一致性模型GRPO的实时自回归视频外推	Yanzuo Lu	2026-05-14	PDF	因果自回归视频扩散模型通过从已生成内容外推未来片段，支持实时流式生成。从高保真双向教师模型中蒸馏此类生成器，可得到具有竞争力的少步模型，但训练过程中遇到的历史分布与推理时出现的历史分布之间存在持续差距，限制了长时域上的生成质量。我们提出实时自回归视频外推网络（RAVEN），这是一种训练时测试框架，将每次自展开重新打包成交替的干净历史端点序列与含噪去噪状态序列。这种公式使训练注意力与推理时外推对齐，并允许下游片段损失监督未来预测所依赖的历史表示。我们进一步提出一致性模型组相对策略优化（CM-GRPO），将一致性采样步骤重新表述为条件高斯转移，并直接对该核应用在线强化学习（RL），避免了先前流模型RL公式中采用的欧拉-丸山辅助过程。实验表明，RAVEN在质量、语义和动态程度评估上均超越近期因果视频蒸馏基线，且CM-GRPO与RAVEN结合时可提供进一步增益。
FutureSim：重演世界事件以评估自适应智能体	Shashwat Goel	2026-05-14	PDF	AI智能体正越来越多地被部署在动态、开放式的环境中，这类环境要求它们能够根据实时到达的新信息进行适应。为了在现实场景中有效衡量这一能力，我们提出构建基于真实世界的模拟系统，按事件发生的顺序重放真实世界事件。我们开发了FutureSim系统，在该系统中，智能体在与其知识截止日期之后的世界事件进行交互时，需要预测这些事件——系统会按模拟时间顺序呈现真实新闻文章，并在模拟周期内逐步揭晓问题答案。我们对前沿智能体在其原生测试框架中进行评估，测试其预测2026年1月至3月三个月内世界事件的能力。FutureSim揭示了智能体能力的显著差异：表现最佳的智能体准确率仅为25%，而许多智能体的Brier技能得分甚至低于完全不进行预测的基准水平。通过细致的消融实验，我们展示了FutureSim如何为研究长期测试时适应、搜索、记忆及不确定性推理等新兴研究方向提供现实场景。总体而言，我们希望这一基准设计能够为衡量AI在真实世界长期开放式适应方面的进展铺平道路。
Articraft：一种用于可扩展铰接式3D资产生成的智能体系统	Matt Zhou	2026-05-14	PDF	学习理解可动3D物体的一个瓶颈是缺乏大规模且多样化的数据集。本文提出利用大型语言模型（LLMs）来弥补这一缺口，实现可动资产的大规模生成。我们将生成可动3D资产的问题简化为编写构建该资产的程序。随后引入新型智能体系统Articraft，该系统能自动编写此类程序。我们设计了程序化接口与工具框架，帮助LLM高效完成这一任务。LLM需针对领域特定SDK编写代码，以定义部件、组合几何体、指定关节，并编写测试来验证生成的资产。工具框架为LLM提供受限的工作空间与接口，验证生成的资产并返回结构化反馈。通过这种方式，LLM无需关注编写URDF文件或管理复杂软件环境等细节。实验表明，该方法生成的资产质量优于现有最先进的可动资产生成器及通用编程智能体。利用Articraft，我们构建了涵盖245个类别、超过1万个可动资产的精选数据集Articraft-10K，并展示了其在可动资产模型训练及机器人仿真、虚拟现实等下游应用中的实用价值。
VGGT-Edit：基于残差场预测的前馈式原生3D场景编辑	Kaixin Zhu	2026-05-14	PDF	高质量3D场景重建近期已向可泛化的前馈架构发展，使得单次前向传播即可生成复杂环境。然而，尽管这些模型在静态场景感知中表现优异，其响应动态人类指令的能力仍十分有限，这限制了它们在交互式应用中的使用。现有编辑方法通常依赖2D提升策略——独立编辑各视角后将其提升回3D空间。这种间接流程常导致纹理模糊和几何不一致，因为2D编辑器缺乏跨视角保持结构所需的空间感知能力。为解决这些局限，我们提出VGGT-Edit——一种用于文本条件原生3D场景编辑的前馈框架。VGGT-Edit引入深度同步文本注入，将语义引导与骨干网络的空间姿态对齐，确保指令的稳定锚定。该语义信号随后由残差变换头处理，直接预测3D几何位移以变形场景，同时保持背景稳定性。为确保高保真结果，我们采用包含几何精度与跨视角一致性约束的多项目标函数监督该框架。我们还构建了DeltaScene数据集——通过自动流水线生成的大规模数据集，并采用3D一致性过滤确保真值质量。实验表明，VGGT-Edit显著优于2D提升基线方法，可生成更锐利的物体细节、更强的多视角一致性，并实现近乎即时的推理速度。
几何一致性定量视频世界模型评估	Jiaxin Wu	2026-05-14	PDF	生成式视频模型正越来越多地被研究作为隐式世界模型，但评估它们是否产生物理上合理的3D结构和运动仍具挑战性。现有的大多数视频评估流程严重依赖人工判断或学习型评分器，这些方法具有主观性且对几何失效的诊断能力较弱。我们提出PDI-Bench（透视畸变指数），一个用于审计生成视频几何一致性的量化框架。对于给定的生成片段，我们通过分割和点跟踪（如SAM 2、MegaSaM和CoTracker3）获取以物体为中心的观测，通过单目重建将其提升至3D世界空间坐标，并计算一组投影几何残差以捕捉三个失效维度：尺度-深度对齐、3D运动一致性和3D结构刚性。为支持系统性评估，我们构建了PDI-Dataset，涵盖旨在挑战这些几何约束的多样化场景。在现有最先进的视频生成器中，PDI揭示了常见感知指标无法捕捉的、几何特定的失效模式，并为迈向物理基础视频生成和物理世界模型提供了诊断信号。我们的代码和数据集可在https://pdi-bench.github.io/获取。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
锥体细胞特异性的半球不对称性塑造了静息和探索行为期间背腹侧CA1的动态活动。	Kim, C. S.	2026-05-16	PDF	海马体沿背-腹轴和左右轴组织，但这两个轴是否以及如何在特定神经元群体中跨行为状态相互作用仍不清楚。本研究结合脑片电生理与双位点光纤光度法，在表达CaMKII-jGCaMP8s和SynI-jRCaMP1b于不同纵向位点的小鼠中，比较了对侧半球配置下背侧与腹侧CA1区的活动。腹侧CA1锥体神经元表现出比背侧CA1神经元更高的内在兴奋性和更强的AMPA受体介导的突触反应。在体实验中，家笼休息期间CaMKII定义的锥体神经元记录显示，背侧CA1（而非腹侧CA1）存在左偏事件率不对称性，而全神经元SynI记录中未发现类似不对称性。因此，自发性事件率的表观背-腹差异具有配置依赖性，并归结为局限于CaMKII定义群体的半球特异性细胞类型效应。超前滞后分析表明，背-腹侧时间协调同样随配置重组，且局限于锥体细胞偏向记录。在旷场中心进入事件中，两种配置下背侧CA1均在进入前优先被募集，而非协调性进入则显示对侧腹侧CA1在进入后相对抑制。综上，这些发现表明背-腹侧CA1组织不能从半球合并设计中推断，并确定左背侧CA1锥体细胞特异性不对称是塑造海马纵轴自发性活动与行为驱动募集的固有结构特征。
目标导向行为初始学习过程中丘脑核团的快速连接变化	Jarrett, C.	2026-05-16	PDF	丘脑对学习至关重要，在学习过程中会动态地与皮层下及大脑皮层区域互动。在此过程中，丘脑作为丘脑皮层系统中的关键连接枢纽和同步器发挥作用。然而，尽管高阶丘脑核团已知对这一过程特别重要，但单个高阶和一级丘脑核团的具体贡献，以及它们与皮层网络和皮层下区域的个体参与情况，在学习初始阶段仍未被探索。基于此，我们分析了在旨在研究反馈驱动刺激-反应学习中初始学习过程的范式下获取的功能性磁共振成像数据，以探索丘脑的贡献。我们研究了不同丘脑核团与其他皮层下区域及皮层网络之间与学习相关的动态功能连接变化。结果显示，学习初始阶段与以下变化相关：（1）丘脑核团与额顶叶及扣带-岛盖网络之间的功能连接减弱，（2）丘脑核团与默认模式及显著性网络之间的功能连接增强，（3）丘脑核团与壳核之间的功能连接减弱，以及（4）高阶丘脑核团之间的功能连接减弱。此外，（5）这些动态变化主要由丘脑背内侧核驱动。总体而言，这些结果表明高阶丘脑核团在初始学习及产生新颖目标导向行为中发挥关键作用。这通过增强与驱动目标导向行为的特定皮层网络的功能连接，以及减弱与驱动运动选择性的纹状体区域的功能连接得以体现。
关系生物学结构在弱信号下改进了因果GWAS变异体的精细定位。	Estaji, E.	2026-05-16	PDF	连锁不平衡（LD）使得GWAS因果变异与相关邻近变异难以区分；解决这一问题即精细定位问题，且挑战具有物种特异性：人类面临密集且祖先来源不平衡的LD，酵母和拟南芥存在异常长的LD，而作物种质资源的注释稀疏且碎片化，导致人类生物样本库的整理流程失效。贝叶斯精细定位方法将注释作为平坦的逐变异先验纳入模型，却丢弃了连接变异与组织特异性eQTL、通路及蛋白质-蛋白质相互作用的关系结构。在变异-基因-通路因子图上运行的层次置信传播（HBP）以5-40倍速度达到贝叶斯基线水平；其注释自适应补充版本——图增强精细定位（GAFM）——在弱信号条件下以27:2的优势超越SuSiE，并在泛英国生物样本库四个祖先群体中以单变异分辨率成功定位LDLR、APOE、LPL、GCKR和ANGPTL3。在3000份水稻基因组粒重+粒形数据集中，基于混合先验的后验重加权GAFM/HBP及其集成方法（GAFM-MX、HBP-MX、ENS）对21个与数据集匹配的稳定QTN实现了47.6%的精确位置恢复率（top-1-PIP），为所有方法中最高，超过SuSiE（28.6%）和SBayesRC（14.3%），且每个位点的计算速度是SuSiE的200-700倍。在四个物种的692个先导变异中，非均匀的逐变异先验（而非均匀高覆盖度）使图结构能够打破LD关联：在原本均匀的人类缓存中添加调控元件标记后，HBP在321个泛UKB先导变异上的窄区间定位比例从0%跃升至88%（优于GAFM）。这些结果将多组学精细定位重新定义为非均匀先验整理问题而非均匀覆盖问题，并将GWAS后分析重构为基于生物结构的消息传递而非扁平注释的加权回归。
昼夜节律钟编程的预期性抗病毒免疫调控肠道病毒感染易感性	Oshinowo, T. O.	2026-05-16	PDF	病毒感染易感性差异显著，但遗传、免疫状态或暴露水平无法完全解释这一现象。本研究发现，感染时间对感染结局具有决定性影响，肠道病毒载量可因感染时间不同产生高达100倍的差异。在缺乏功能性生物钟的小鼠中，这种时间依赖性调控完全消失。我们证实抗病毒转录因子IRF1是昼夜节律转录因子BMAL1的直接靶标，从而在感染前形成基础抗病毒基因程序的节律性表达。IRF1缺失会消除该程序，并导致病毒复制的时间依赖性差异消失。该调控回路在肠道髓系细胞中运作，建立预先存在的抗病毒状态。这些发现表明，生物钟在感染发生前即已编程宿主肠道的易感性。
过氧化氢以定位和p53依赖的方式诱导对DNA损伤的抵抗。	Keijer, J. P.	2026-05-16	PDF	生物体需要能够适应不断变化的环境才能生存。低剂量应激源引发的适应性反应使生物体对该应激源的高剂量产生抗性，这种现象被称为毒物兴奋效应，甚至可延长生物体的寿命。尽管多项研究认为线粒体衍生的活性氧（ROS，如H2O2）是重要因素，但应激诱导毒物兴奋效应的确切机制尚不明确。本研究采用化学遗传学H2O2生成模型，以定位依赖性方式研究ROS依赖性适应性反应。我们发现，在核小体处短暂、亚致死水平的H2O2生成可提供p53依赖性的保护，使细胞抵抗后续高剂量H2O2的损伤，而令人惊讶的是，线粒体H2O2生成并未产生此效果。多组学分析揭示，p53诱导的毒物兴奋效应伴随着代谢重编程，增强了还原能力，且这种增强的应激抗性主要归因于其下游靶点p21。重要的是，短暂稳定p53还能增强对化疗诱导DNA损伤的防护能力，这表明p53依赖性毒物兴奋效应可被用于在治疗p53突变肿瘤患者时，选择性保护健康的p53野生型组织免受化疗损伤。
整合预测的栖息地变化与现有种群趋势，以优先保护、监测和研究印度鸟类。	Diengdoh, V. L.	2026-05-16	PDF	理解物种对全球变化的脆弱性，需要将未来环境变化预测与经验种群趋势相结合的方法；在生物多样性丰富但数据有限的的热带地区，这类综合评估仍然有限。本研究开发并应用了一种可扩展、面向决策的框架，将气候与土地覆盖预测与现有当代种群数据相结合，以评估印度鸟类在物种层面的脆弱性及保护、监测和研究优先事项。通过集成机器学习栖息地适宜性模型，我们预测了955个物种在当前及2100年两种情景（SSP3-7.0和SSP5-8.5）下的栖息地适宜性。随后将这些预测与印度鸟类状况评估中的种群趋势相结合。研究发现栖息地响应高度异质：507个物种在两种未来情景下均预测将失去适宜栖息地，327个物种预测将获得栖息地，121个物种呈现混合或不确定响应。预测变化的方向和幅度在栖息地特化类群内部及之间差异显著，总体损失超过增益。栖息地预测与种群趋势的综合分析显示，121个（主要为湿地）物种面临持续种群下降和未来栖息地丧失，构成需立即采取保护行动的高优先级目标。另有300个主要为森林关联的物种预测将失去栖息地，但缺乏可靠种群趋势数据，凸显重大监测缺口，而栖息地轨迹混合或不确定的物种成为关键研究重点。通过明确整合预测栖息地变化、当代种群轨迹和数据可用性，本研究推进了在加速全球变化下优先开展保护行动、监测和研究的可迁移框架。
有害突变、显性效应和基因流对结构化种群中连锁中性变异的联合影响	Lesturgie, P.	2026-05-16	PDF	大多数物种在地理上具有结构分布，并在基因组中性区域留下特征性信号。当中性区域与有害突变连锁时，这些信号可能发生扭曲。在此类区域中，纯化选择可通过背景选择（BGS）降低遗传多样性，或对于隐性突变通过关联超显性（AOD）增加多样性。尽管BGS和AOD在随机交配群体中的效应已得到充分表征，但其在结构化群体中的影响仍鲜有探索。本研究采用前向模拟方法，在迁移、选择、显性和重组参数范围内，基于隔离-迁移模型展开分析。我们首先通过基因型方法量化有害突变对标准汇总统计量（π、Dxy、FST、DAFi）的影响，随后证明基于祖先重组图的方法——通过追踪每个种群一个二倍体样本的树序列——在将遗传变异与潜在溯祖过程直接关联的同时，能复现相同模式。当重组率足够低时，我们发现弱共显性突变呈现BGS驱动模式，表现为多样性降低和遗传分化（FST）增加。对于隐性突变，我们首先识别出AOD驱动模式（多样性增加且FST降低），随后过渡至BGS驱动模式。谱系同样受有害突变影响：BGS缩短溯祖时间并促使谱系向谱系分选拓扑结构偏移，而AOD延长溯祖时间并促使谱系向不完全谱系分选拓扑结构偏移。基因流会削弱这些模式，使FST和拓扑结构接近中性预期，而多样性和溯祖时间对种群动态保持稳健。我们的研究为BGS、AOD及其在含基因流结构化模型中的过渡提供了明确证据。重要的是，这些过程在基因树上留下独特且可解释的信号，凸显了基于ARG的方法在推断结构化群体中连锁选择与显性效应方面的潜力。
雌性生殖液快速进化以优先选择同种精子。	Pinzoni, L.	2026-05-16	PDF	避免与遗传不兼容的配偶（无论是过于相似还是过于分化）受精，是有性生殖生物面临的核心挑战。自然选择可能偏好交配前和交配后的机制，而交配后过程可能弥补交配前选择的限制。在交配后情境中，雌性生殖液（FRF）能调节精子性能并影响受精结果，但其对生殖隔离的贡献尚不明确。我们以两种自然杂交的剑尾鱼姊妹种——Xiphophorus birchmanni 和 X. malinche（两者在针对异种个体的交配前行为上存在分化）为对象，检验了FRF是否介导对异种及近亲精子的排斥。FRF的作用在物种间差异显著：在X. malinche中，FRF增强了同种精子相对于异种精子的运动速度，这与交配后排斥杂交的机制一致；而在X. birchmanni中，FRF并未表现出对同种精子的偏好。近亲交配回避的证据较弱，且未发现对遗传相似与不相似精子的排斥之间存在权衡。这些结果表明，雌性生殖液可通过交配后雌性选择成为快速演化的生殖隔离轴。
无构象变化的别构进化：内部动力学驱动转录抑制因子超家族的功能多样化	Antelo, G. T.	2026-05-16	PDF	变构作用使蛋白质能够将环境信号与功能输出相耦合，然而变构机制在进化过程中如何实现多样化仍知之甚少。本研究通过整合信息论生物信息学、DNA识别的结构表征以及快速内部动力学的核磁共振测量，在广泛存在且功能多样的砷阻遏蛋白（ArsR）超家族中探讨了这一问题。我们鉴定出定义ArsR蛋白结构支架的保守残基，以及编码诱导物和DNA特异性的亚家族特异性位点。在过硫化物传感器SqrR中，DNA结合复合物的晶体结构揭示了操作子特异性如何由有限残基集编码，这与序列预测结果一致，并通过跨不同ArsR调控因子的体外转录实验进行了功能验证。我们进一步证明SqrR中DNA结合的变构抑制无需大规模构象重排，而是与内部动力学变化相关——这与此前在锌传感器CzrA中观察到的现象一致。综合这些结果支持一个模型：构象熵在保持变构连接性的同时放松了序列约束，从而推动了蛋白质超家族内的功能多样化。
药用植物荨麻（Urtica dioica）的基因组序列揭示了类黄酮代谢的遗传基础	Wolff, K.	2026-05-16	PDF	异株荨麻（Urtica dioica），又称刺荨麻，是一种广泛分布的植物，可指示土壤中高氮含量。它最广为人知的是触碰后引发的刺痛感。异株荨麻也被视为药用植物，有报道称其对多种疾病具有疗效。基于纳米孔长读长测序数据，我们构建了高度连续的基因组序列。总组装大小为1.1 Gbp，N50为40.7 Mbp。整合RNA-seq数据及其他物种的线索，完成了蛋白质编码基因的高质量注释。这一基因组资源使我们能够鉴定参与类黄酮生物合成的基因，其中重点关注花青素生物合成基因——这些基因对高光照和氮缺乏胁迫响应至关重要，叶片变红即为其表现。该基因组资源为未来研究刺荨麻中多种医学重要化合物的生物合成途径奠定了基础。

medRxiv

标题	作者	发布日期	PDF链接	摘要
模拟潜在猴痘疫情：对非流行地区疫情控制的影响	Cherian, P.	2026-05-16	PDF	我们以印度为例，构建了一个针对非流行性猴痘疫情在中低收入国家传播的模型。通过灵活基于智能体的模拟框架BharatSim，模拟了潜在的疫情暴发场景。模型假设猴痘主要通过男男性行为者（MSM）子网络中的性接触传播，该子网络嵌入在包含家庭和工作场所接触的更大社交网络中。我们的模型允许疾病通过这一扩展网络传播，包括异性性传播的可能性。我们量化了疫情规模、MSM子网络内外的感染动态，以及疫苗接种和预防措施对遏制疾病传播的影响。这些结果将为中低收入国家（LMIC）猴痘防控的规划与政策制定提供参考依据。
隐私保护下的本地语言模型能准确识别电子心理健康记录中自伤行为的存在及其发生时间。	Kormilitzin, A.	2026-05-16	PDF	背景：自伤，定义为不论动机如何的故意自我伤害或自我中毒，是自杀最强的风险因素，也是精神卫生保健的重要结局指标。尽管在临床人群中高度流行，但在常规收集的临床数据中往往难以精确捕捉，通常以非结构化的自由文本格式记录和存储。当代语言模型，如GPT（OpenAI）、Gemini（Google）和Claude（Anthropic），能够分析自由文本的临床记录，但这些基于云端的商业闭源模型可能违反处理敏感患者数据的数据治理规定。目的：我们评估了一种完全在机构安全计算基础设施（此处为英国国家医疗服务体系）内运行的隐私保护语言模型，能否利用二级精神卫生保健的电子健康记录准确识别自伤的存在及其发生时间。方法：从牛津健康NHS基金会信托的电子健康记录中，随机抽取了1,352份临床记录样本，这些记录来自根据国际疾病分类（ICD-10）确诊为精神障碍的患者。每份临床记录均标注了（i）是否存在自伤以及（ii）其近期性（90天内 vs. 超过90天 vs. 未知），构成了模型开发和验证的金标准数据集。使用隐私保护的本地服务270亿参数Gemma 3语言模型（"Gemma3-27b"）作为核心语言模型，识别自伤及其发生时间，为每份临床记录生成结构化输出。将Gemma3-27b模型的性能与基于RoBERTa（鲁棒优化的BERT预训练方法，一种基于Transformer的语言模型）架构的强基线多标签文本分类模型进行比较。模型性能通过精确率、召回率和F1分数（精确率和召回率的调和平均数）进行评估，95%置信区间通过1,000次有放回自助抽样估计。结果：Gemma3-27b模型在所有类别上均优于RoBERTa分类器。对于包含自伤的记录，Gemma3-27b的精确率为0.92，召回率为0.92（灵敏度），F1分数为0.92；对于无自伤的记录，精确率为0.97，召回率为0.97（特异度），F1分数为0.97。对于近期自伤，Gemma3-27b的精确率为0.84，召回率为0.75，F1分数为0.79。Gemma3-27b在所有类别上的全局加权F1分数为0.88，而RoBERTa为0.85。结论：经过提示工程优化的本地语言模型在识别自伤事件及其发生时间的任务上优于多标签文本分类RoBERTa模型，同时所需的高保真标注数据显著更少。该方法提供了一种实用解决方案，可在遵守严格数据治理规则的同时改进自伤病例的识别，从而有可能改变这一关键公共卫生挑战的临床监测和应对方式。
基于RMSSD的自适应音乐疗法（Skitii）在减轻头颈癌患者治疗相关焦虑中的有效性：一项随机对照试验方案	Adhikari, P.	2026-05-16	PDF	背景：头颈癌患者在积极治疗期间，65-85%的病例会出现临床显著的焦虑和抑郁。当前的支持性护理缺乏个性化、实时的非药物干预手段。Skitii是一种新型HRV自适应音乐治疗系统，通过Polar H10胸带传感器持续监测RMSSD（连续差值的均方根），实时选择音乐，以促进副交感神经恢复（RMSSD≥30ms）。方法：这是一项在印度芒格洛尔耶纳波亚医学院医院开展的前瞻性、开放标签、随机对照试验（1:1分配）。纳入标准为18-75岁确诊头颈癌（任何亚部位，I-IV期）并接受放疗和/或化疗、基线存在心理困扰（HADS≥8或NCCN痛苦温度计≥4）的成年患者。参与者被随机分配至Skitii自适应音乐治疗组（每次20分钟，每日3次，持续3周）或静态音乐治疗对照组。Skitii采用两阶段算法：第一阶段（0-2.5分钟）以心率作为压力代理指标进行即时音乐选择；第二阶段（2.5-20分钟）在生理状态变化≥20%时，每2.5分钟根据RMSSD调整音乐。主要终点为第3周的HADS焦虑评分和静息RMSSD。样本量为70例（每组35例），统计功效80%，可检测2.5分的HADS差异（SD=3.8，α=0.05，脱落率15%）。分析采用ANCOVA，意向性治疗原则。讨论：这是首个评估基于RMSSD的自适应音乐治疗在癌症患者中效果的随机对照试验。主动对照组设计可分离自适应算法相对于单纯音乐暴露的效应。若结果阳性，将支持一种可扩展、成本效益高且包含客观生理监测的支持性护理干预措施，并为Skitii在印度获得CDSCO B类医疗器械批准提供临床证据基础，未来计划申请CE标志和FDA批准。试验注册：印度临床试验注册中心CTRI CTRI/2025/11/116732