2026-05-15 每日论文
| 来源 | 独立页面 |
|---|---|
| arXiv | arXiv |
| bioRxiv | bioRxiv |
| medRxiv | medRxiv |
arXiv
| 标题 | 作者 | 发布日期 | PDF链接 | 摘要 |
|---|---|---|---|---|
| EntityBench:面向实体一致性的长距离多镜头视频生成 | Ruozhen He | 2026-05-14 | 多镜头视频生成将单镜头生成扩展为连贯的视觉叙事,但在长序列中保持角色、物体和场景的一致性仍是挑战。现有评估通常使用独立生成的提示集,实体覆盖有限且一致性指标简单,难以进行标准化比较。我们提出EntityBench基准,包含源自真实叙事媒体的140个片段(2,491个镜头),并配有显式的逐镜头实体调度表,可同时追踪角色、物体和场景,涵盖简单/中等/困难三个层级,最多包含50个镜头、13个跨镜头角色、8个跨镜头场景、22个跨镜头物体,以及跨度达48个镜头的重现间隔。该基准配备三支柱评估套件,分别衡量镜头内质量、提示遵循对齐度和跨镜头一致性,并设置保真度门控,仅将准确的实体出现纳入跨镜头评分。作为基线方法,我们提出EntityMem记忆增强生成系统,在生成开始前将已验证的逐实体视觉参考存储于持久记忆库中。实验表明,现有方法中跨镜头实体一致性随重现距离急剧下降,而显式逐实体记忆在评估方法中实现了最高的角色保真度(Cohen's d = +2.33)和出现率。代码与数据见https://github.com/Catherine-R-He/EntityBench/。 | |
| ATLAS:主动还是潜在视觉推理?一个词足以兼顾两者。 | Ziyu Guo | 2026-05-14 | 视觉推理常与中间视觉状态交织,已成为该领域一个有前景的方向。一种直接方法是在推理过程中通过统一模型直接生成图像,但这在计算上成本高昂且架构上复杂。近期替代方案包括通过代码或工具调用的智能体推理,以及使用可学习隐藏嵌入的潜在推理。然而,智能体方法因外部执行而产生上下文切换延迟,而潜在方法缺乏任务泛化能力且难以通过自回归并行化训练。为结合两者优势并克服局限,我们提出ATLAS框架——其中单个离散"词"(称为功能标记)同时充当智能体操作和潜在视觉推理单元。每个功能标记关联一个内化的视觉操作,但无需视觉监督,且作为分词器词汇表中的标准标记,可通过下一标记预测生成。这种设计避免了冗长的中间视觉内容生成,同时保持与标准可扩展SFT和RL训练的兼容性,无需架构或方法修改。为应对RL中功能标记的稀疏性问题,我们引入潜在锚定GRPO(LA-GRPO),通过静态加权辅助目标锚定功能标记来稳定训练,提供更强的梯度更新。大量实验与分析表明,ATLAS在挑战性基准测试中取得卓越性能,同时保持清晰的可解释性。我们希望ATLAS能为未来视觉推理研究提供新范式。 | |
| RefDecoder:通过条件视频解码增强视觉生成 | Xiang Fan | 2026-05-14 | 视频生成支撑着大量下游应用。然而,当前事实上的标准——即潜在扩散模型——通常采用强条件去噪网络,但其解码器往往保持无条件状态。我们观察到这种架构不对称性会导致细节显著丢失以及与输入图像的不一致性。为解决这一问题,我们认为解码器需要同等条件化以保持结构完整性。我们提出RefDecoder——一种参考条件化视频VAE解码器,通过参考注意力机制将高保真参考图像信号直接注入解码过程。具体而言,轻量级图像编码器将参考帧映射为富含细节的高维标记,这些标记在每个解码器上采样阶段与去噪后的视频潜在标记协同处理。我们在多个不同解码器骨干网络(如Wan 2.1和VideoVAE+)上验证了持续改进效果,在Inter4K、WebVid和Large Motion重建基准测试中,相较于无条件基线实现了最高+2.1dB的PSNR提升。值得注意的是,RefDecoder可直接替换现有视频生成系统而无需额外微调,我们在VBench I2V基准测试中报告了主体一致性、背景一致性和整体质量评分的全面改进。除图像到视频生成外,RefDecoder还能良好泛化至风格迁移和视频编辑优化等广泛的视觉生成任务。 | |
| VGGT-$Ω$ | Jianyuan Wang | 2026-05-14 | 近期前馈重建模型(如VGGT)已被证明与传统基于优化的重建方法具有竞争力,同时还能提供对其他任务有用的几何感知特征。本文通过引入VGGT-Ω,证明这些模型的质量随模型和数据规模呈可预测的扩展趋势,该模型在静态和动态场景的重建精度、效率及能力方面均有显著提升。为支持该模型在空前规模下的训练,我们引入了提升训练效率的架构改进、支持动态场景的高质量数据标注流程,以及自监督学习协议。通过采用带多任务监督的单一密集预测头并移除高分辨率卷积层,我们简化了VGGT架构。同时使用寄存器将场景信息聚合为紧凑表征,并引入寄存器注意力机制——将帧间信息交换限制在这些寄存器中,部分替代全局注意力。通过这种方式,VGGT-Ω在训练时仅需其前身约30%的GPU内存,使我们能够使用比先前工作多15倍的监督数据进行训练,并利用海量无标注视频数据。VGGT-Ω在多个基准测试中均取得静态与动态场景重建的优异结果,例如在Sintel数据集上将相机估计精度较此前最佳结果提升77%。我们还证明学习到的寄存器可改进视觉-语言-动作模型并支持语言对齐,表明重建可作为空间理解领域强大且可扩展的代理任务。项目页面:http://vggt-omega.github.io/ | |
| 对齐潜在几何以实现图像生成中的球形流匹配 | Tuna Han Salih Meral | 2026-05-14 | 用于图像生成的潜流匹配通常沿线性路径将高斯噪声传输到变分自编码器的潜变量。然而,两个端点都集中在薄球壳上,即使预处理对齐了它们的半径,欧几里得弦仍会离开这些球壳。通过将每个潜变量令牌分解为径向和角度分量,我们通过分量交换探针实验证明,解码后的感知和语义内容主要由方向承载,半径的贡献要小得多。因此,我们将数据潜变量投影到固定令牌半径上,将高斯噪声的径向投影作为球面先验,在冻结编码器的同时微调解码器,并用球面线性插值替代线性插值。由此产生的测地路径在每个时间步都保持在球面上,其速度目标在构造上完全是角度性的。在匹配训练条件下,该方法在不同图像分词器上持续改善了类别条件ImageNet-256的FID指标,保持扩散架构不变,且无需辅助编码器或表征对齐目标。 | |
| RAVEN:基于一致性模型GRPO的实时自回归视频外推 | Yanzuo Lu | 2026-05-14 | 因果自回归视频扩散模型通过从已生成内容外推未来块来支持实时流式生成。从高保真双向教师模型中蒸馏此类生成器可得到具有竞争力的少步模型,但训练期间遇到的历史分布与推理时出现的历史分布之间持续存在的差距限制了长时域上的生成质量。我们提出实时自回归视频外推网络(RAVEN),这是一种训练时测试框架,将每次自滚动重新打包成交错序列,包含干净的历史端点和带噪去噪状态。这种公式使训练注意力与推理时外推对齐,并允许下游块损失监督未来预测所依赖的历史表示。我们进一步提出一致性模型组相对策略优化(CM-GRPO),将一致性采样步骤重新表述为条件高斯转移,并直接对此核应用在线强化学习(RL),避免了先前流模型RL公式中采用的欧拉-丸山辅助过程。实验表明,RAVEN在质量、语义和动态程度评估上均超越近期因果视频蒸馏基线,且CM-GRPO与RAVEN结合时能提供进一步增益。 | |
| FutureSim: 通过重放世界事件来评估自适应智能体 | Shashwat Goel | 2026-05-14 | AI代理正越来越多地被部署在动态、开放式的环境中,这类环境要求代理能够实时适应新信息。为了在现实场景中有效衡量这一能力,我们提出构建基于真实世界事件时间顺序回放的仿真系统。我们开发了FutureSim系统,在该系统中,代理在知识截止日期后仍需预测世界事件,同时与按时间顺序回放的世界进行交互:模拟时段内实时呈现真实新闻文章并逐步解答问题。我们评估了前沿代理在其原生框架中的表现,测试其预测2026年1月至3月三个月期间世界事件的能力。FutureSim揭示了代理能力间的显著差异:表现最佳的代理准确率仅为25%,而多数代理的布莱尔技能得分甚至低于不作任何预测的基准。通过细致的消融实验,我们展示了FutureSim如何为研究长期测试时自适应、搜索、记忆及不确定性推理等新兴方向提供现实场景。总体而言,我们希望这一基准设计能为衡量AI在现实世界长时间跨度开放式适应能力方面的进展铺平道路。 | |
| Articraft:一种用于可扩展铰接式3D资产生成的智能体系统 | Matt Zhou | 2026-05-14 | 学习理解可动三维物体的一个瓶颈是缺乏大规模且多样化的数据集。本文提出利用大型语言模型来弥补这一不足,并大规模生成可动资产。我们将生成可动三维资产的问题简化为编写构建该资产的程序。随后引入新型智能系统Articraft,该系统可自动编写此类程序。我们设计了程序化接口与工具框架,帮助大型语言模型高效完成这一任务。该模型需针对领域特定软件开发工具包编写代码,用于定义部件、组合几何体、指定关节,并编写测试以验证生成的资产。工具框架为模型提供受限的工作空间与接口,验证生成的资产并返回结构化反馈。通过这种方式,大型语言模型无需关注编写URDF文件或管理复杂软件环境等细节。实验表明,该方法生成资产的质量优于现有最先进的可动资产生成器及通用编程智能体。基于Articraft,我们构建了包含245个类别、超过1万个可动资产的精选数据集Articraft-10K,并展示了其在可动资产模型训练及机器人仿真、虚拟现实等下游应用中的实用价值。 | |
| VGGT-Edit:基于残差场预测的前馈式原生3D场景编辑 | Kaixin Zhu | 2026-05-14 | 高质量3D场景重建近期已向可泛化的前馈架构发展,使得单次前向传播即可生成复杂环境。然而,尽管这些模型在静态场景感知中表现优异,它们仍难以响应动态的人类指令,这限制了其在交互式应用中的使用。现有编辑方法通常依赖2D提升策略——先独立编辑各视角图像,再将其提升回3D空间。这种间接流程常导致纹理模糊和几何不一致,因为2D编辑器缺乏跨视角保持结构所需的空间感知能力。为解决这些局限,我们提出VGGT-Edit——一种用于文本条件原生3D场景编辑的前馈框架。VGGT-Edit引入深度同步文本注入,将语义引导与骨干网络的空间姿态对齐,确保指令的稳定锚定。该语义信号随后由残差变换头处理,直接预测3D几何位移以变形场景,同时保持背景稳定性。为获得高保真结果,我们采用包含几何精度和跨视角一致性约束的多项目标函数监督该框架。我们还构建了DeltaScene数据集——通过自动化流程生成的大规模数据集,并采用3D一致性过滤确保真值质量。实验表明,VGGT-Edit显著优于2D提升基线方法,能产生更锐利的物体细节、更强的多视角一致性,并实现近乎瞬时的推理速度。 | |
| 几何一致性定量视频世界模型评估 | Jiaxin Wu | 2026-05-14 | 生成式视频模型正被越来越多地研究作为隐式世界模型,但评估它们是否产生物理上合理的3D结构和运动仍具挑战性。现有大多数视频评估流程严重依赖人工判断或学习型评分器,这些方法具有主观性且对几何失效的诊断能力较弱。我们提出PDI-Bench(透视畸变指数),这是一个用于审计生成视频几何一致性的量化框架。给定一段生成片段,我们通过分割和点跟踪(如SAM 2、MegaSaM和CoTracker3)获取以物体为中心的观测数据,通过单目重建将其提升至3D世界空间坐标,并计算一组投影几何残差,捕捉三个失效维度:尺度-深度对齐、3D运动一致性和3D结构刚性。为支持系统性评估,我们构建了PDI-Dataset,涵盖旨在挑战这些几何约束的多样化场景。在多个最先进的视频生成器上,PDI揭示了常见感知指标无法捕捉的几何特定失效模式,并为迈向物理可信的视频生成和物理世界模型提供了诊断信号。我们的代码和数据集可在https://pdi-bench.github.io/获取。 |
bioRxiv
| 标题 | 作者 | 发布日期 | PDF链接 | 摘要 |
|---|---|---|---|---|
| 人类语言网络的神经递质回路及其在卒中后失语症中的破坏 | Alves, P. N. | 2026-05-15 | 语言功能依赖于分布式的脑网络,其神经化学组织机制尚不明确。本研究结合大规模功能磁共振成像、正电子发射断层扫描衍生的受体与转运体图谱,以及结构连接组学,刻画了人类语言网络的神经递质架构及其在卒中后失语症中的破坏模式。研究发现语言回路按连接类别组织:皮质-皮质通路以血清素能和谷氨酸能信号为主,丘脑-皮质投射主要依赖胆碱能系统,而前颞叶连接则呈现GABA能回路富集。在239例卒中患者中,失语症与特定的神经化学损伤特征相关——脑叶病变表现为突触后血清素能损伤,皮质下失语症则优先出现突触前胆碱能或血清素能破坏。这些发现绘制了语言网络的神经递质架构,并为卒中后失语症建立了神经递质回路层面的分析框架。对四项药物试验的事后分析显示,治疗药物与神经递质匹配程度与失语症改善存在关联,提示个性化药物策略可能增强行为干预的响应性。 | |
| 小脑扰动损害人类工作记忆并降低整个皮层的空间调谐能力。 | Brissenden, J. A. | 2026-05-15 | 工作记忆,即信息的短暂维持与操作,是人类认知的基础。尽管工作记忆通常被认为依赖于额顶叶皮层,但近期神经影像学证据表明小脑也参与包括记忆在内的多种认知功能。目前尚不清楚小脑处理是否对视觉输入的持续维持具有必要性,抑或工作记忆的小脑特征仅是皮层活动的下游反映。通过结合功能性磁共振成像(fMRI)与经颅磁刺激(TMS)技术对人类进行研究,我们发现小脑干扰会广泛削弱皮层空间调谐能力,并损害空间工作记忆的回忆功能。这种损伤程度与干扰经典额顶叶工作记忆区域后观察到的结果一致。这些发现确立了小脑在空间信息持续维持中的因果作用,要求对人类工作记忆的主流理论进行修正。 | |
| 早期双语者的大脑结构与语言熟练度及语言平衡之间的关联 | Coutinho, M. R. | 2026-05-15 | 先前针对双语者的研究曾报告大脑结构与(i)语言熟练度或(ii)语言平衡度(双语者两种语言熟练度之间的差异)这两个维度存在关联,但鲜有研究同时考察两者——尽管它们高度相关。这些研究通常以晚期双语者为对象,且分析局限于特定脑区。本研究以46名早期文化型西班牙语-英语双语者(平均年龄16.7岁)为样本,在全脑层面检测了灰质体积(GMV)和皮层厚度(CT)与这两个维度的关系。结果显示,右侧角回(AG;BA 39)延伸至颞上回(BA 22)区域的GMV与较弱语言的熟练度呈正相关。更均衡的双语能力还与AG(BA 39)区域GMV增加相关,同时伴随左侧中央后回(BA 1)、右侧小脑小叶IX及右侧枕上回(BA 18)GMV减少。然而,在控制语言熟练度后,GMV与平衡度的这些关联消失。CT与这两个语言维度未发现显著关联。我们的发现表明:GMV与平衡度的关系由语言熟练度驱动,且鉴于关联区域位于右侧下顶叶皮层,GMV与语言熟练度的关系可能不涉及语言特异性机制。本研究将这两个语言维度的神经解剖学基础区分开来,并将其定位于以往研究通常未关注的脑区。 | |
| 互补性δ2-原钙黏蛋白的表达描绘了灵长类动物中平行的基底神经节回路 | Hoshina, N. | 2026-05-15 | 基底神经节(BG)在解剖学和功能上形成既分离又整合的并行回路,但决定其特异性的分子机制尚不清楚。我们通过免疫组化方法绘制了三种δ2-原钙黏蛋白(δ2-PCDH)细胞黏附分子——PCDH10、PCDH17和PCDH19——在猕猴基底神经节中的表达图谱。在纹状体内,每种PCDH沿头尾轴和腹内侧-背外侧轴呈现区域性梯度表达。这三种PCDH表现出互补分布,以渐变方式持续勾勒出与功能分区对应的分子边界。这种互补分布同样出现在基底神经节输出核团中。鉴于不同基底神经节结构中表达相同δ2-PCDH的神经元倾向于相互连接,这三种δ2-PCDH的表达模式可界定并行基底神经节回路内的功能区域。综上,PCDH10、PCDH17和PCDH19的互补表达分别与不同的基底神经节回路广泛对应,提示了灵长类基底神经节分离且整合的并行组织架构背后的分子编码机制。 | |
| 人类皮层血管系统的高分辨率三维映射 | Curcic, V. | 2026-05-15 | 人类皮层血管系统三维结构的微米级定量描述,对于理解血管结构对脑血流、神经血管耦合、神经系统疾病及人类神经影像信号的影响至关重要。然而,由于人类皮层的高分辨率三维血管数据获取依赖于死后显微成像技术,且针对啮齿动物组织开发的透明化与全组织免疫标记方法在高度交联、富含色素的固定人类皮层中效果有限,此类数据极为稀缺。本研究提出h-iDISCO+工作流程,可在长期福尔马林固定的人类脑组织中实现全组织免疫标记及动脉、毛细血管和静脉的高分辨率光片成像。通过在组织染色前整合延长氧化与光漂白处理,我们实现了样本的均匀透明化与抗体全深度渗透。将该工作流程应用于人类初级视觉皮层组织样本后,我们定量分析了血管几何特性及跨皮层深度的血管密度。该方法能以微米级分辨率对人类皮层血管网络进行定量重建,从而获取此前无法获得的人类皮层血管三维数据集。 | |
| 压力环境下的统计学习:自主神经系统反应性塑造从语音流中学习概率模式的过程 | Sholihat, A. | 2026-05-15 | 成年期的学习嵌入日常社会生活之中,其间心理社会压力期与恢复期交替出现。自主神经系统调节身体对环境需求的反应,但个体在此调节过程中存在显著差异。目前尚不清楚这种身体调节的个体差异是否会影响从感官输入中学习概率模式的能力。本研究通过一项六小时实验,模拟日常环境中的心理社会压力与恢复过程,探究语音流中概率模式的统计学习。65名成年人在高压与低压情境下接触新型语音流,并在接触后立即及休息后评估学习效果。实验全程记录心率变异性,以捕捉个体在压力与恢复中自主神经反应的差异。基于这些测量数据,我们构建了交感神经系统与副交感神经系统反应性的综合指标。交感-副交感反应性一致的个体(即两者均高或均低)在不同压力情境下均表现出更优的统计学习效果。交感神经反应性优先支持编码过程,而副交感神经反应性则支持巩固过程。此外,语音接触期间交感神经激活对统计学习的影响取决于个体的交感神经反应性特征。这些发现表明,身体调节的个体差异与压力环境中统计依赖性的学习能力密切相关。总体而言,研究结果凸显了脑-身体-环境交互在统计学习中的关键作用。 | |
| 小脑发育过程中,对肌肉命运的主动抑制维持了神经谱系的同一性。 | Shaikh, N. M. | 2026-05-15 | 细胞命运决定通常被认为是通过被动、基于异染色质的替代谱系程序沉默,逐步限制发育潜能。然而,本研究表明小脑发育过程中神经特性的维持反而需要TEAD-INSM1转录复合物对一种截然不同的命运进行主动抑制。TEAD1/2或INSM1的缺失会激活肌源性主调控因子Myod1,导致神经细胞获得骨骼肌细胞的转录、结构和代谢特征。Myod1的缺失完全抑制了神经向肌肉的转化,同时部分挽救了神经发育缺陷。我们的研究结果揭示了神经发育过程中潜藏的替代谱系,以及序列特异性转录因子在强化谱系边界(包括此前被认为基本不可逾越的边界)中的惊人作用,这对理解疾病背景下的异常分化和细胞类型演化具有重要意义。 | |
| 豌豆蚜脑和胚胎的染色质可及性图谱识别出组织特异性调控元件 | Liu, X. | 2026-05-15 | 豌豆蚜(Acyrthosiphon pisum)是研究翅多型现象及宿主-共生体互作等复杂生物学性状的重要模式生物,但其调控基因组图谱尚未得到系统解析。本研究首次利用转座酶可及染色质测序技术构建了豌豆蚜全基因组染色质可及性图谱。我们检测了孤养与拥挤条件下有翅和无翅形态成虫脑组织及晚期胚胎的开放染色质区域,并在胚胎样本中联合ATAC-seq与RNA-seq分析染色质可及性与基因表达的关系。测序文库中检测到大量来自蚜虫内共生菌螺原体和布赫纳氏菌的序列,反映Tn5转座酶优先插入无核小体细菌DNA的特性。经计算去除这些序列后,剩余蚜虫基因组比对文库呈现高质量ATAC-seq数据特征。我们鉴定出37,127个共有开放染色质区域,富集于启动子和远端调控元件,与计算预测的增强子区域高度重叠,并显著富集转录因子结合基序。组织特异性是染色质变异的主要驱动因素,第一主成分解释85%的变异,共鉴定出19,513个脑组织与胚胎样本间的差异可及区域。相比之下,翅型或饲养条件相关的差异较小。全基因组范围内启动子可及性与基因表达呈显著正相关。这些数据为豌豆蚜提供了基础性调控基因组资源,为研究这种具有重要生态与经济价值的昆虫的基因调控机制建立了分析框架。 | |
| 谷氨酸能神经元-肿瘤突触通过放射状胶质细胞可塑性塑造人类胶质母细胞瘤细胞状态。 | Martija, A. | 2026-05-15 | 胶质母细胞瘤是一种破坏性极强的原发性脑肿瘤,具有显著的肿瘤间和肿瘤内异质性。GBM细胞呈现一系列神经发育样表型,并利用正常的神经生理过程,包括与神经元微环境的突触整合。这种整合主要通过涉及谷氨酸受体的神经元-肿瘤突触介导,这些受体驱动钙离子升高,从而促进肿瘤增殖和侵袭。然而,突触信号与肿瘤细胞命运决定之间的确切关系仍待深入探究。本研究开发并应用了突触优化的人脑类器官肿瘤移植模型,以解析谷氨酸能信号如何影响GBM谱系轨迹。该模型保留了患者肿瘤的异质性,具备兴奋性NTS特征,并能在NTS扰动后实现肿瘤细胞的克隆谱系追踪。在so-HOTT模型中,通过遗传学和药理学手段抑制AMPA和红藻氨酸受体,可使肿瘤细胞组成从神经元命运转向祖细胞近端星形胶质细胞/间充质状态。这种转变源于钙信号减弱以及恶性放射状胶质细胞样祖细胞可塑性降低——后者是此前未被识别的NTS靶点。通过将神经元微环境输入整合至谷氨酸能信号通路,祖细胞群体得以调控其转录程序与细胞命运,最终塑造GBM肿瘤异质性。因此,靶向突触输入可能限制驱动GBM适应性和治疗逃逸的异质性。 | |
| 一个抑制性调控级联反应在特定感觉神经元类型中塑造了活动调控基因表达的时间模式。 | Bates, S. G. | 2026-05-15 | 长期神经元可塑性由活动调控基因表达程序驱动,这些程序以神经元类型特异性方式编码刺激特征。活动调控基因程序通常表现为无需新蛋白质合成即可快速诱导即早基因,随后由即早基因编码的转录因子调控次级反应基因的诱导。然而,在体内特定神经元类型中,这些程序响应生理刺激的分子模式机制尚不明确。我们此前发现温度调控秀丽隐杆线虫AFD温度感觉神经元对中的活动调控基因程序驱动行为可塑性。本研究通过分析不同时长温度升高后的AFD神经元,发现该神经元中的活动调控基因呈现不同时间轨迹。值得注意的是,快速诱导基因不包含已知即早基因,而是富集信号转导与导航相关分子。快速与延迟活动调控基因表达均需CMK-1 CaMKI激酶和CRH-1/CREB转录因子参与,其中CRH-1在早期和晚期均发挥作用。我们进一步定义了时间调控级联:CREB依赖的RCAN-1钙调磷酸酶调节因子诱导与MEF-2 MEF2/MADS结构域转录因子协同作用,在早期时间点抑制延迟活动调控基因表达。随后RCAN-1的下调可能促进后期CRH-1依赖的活动调控基因表达。研究结果表明,除经典基因激活转录级联外,活动调控基因控制的抑制机制同样在体内感觉神经元类型中精确塑造活动调控基因级联动态,提示不同神经元类型可能通过特异性细胞类型调控通路驱动活动调控基因表达程序。 |
medRxiv
| 标题 | 作者 | 发布日期 | PDF链接 | 摘要 |
|---|---|---|---|---|
| 轮状病毒疫苗对印度儿童营养不良的影响——打破腹泻恶性循环:一项横断面分析研究 | Verma, A. K. | 2026-05-15 | 背景 儿童营养不良仍是公共卫生重大挑战,发育迟缓、消瘦和低体重是主要指标。轮状病毒约占五岁以下儿童中重度腹泻病例的40%,提示轮状病毒疫苗在缓解腹泻相关营养不良中的潜在作用。本研究探讨了印度儿童轮状病毒疫苗(RVV)与营养不良之间的关联。 方法 研究分析了全国家庭健康调查-5数据,样本包括67,369名12至35月龄儿童。结局指标涵盖发育迟缓、低体重、消瘦及其严重形式。通过校正回归分析、敏感性分析和逆概率加权回归调整,评估RVV接种与营养不良的关联。 结果 与未接种儿童相比,完成全部三剂RVV接种的儿童发育迟缓(37% vs 41%)、低体重(28% vs 33%)和消瘦(17% vs 20%)患病率更低。全程RVV覆盖与发育迟缓(aOR: 0.88; 95% CI: 0.85-0.92)、低体重(aOR: 0.86; 95% CI: 0.83-0.89)和消瘦(aOR: 0.85; 95% CI: 0.82-0.89)风险显著降低相关。 结论 接种RVV与儿童营养不良风险降低相关,凸显了疫苗的间接效应(群体免疫)及其超越预防腹泻疾病的作用。 | |
| 超越淀粉样蛋白和tau蛋白:突触与神经退行性生物标志物塑造轻度认知障碍进展 | Delaby, C. | 2026-05-15 | 准确预测哪些轻度认知障碍(MCI)患者会进展为痴呆仍是一项重大挑战。当前生物标志物虽能高精度检测淀粉样蛋白病理,但对疾病进展的预后价值有限。我们在多中心BALTAZAR队列中开展前瞻性分析,所有受试者基线时均诊断为MCI并随访3年。采用NULISA超灵敏多重检测平台分析配对脑脊液(CSF)和血浆样本,定量检测超过120种中枢神经系统生物标志物。通过曲线下面积(AUC)和风险比(HR)评估单个标志物及弹性网络衍生标志物组合(经bootstrap和生存分析验证)的预后效能。3年随访期间,36%的参与者转化为痴呆。血浆p-tau标志物检测淀粉样蛋白阳性具有高准确性(AUC>0.90),但对转化预测的预后价值有限(AUC<0.75)。在CSF中,神经退行性变标志物(tau、NfL)和突触功能障碍标志物(编码神经元正五聚蛋白2的NPTX2)预测转化的准确性更高,超过p-tau217。最佳CSF组合(IL-16、tau、NPTX2)的AUC达0.86(95%CI 0.80-0.91),HR为39.8(95%CI 9.6-165.2)。血浆组合(p-tau181或p-tau217与编码14-3-3蛋白γ亚型的YWHAG联合)仅带来适度改善,可能反映血液中缺乏可靠的突触标志物。MCI向痴呆进展的预后评估最佳通过反映神经退行性变和突触功能障碍的CSF生物标志物组合实现,并辅以炎症标志物。这些发现强调了淀粉样蛋白和tau蛋白之外下游过程的临床及病理生理学意义,支持采用多标志物组合进行预后评估和治疗监测。 | |
| 黑色素瘤中多种免疫检查点相互作用的同步定量分析 | Cacho Navas, C. | 2026-05-15 | 免疫检查点抑制剂(ICIs)已彻底改变了晚期恶性肿瘤的治疗格局。然而,仅部分患者对治疗产生应答。近期研究聚焦于识别能够捕捉肿瘤免疫微环境动态功能状态的新型生物标志物,但其临床转化仍面临挑战。为突破这些局限,我们应用放大FRET-FLIM(QF-Pro)技术,直接在细胞、FFPE组织及肿瘤样本中实现功能性免疫检查点相互作用的空间解析与定量评估。通过该方法,我们证实PD-1/PD-L1、CTLA-4/CD80、TIGIT/CD155及LAG-3/MHC-II的相互作用可在多种肿瘤类型的常规患者样本中得到稳健定量。在ICI治疗的黑色素瘤患者队列中,我们同步分析了全部四种免疫检查点,识别出共激活模式。值得注意的是,PD-1/PD-L1高相互作用水平的患者通常也呈现显著升高的CTLA-4/CD80相互作用状态。此外,接受免疫检查点阻断治疗患者的生存分析显示,LAG-3/MHC-II相互作用状态可区分应答者与非应答者,且该区分能力独立于具体ICI治疗方案,提示LAG-3结合评估可能成为黑色素瘤免疫治疗的新型预后生物标志物。 | |
| 超低输入患者样本长读长测序数据中的全基因组变异检测 | Wang, K. | 2026-05-15 | 长读长测序相比短读长测序能提供更完整的基因组视图,在结构变异、串联重复序列以及难以定位区域的小型变异(单核苷酸变异和插入缺失)检测方面具有显著优势。长读长测序的局限性之一在于其高DNA起始量要求,每个样本需数微克。本研究评估了两种基于扩增的长读长全基因组测序方法:超低起始量HiFi测序和液滴多重置换扩增测序。以Genome in a Bottle参考集(NA24385)为基准,我们发现ULI-HiFi在单核苷酸变异检测中具有高精确度和召回率,显著优于dMDA扩增样本(ULI-HiFi的SNV F1分数为99.82%,dMDA为89.46%)。在超过160万个串联重复序列的目录中,ULI-HiFi实现了90.4%的完全一致率,允许单个基序差异时准确率达98.9%。ULI-HiFi还揭示了短读长测序难以定位的医学重要基因。我们进一步将ULI-HiFi应用于家族性腺瘤性息肉病(一种遗传性结直肠癌)患者的正常组织、息肉和腺癌样本分析,发现一个从正常组织到息肉再到腺癌逐步扩增的串联重复序列。该重复序列位于肿瘤抑制基因LIMD1的5'非翻译区。报告基因实验显示,随着LIMD1 5' UTR中重复序列长度增加,结直肠癌细胞系中的表达显著降低。我们得出结论:ULI-HiFi改进了患者样本基因组暗区中遗传变异的特征分析,有助于更深入理解人类疾病。 | |
| 临床试验统计编程自动化背后的证据:技术采纳、验证框架与AI/ML整合的范围综述(2020-2025) | Yan, J. | 2026-05-15 | 背景:临床试验统计编程正从人工、研究特异性编码向元数据驱动的自动化流程转变。尽管通用数据管理转型已有综述,但统计编程自动化——特别是表格、列表与图形(TLF)生成及验证框架——的综合整合仍十分有限。本综述通过系统性证据整合填补这一空白。方法:我们在PubMed、Google Scholar、arXiv及行业会议论文集(PharmaSUG、PHUSE、R/Pharma)中进行了结构化文献检索,时间范围为2020年1月至2025年12月。采用GRADE方法评估证据质量。在筛选的789篇出版物中,262篇符合纳入标准进行整合。结果:主要发现包括:(1)pharmaverse生态系统(rtables、Tplyr、admiral)将TLF开发时间缩短15-25%(GRADE:低);(2)基于风险的验证结合CI/CD流水线使验证工作量减少30-50%(GRADE:低);(3)元数据驱动架构实现跨研究40-60%的规范复用(GRADE:极低);(4)REDCap2SDTM将SDTM转换时间减少75-85%(GRADE:中等);(5)领域特定大语言模型(LLMs)在临床NLP任务中达到88-93%的F1分数(GRADE:中等),而通用模型在代码生成方面准确率为60-85%(GRADE:极低)。关键证据缺口持续存在:527篇验证论文中仅12篇(2.3%)报告了量化结果,且不存在比较验证方法的随机对照试验。结论:临床编程自动化已达到实际成熟度。然而,证据质量仍主要为低至极低。未来优先事项包括比较验证方法的随机对照试验、标准化结果指标以及针对AI辅助编程的监管指南。 | |
| 抗抑郁药撤药反应的发生率:一项针对初级保健患者的前瞻性纵向队列研究 | Rennwald, A. | 2026-05-15 | 背景:长期使用抗抑郁药的患者出现撤药反应的发生率及剂量影响尚不明确。目的:基于神经药理学模型和用户调查,本研究探讨了减药期间症状变化,以及症状加重是否与剂量降至最低有效剂量的75%以下相关。设计:这是一项前瞻性纵向队列研究,在六个月内进行了七次评估。方法:共纳入32名瑞士初级医疗机构的成年患者,这些患者使用抗抑郁药至少六个月且处于稳定缓解期。在基线(第0周)开始减药前,以及减药后第2、4、6、8、16和26周进行评估。使用改编版停药后出现症状量表(DESS)重复测量撤药症状,主要结局指标为评估间隔期内个体内症状变化。抗抑郁药剂量根据治疗抑郁和焦虑障碍的最低有效剂量进行标准化。结果:在各评估间隔期内,剂量降至最低有效剂量75%以下与症状增加相关,而高于该阈值或未减药则与症状减少相关。调整潜在混杂因素后,剂量降至最低有效剂量75%以下时出现临床相关症状增加的发生率为33%,而未减药间隔期内为13%(OR=3.2,1.4至7.4)。据此估计,60%的临床相关症状增加风险可归因于药理学撤药效应。调整后临床相关和严重撤药反应的发生率分别为32%和11%。结论:与神经药理学研究结果一致,我们发现抗抑郁药撤药症状主要出现在剂量降至最低有效剂量75%以下时,影响约三分之一的患者。在此最低剂量范围内,即使小幅减量也可能引发临床相关的撤药反应,凸显了个体化减药方案的必要性。 | |
| 从创伤和言语暗示特质反应性出发,建立解离性精神病理学风险的预测模型 | Morris, R. | 2026-05-15 | 背景:解离体验涵盖意识和感知中的多种不连续性,在解离障碍中显著升高,并与广泛的共病症状相关。越来越多的证据表明,发展性创伤和对言语暗示的特质反应性(REVS)是导致严重解离症状的风险因素,但以往研究通常将二者孤立考察。本研究通过预测建模整合这些指标,以更深入理解它们对解离性精神病理学风险的预测价值。方法:1,104名非临床参与者完成了创伤、解离和特质REVS的测量。采用弹性网络逻辑回归构建预测模型,通过10折交叉验证进行内部验证,并使用受试者工作特征(ROC)曲线及ROC曲线下面积(AUROC)进行评估。纳入模型的变量包括REVS各成分、创伤、年龄及其交互作用。结果:解离性精神病理学高风险组(7%)的特征为年龄更小、创伤程度更高、REVS水平升高(尤其在认知-感知暗示中的非自主性)。预测模型保留了十个预测因子中的九个,AUROC为0.77 [95% CI: 0.73, 0.82],显示出良好的区分能力,灵敏度中等(78%)但特异度较低(67%)。结论:这些发现强化了创伤和特质REVS作为解离性精神病理学风险因素的作用,并证明它们可整合至识别高风险个体的模型中。需进一步验证和扩展该模型,以提升对严重解离症状风险个体的识别能力及解离障碍的诊断水平,从而影响预后轨迹。 | |
| 在美国高危人群中,使用新型结核病疫苗预防结核病所需接种人数 | Rothman, J. E. | 2026-05-15 | 我们估算了在美高危人群中接种类似M72/AS01E疫苗以预防一例结核病所需的接种人数(NNV)。针对结核分枝杆菌感染者的定向接种,其NNV值范围为217(HIV感染者)至2,486(美国出生者),与现有成人疫苗的NNV范围相当。 | |
| 通过模块化推理实现多发性硬化症规范建模的贝叶斯非参数方法 | Taschler, B. | 2026-05-15 | 规范模型生成每个受试者的偏差分数,直接输入下游分析,但典型流程存在两个问题:(i) 采用临时或纯线性调整处理混杂因素;(ii) 直接将偏差分数的点估计值传入下游模型,忽略不确定性。我们提出一个集成式双模块贝叶斯框架,旨在解决这两个局限。基于贝叶斯加性回归树(BART)的规范模块灵活捕捉非线性效应和高阶交互作用,同时通过反事实平均法对图像质量变量进行边缘化处理。关键创新在于,我们将个体偏差定义为 di = E[Y|Xi,Zi] - (Zi),其中(Z)为特征条件总体均值,而非残差。随后,SoftBART生存模型通过截断后验构造摄入偏差分数的完整后验分布,在传播上游不确定性的同时阻断结果模型的反馈。在具有挑战性的模拟实验和大型多发性硬化症患者临床数据集(N>8k)中,该集成方法相比两步式插件Cox回归模型,在模型校准、预测准确性和组间时变风险分离方面均表现更优。基于BART规范偏差的模块化推理既提升了灵活性与不确定性量化能力,也可自然扩展至生存分析以外的其他结局指标。 | |
| 慢性脑卒中患者高强度运动训练后皮质-网状脊髓束的纵向变化 | Foster, J. M. | 2026-05-15 | 引言:高强度运动训练(HIT)被推荐用于改善步行能力,但治疗效果存在个体差异。理解训练反应背后的脑部变化可为这种差异性提供见解。新证据表明,对侧皮质-网状脊髓束(CRST)的上调可能有助于脑卒中后的步行功能。然而,尚不清楚CRST上调是支持性还是适应不良性,且尚无研究探讨HIT后CRST的变化。本研究旨在探究运动HIT后CRST和皮质脊髓束(CST)强度及偏侧性的重组模式,及其与步行能力的关系。方法:10名慢性脑卒中受试者完成4周无干预对照期,随后进行4周HIT训练。在第0、4、8周采集弥散MRI数据和6分钟步行距离。分析检测了患侧与对侧CRST和CST强度及偏侧性的变化,并检验了束路偏侧性变化与步行能力之间的关联。结果:在治疗阶段(相较于对照阶段),对侧CRST强度(1.02 SD [95% CI: 0.25, 1.79])、对侧CRST偏侧性(4.44 [2.15, 6.72])及6分钟步行距离(33米 [17, 50])均显著增加。步行能力改善与CRST偏侧性变化相关(r = 0.77, p = 0.01),但与CST偏侧性无关(r = -0.01, p = 0.98)。讨论:HIT后观察到对侧CRST强度及偏侧性增加。CRST偏侧性变化与步行改善显著相关,提示对侧CRST可能在介导脑卒中后训练相关步行功能改善中发挥支持性作用。 |