跳转至

bioRxiv 2026-06-10

标题 作者 发布日期 PDF链接 摘要
通过空间微量蛋白质组学表征枯草芽孢杆菌生物被膜景观 Zemaitis, K. J. 2026-06-10 PDF 整体蛋白质组学已被证明能够基于细菌菌落内的分子表型区分亚群,而质谱成像(MSI)的先进分析技术在未来展现出更大潜力。该技术可实现高通量空间表型分析,通过高空间分辨率分析直接可视化多种生物分子机制的不同组分,并具备高质量分辨能力。本研究将MSI应用于枯草芽孢杆菌生物膜薄切片的完整蛋白质直接成像,在最小化样品制备后,检测到超过285个对应独特蛋白质形态的独特同位素包络线。我们将MSI分析与整体自上而下蛋白质组学(TDP)相结合,构建了广泛的实验文库,通过基于已验证翻译后修饰(PTMs)和截短形式的同位素匹配,为MSI注释提供了高置信度。MSI与TDP的联合应用使我们能够描述枯草芽孢杆菌生物膜内的微尺度空间蛋白质组景观。本研究进一步证实,通过识别参与同类相食的蛋白毒素以及参与活跃孢子形成的蛋白质形态,可检测到生物膜中心及最外围高度局限区域内的分化细胞亚群。
双皮质素结构域蛋白ZYG-8通过增强微管刚性,在秀丽隐杆线虫合子分裂过程中促进有丝分裂纺锤体定向。 Cueff, L. 2026-06-10 PDF 在秀丽隐杆线虫受精卵中,双皮质素家族唯一成员zyg-8DCLK1的突变会破坏有丝分裂纺锤体的定位,这一点可通过免疫荧光观察。双皮质素蛋白与微管结合,被认为能稳定或增强微管刚性。在受精卵中,ZYG-8对微管生长和成核的影响较小。因此,我们探究了这些中等程度的动态扰动是否足以解释zyg-8突变体中观察到的纺锤体定位异常。通过三种互补的遗传扰动——RNAi介导的ZYG-8敲低、过表达以及热敏型zyg-8(or484ts)突变体(破坏微管结合)——我们观察到纺锤体极振荡改变和微管皮层接触行为变化,表明皮层力受损。重要的是,这些表型无法完全用先前报道的微管动力学改变解释,提示存在额外机制。我们的发现表明ZYG-8增强微管刚性:ZYG-8缺失或突变导致微管弯曲更频繁、曲率和扭曲度更高。模拟实验证实,刚性降低会延长皮层接触寿命,这一效应在zyg-8(RNAi)胚胎中通过实验得到验证。通过定制生物物理检测,我们证明zyg-8(RNAi)胚胎和zyg-8突变体中微管软化降低了中心力效率,导致纺锤体极振荡加剧。在突变体中,最大振荡使纺锤体极更靠近细胞边缘,阻止重新居中,最终导致后期末期纺锤体定位错误和方向异常。重要的是,减少皮层拉力可挽救方向缺陷,凸显了平衡的推拉力对纺锤体正确定位的重要性。我们认为,足够的微管刚性对于产生有效的皮层推力至关重要,可能与其他微管特性协同作用,共同参与确保有丝分裂后期纺锤体精确定位的中心机制。鉴于DCLK1在人类癌症中常发生失调,而精确的纺锤体定位对维持细胞增殖-分化平衡至关重要,这些发现可能有助于理解微管力学破坏如何促进癌变。
分化中的精原细胞触发体细胞支持细胞形成生殖细胞存活所需的隔膜连接。 Berry, C. W. 2026-06-10 PDF 从昆虫到哺乳动物的雄性生殖细胞,其分化过程发生在一个由体细胞支持细胞形成的阶段性连接屏障所创造的微环境中。这种屏障将减数分裂及减数分裂后的生殖细胞与体液隔离开来。本研究发现,果蝇生殖细胞分化因子Bag-of-marbles(Bam)的作用对于与每个瞬时扩增精原细胞簇相关的体细胞包囊细胞形成连接屏障至关重要——该屏障可封闭包囊并隔离分化中的生殖细胞。在体细胞包囊细胞中敲除隔膜连接(SJ)组分或跨膜蛋白Side-V,会导致大多数瞬时扩增精原细胞在8细胞阶段被清除。而bam突变雄性果蝇的生殖细胞死亡现象消失,这表明仅在分化启动后,瞬时扩增祖细胞周围的完整屏障对确保生殖细胞存活才具有必要性。综合来看,这些结果提示:启动分化的精原细胞发出的信号会触发其伴侣体细胞包囊细胞形成紧密连接屏障。分化启动与包囊细胞封闭需求的时序紧密关联,可能解释了正常生理条件下20-30%早期生殖细胞在减数分裂前被清除的现象。
基因表达生物物理学的种间分化受进化系统漂移和爆发率强选择性约束的双重驱动。 Felce, C. 2026-06-10 PDF 跨物种比较细胞类型特异性基因表达水平,可揭示驱动物种分化的进化过程。这些比较表明,基因表达进化的主要模式是稳定选择——既作用于稳态(平均)蛋白质水平,也作用于mRNA水平,同时伴随定向选择导致的谱系特异性偏移。然而,由于此前研究均采用批量RNA测量方法,我们无法确定众多影响平均丰度的细胞过程中,哪些受到高度约束,哪些在进化中更具可塑性。评估这一问题的复杂性还在于:只要系统净输出(即平均表达)接近进化最优值,复杂系统的各组分就可能随时间独立于选择机制的变化而进化。这种被称为"进化系统漂移"(ESD)的过程,常被用作细胞表型变化的非适应性解释,但从未在任何选择性约束的统计检验中得到量化验证或考量。本研究提出新范式同时解决这两个未解难题。通过单细胞表达数据与生物物理模型,我们估算了多个脊椎动物物种的mRNA转录爆发速率、剪接速率和降解速率。继而推导出新的数学结果,描述这些生物物理参数在ESD下预期的协同进化模式,并检验是否需要额外的进化约束来解释参数分化。我们发现:生物物理参数确实如ESD预测般协同进化,且转录爆发过程存在额外强约束——这很可能是降低表达噪声的选择压力所致。更广泛而言,本研究为复杂细胞系统的进化动力学研究开辟了全新路径。
孟德尔随机化中个体化治疗效应的稳健推断 Wu, R. 2026-06-10 PDF 孟德尔随机化(MR)利用遗传变异作为工具变量(IVs),在存在未测量混杂因素的情况下被广泛用于推断因果关系,但大多数MR分析聚焦于平均处理效应且依赖强假设。在精准医学中,核心目标是个体化处理效应(ITE);然而在MR中,基于核心IV假设无法点识别此类效应,且对ITE可识别边界的有效推断尤为困难。本研究提出一个稳健的部分识别推断框架,用于在允许多个IV的MR中估计ITE的可识别边界。在最小因果假设下,我们通过采用自适应bootstrap分布偏移与异质性方差调整的乘子bootstrap程序,推导出ITE边界的锐化推断方法。理论上,我们证明该方法能达到名义覆盖率和渐近锐化性。进一步,我们扩展该程序以容忍可能存在的无效IV,通过聚合多个可行IV子集并在保持覆盖率的前提下,基于最小比例规则假设实现。模拟研究表明,所提方法能达到名义覆盖率,且区间长度显著短于现有程序。我们利用阿尔茨海默病神经影像学倡议的数据,评估TREM2表达对阿尔茨海默病风险在教育定义亚组中的异质性因果效应,以此说明该框架的应用。
一种通过合作构建大规模高质量数据资源的协作提交模型 Hilton, J. A. 2026-06-10 PDF 整合跨研究数据集成的社区数据资源是现代生物医学研究的关键基础设施,能够支持大规模分析和人工智能(AI)模型的开发。然而,构建这些资源面临一个根本性矛盾:对大规模语料库的需求往往与对数据及元数据丰富性和高质量的要求相冲突。我们详细阐述了协作提交模式——即数据贡献者与专业资源管理者合作——如何使CZ CELLxGENE Discover成为快速成长、广泛使用的社区资源,用于训练和测试AI模型、开展整合分析、验证研究发现及生成假设。这种合作利用贡献者对研究的深入理解,结合管理者对数据重用的专注及标准化专长,提升了数据质量、元数据准确性和上下文丰富性。通过提供切实利益激励研究者参与,同时最小化提交负担,这一目标得以实现。我们将此协作模式与贡献者驱动和资源驱动的方法进行对比,突出其在可扩展性、质量保障和可持续性方面的权衡。本文所述的原则与实践为构建跨多样化生物数据类型的可持续、高质量社区数据资源提供了框架。
LongBench 平台对长读长 RNA 测序技术的基准测试:利用跨平台参考数据集通过批量与单细胞方法分析癌细胞系 You, Y. 2026-06-10 PDF 长读长RNA测序能够实现全长转录本分析并提高异构体分辨率,但不同平台和不断演进的化学方法需要仔细基准测试以确保可靠应用。我们提出LongBench,这是一个匹配的多平台参考数据集,涵盖八种人肺癌细胞系的批量、单细胞和单核转录组学,并包含合成加标对照。LongBench整合了三种最先进的长读长方案及Illumina短读长数据:牛津纳米孔技术(ONT)PCR-cDNA、ONT直接RNA和PacBio Kinnex。我们系统评估了转录本捕获、定量准确性、差异表达、异构体使用、变异检测和等位基因特异性分析。结果显示,各方案在基因水平差异分析中具有高度一致性,但由于长度和平台依赖性偏差,转录本水平和异构体分析的稳定性降低。单细胞长读长数据与批量数据在高置信度特征上高度一致,但单核数据特征检测能力下降。LongBench提供了目前最大的公开长读长基准测试资源之一,可实现严格的跨平台评估,并为转录组研究的技术选择提供指导。
ECMME:哺乳动物细胞外基质选择压力图谱揭示对比性进化动态 Petrov, P. B. 2026-06-10 PDF 细胞外基质(ECM)是后生动物的一项根本性创新,为多细胞生命提供必要的结构支撑和调控信号。尽管核心基质体组分受到强大的功能约束,但其分子层面的进化动态仍未被完全阐明。本研究利用来自多达228种胎盘哺乳动物物种的高质量直系同源序列,对272个人类核心基质体蛋白进行了全面的逐残基选择压力分析。我们开发了一套自动化流程,整合了直系同源鉴定、密码子感知比对以及基于HyPhy套件中MEME和FUBAR方法的位点特异性选择分析。结果显示基质体普遍存在强烈的纯化选择,与其结构和功能不可或缺性一致。同时伴随有间歇性正选择和更罕见的普遍性正选择,其中胶原蛋白相较于糖蛋白和蛋白聚糖表现出显著更高的间歇性正选择频率。为便于社区访问,我们开发了ECMME(ECM分子进化)浏览器,这是一个直观的开源网络资源,可将选择指标直接映射到蛋白质拓扑结构上。ECMME允许研究人员无缝浏览和探究数据,为解读功能位点提供了强大框架。该工具可在线访问,无需本地安装或配置(https://izzilab-ecmme.share.connect.posit.cloud/)。
SLiMNet:一种利用蛋白质大语言模型表示和配对输入检测短线性基序的深度学习模型 McFee, M. C. 2026-06-10 PDF 短线性基序(SLiMs)是位于内在无序区(IDRs)内的短片段(长度3-15个氨基酸),介导瞬时蛋白质-蛋白质相互作用以及稳定性和亚细胞定位等其他功能。在可能存在的数十万个SLiMs中,仅有数千个经过实验验证。通过局部比对可在IDRs内检测到保守的SLiMs,但现有方法的灵敏度和特异性有限,且无法对其匹配结果进行功能注释。因此,功能分配是SLiM生物学中一个尚未解决的主要问题。本文提出SLiMNet,一种受孪生网络和对比学习启发的深度学习模型,可预测成对SLiMs之间的功能相似性。SLiMNet利用蛋白质大语言模型嵌入,并在已注释的SLiMs数据集上训练。我们证明它能检测到未见过的非冗余基序对中的共享功能,其评分与细胞周期蛋白结合基序深度突变扫描实验获得的结合强度相关。利用SLiMNet,我们提供了源自已注释IDR区域的假定SLiM对数据库,以帮助生成SLiM功能注释的假说。这包括基于DisProt数据库平铺IDR序列中所有16聚体两两比对生成的图谱。我们证明该图谱捕获了最近加入MoMaP数据库的新型核定位基序,以及文献中报道的PRMT1甲基化基序。我们还提供了所有IDR序列与MoMaP实例进行SLiMNet评分的数据库,以及256个已知孤儿基序(仅有一个已知实例且具有关键功能的基序)的潜在功能对图谱。这些图谱共同为SLiM生物学界提供了重要资源。
单细胞基因组学计数数据的深度归一化 Booeshaghi, A. S. 2026-06-10 PDF 单细胞基因组学分析需要对特征计数进行归一化,以稳定方差、解释细胞测序深度的可变性,并保持细胞内特征丰度的单调性。我们证明,通过(原始计数中的加法)比例拟合步骤,随后取对数,再进行另一次(原始计数中的乘法)比例拟合步骤(PFlogPF)的归一化,是唯一满足这三个要求的特征重标号等变方法。我们在数百个单细胞RNA-seq数据集的众多基准测试中,展示了该方法(等价于移位中心对数比变换)相比其他归一化方法的优越性能。