| 跨同源蛋白的变异注释(旁系同源注释)能够以高精度识别致病性错义变异,并广泛适用于各类蛋白质家族。 |
Li, N. |
2026-06-13 |
PDF |
背景:在临床遗传学中,区分致病性变异与罕见但良性的变异仍是一项关键挑战,尤其是针对此前未在人类中观察和表征过的变异。体外和体内功能表征通常耗费大量资源,且模型系统可能无法准确预测其对人类疾病的影响。许多计算机工具已被开发用于预测哪些变异会导致疾病,但通常缺乏精确性。在此,我们展示了一种名为“旁系同源注释”的框架的适用性,该框架利用同源蛋白质中已表征变异的信息,预测目标基因中的变异是否可能致病。方法:我们通过三种正交方法评估了旁系同源注释的性能:(1)使用来自ClinVar的47,360个错义变异(涵盖3,524个基因,代表多种蛋白质类别),通过计算精确度和灵敏度,与已建立的计算机变异预测工具进行比较;(2)针对TP53和PPARG的大规模功能检测评估变异效应;(3)比较遗传性心脏心律失常综合征和神经发育障碍伴癫痫的病例对照关联检验中计算的比值比,按旁系同源注释对变异进行分层。结果:旁系同源注释正确注释了4,328个ClinVar致病性变异,假阳性为245个,精确度为0.95。采用更严格的注释参数(要求注释的直系同源物之间氨基酸保守性更高)时,精确度提升至0.99,但灵敏度有所降低。与已建立的工具相比,旁系同源注释在识别致病性变异方面具有更高的精确度,尽管在不同测试集中的灵敏度较低。通过在同源蛋白质结构域(而非全长蛋白质旁系同源物)之间转移注释来扩展该技术,可提高灵敏度。在病例对照队列方法测试的八个基因中,有六个基因中由旁系同源注释预测为致病性的罕见变异与疾病的关联性更强(比值比增加),优于未分层的罕见变异。结论:旁系同源注释在检测致病性错义变异方面具有高精确度,在可获得预测数据的情况下优于计算机方法。随着ClinVar等参考数据集中表征变异数量的增加,旁系同源注释的灵敏度和适用性将进一步提升。 |