图片来源: CC0 Public Domain
正如研究人员指出的那样,科学家们对大量人群进行全基因组测序的主要目的之一就是了解更多关于遗传突变的信息,诸如此类变异可能是致病的、良性的或意义不明确的;基因组变异分为小型的插入-删除、单核苷酸突变或结构变异,随后研究者表示,目前虽结构变异的研究远远落后于其它研究,主要是由于研究人员缺乏专门用于进行相关研究的工具和资源。
这项研究中,研究人员利用一种可伸缩的管路绘制并分析了17,795个深度测序的基因组的图谱和特征,这种可伸缩的管路就是研究者开发的一种软件工具,其能允许工作流和大规模的结构变异产生,其所产生的数据能够描述分辨率感知的跨样本合并情况、每个样本的变异情况、变异的分类、断点的基因分型和拷贝数注释等。
研究者利用这种新型工具分析了17,795个欧洲人、拉丁美洲人和非洲血统人群的基因组,这些基因组数据能从几个公开可访问的数据库中获得,而且每个基因组的测序覆盖率至少为20倍,研究者指出,样本的尺寸大小和测序的深度就能帮助他们以较高的分辨率来绘制基因组中罕见的突变,这或许就能帮助估算出有害结构突变的相对负担。平均来讲,研究者发现的缺失最常出现在基因组中,其次是插入突变;在数据库中,每个人平均有2.9个罕见的结构突变(在基因组的蛋白质编码部分),而利用工具箱推测后,研究者发现,诱发功能缺失的17%的罕见突变或许归咎于结构变异。