简介
gnomAD(Genome Aggregation Database)是一个由国际研究人员联盟开发的基因组数据库,其主要目标是聚合和协调来自各种大规模测序项目的外显子组和基因组测序数据。gnomAD为更广泛的科学界提供了一个强大的资源,用于研究人类遗传变异及其在不同人群中的分布。该数据库的数据集(GRCh38)涵盖了730,947个外显子组序列和76,215个全基因组序列,这些数据来自不同血统的个体,为各种疾病特异性和群体遗传学研究提供了宝贵的数据。
主要功能
数据聚合:gnomAD聚合了来自多个测序项目的外显子组和基因组数据,提供了大规模的遗传变异数据集。
数据协调:通过标准化和协调不同项目的数据,gnomAD确保了数据的一致性和可比性。
遗传变异分析:提供了丰富的遗传变异信息,包括单核苷酸变异(SNVs)、插入和缺失(indels)等。
群体遗传学研究:数据集覆盖了不同血统的个体,支持群体遗传学研究。
疾病特异性研究:支持针对特定疾病的遗传变异研究。
数据访问:提供了在线访问和下载数据的接口,方便研究人员使用。
主要特点
大规模数据集:gnomAD v4数据集涵盖了超过730,000个外显子组和76,000个全基因组序列,是目前最大的公共人类遗传变异数据库之一。
多血统覆盖:数据来自不同血统的个体,为研究遗传变异在不同人群中的分布提供了丰富的资源。
标准化数据:通过标准化处理,确保了数据的一致性和可比性,便于跨项目研究。
开放获取:gnomAD数据对所有研究人员开放,支持科学界的合作和知识共享。
持续更新:随着新数据的产生,gnomAD会定期更新其数据库,以包含最新的遗传变异信息。
结论
gnomAD是一个重要的公共资源,为人类遗传学研究提供了大规模的遗传变异数据。其数据的多样性和质量使其成为研究遗传变异、群体遗传学和疾病关联研究的重要工具。gnomAD的开放获取政策促进了科学界的合作,加速了遗传学研究的进展。