注:此报告仅来自单一来源,尚待核实。
美国国立卫生研究院 (NIH) 宣布,“我们所有人”研究计划已成为全球最大的整合基因组学和电子健康记录 (EHR) 数据库,目前已有超过 74.7 万名参与者的数据可供科学家使用。该数据集包含超过 53.5 万个全基因组序列,并与近 48.2 万份 EHR 相关联,以前所未有的规模提供了丰富的基因组数据和临床信息。
最新数据发布新增了超过11.4万名参与者,使总注册人数超过88.3万人。数据包含超过13亿个基因变异、55.3万个基因分型芯片、9.6万条结构变异记录、60万项体格测量数据以及74.7万份涵盖社会环境、行为和生活状况的调查问卷。
电子健康记录 (EHR) 数据量增长了 22%,这得益于参与者提交的 EHR 数据量增加以及健康信息交换渠道的拓展。该项目的多样性尤为显著:超过 64.5 万名参与者(占 86%)来自生物医学研究中历来代表性不足的群体,包括老年人、女性、残疾人士、不同种族和民族背景的个人以及居住在农村或非都市地区的居民。参与者遍布美国所有 50 个州和地区,覆盖超过 98% 的美国三位数邮政编码区域。
“我们所有人”数据集首次纳入了多组学数据,例如来自近10,000名参与者的蛋白质组学数据、来自近9,000名参与者的RNA测序数据以及长读长全基因组测序数据——将资源扩展到基因组和临床数据之外。