目前全球已建立多个大型自闭症患者数据库,涵盖基因组、脑成像及临床表型等多维度数据,主要分为以下几类:
一、基因组数据库
1. MSSNG数据库
由自闭症之声(Autism Speaks)与多伦多病童医院合作建立,包含5205个自闭症家庭的全基因组数据,已鉴定出61个自闭症风险基因变异。2022年通过分析7000多名自闭症患者基因组,进一步发现134个新关联基因。数据通过谷歌云平台开放,目标规模达1万例。
2. Simons Simplex Collection (SSC)
包含2600个家庭的基因组序列及临床表型数据,每个家庭含1名自闭症儿童及正常成员。通过明码生物科技平台向全球开放,支持实时查询。
3. 中美合作数据库
华大基因与自闭症之声合作,对2000多个多自闭症儿童家庭进行全基因组测序,并纳入中国患者样本。
二、脑成像数据库
1. ABIDE (Autism Brain Imaging Data Exchange)
开放存取的功能性和结构性MRI数据集,支持自闭症脑功能连接研究。学习模型基于ABIDE数据对自闭症分类准确率达70%。
2. NDAR (National Database for Autism Research)
美国国立卫生研究院维护,整合影像、遗传及行为评估数据,提供多模态临床表型资料。
三、其他综合性数据库
Simons基金会全球自闭症数据库:含1万个外显子数据,支持跨机构数据对接。
ADHD-200 Sample:部分包含自闭症患者脑影像数据,用于研究注意力与社交认知关联。
四、数据开放与意义
这些数据库通过云端共享(如MSSNG、SSC)促进全球研究合作,推动个性化治疗开发。例如,基因组数据已揭示自闭症亚型差异,80%的已发现基因具备药物靶点潜力。