关闭广告

《自然》刊发中国36个民族泛基因组参考,助解复杂疾病遗传因素

澎湃新闻13576人阅读

·研究表示,当基因个体来自代表性不足的中国少数民族群体时,我们会新发现一些基因序列,并找到一些缺失序列,这意味着我们或许会找到揭示人类进化的新线索,同时了解复杂疾病中的遗传因素。

6月14日,中国泛基因组联盟(Chinese Pangenome Consortium,CPC)发表了中国36个民族的泛基因组参考图谱——CPC序列。这项研究初步构建了我国人群的泛基因组参考图谱,揭示了中国人的基因组中隐藏着此前从未揭示过的基因序列。相关论文《A pangenome reference of 36 Chinese populations》已在《自然》(Nature)杂志发表,这也是中国学者领导的人群基因组研究首次登上《自然》。

相较于来自单一个体的基因组,泛基因组参考图谱范围更广泛,包含了一个物种或群体中所有基因组的全集。此次的CPC序列结合了来自中国36个少数民族的58例样本,证实了高质量的群体特异性基因组在遗传和医学应用中的必要性,帮助我们更全面地理解东亚人群,尤其是中国人群的基因组变异。


中国泛基因组联盟发表中国36个民族的泛基因组参考——CPC序列。图片来源:《自然》

研究人员表示:“人类基因组学正在经历一个重要的转变——从过去单一的参考序列发展为更加全面的泛基因组形式。众所周知,在基因组研究中需要提高不同祖先背景的代表性,但与欧洲人相比,在亚洲人中进行的基因组研究数量还是较少,这也是为什么在种族群体间,基因组变异存在着相当大的差异。”

据悉,中国人群泛基因组联盟(CPC)由复旦大学徐书华教授和西安交通大学叶凯教授联合国内26家单位发起。在第一期研究计划中,CPC对代表中国36个族群的58个样本采用最新的基因组测序技术进行了深度测序,结合最新的单倍型基因组组装方法,获取了116个高质量单倍型基因组,并以图基因组的方式构建了高质量中国人群参考泛基因组。

此次的CPC序列确定了1590万个基因小变异和78072个基因结构变异,其中590万个小变异和34223个结构变异未在最近发布的pangenome(一种新兴的基因组分析模式)文献中报道。约500万个碱基对新序列存在于95%以上的单倍型中,被视为中国人群基因组核心序列,并被认为可能与中国人群特有的生物学功能或表型特征相关。

研究表示,当基因个体来自代表性不足的中国少数民族群体时,我们会新发现一些基因序列,并找到一些缺失序列。缺失的参考序列中富含古代遗传的等位基因(一对染色体上相同位点的两个基因)和基因,这些序列变异与角化(指细胞在特定条件下发生变化,从而使其形态和功能发生改变)、紫外线辐射反应、DNA修复、免疫反应等有关,这意味着我们或许会找到揭示人类进化的新线索,同时了解复杂疾病中的遗传因素。

研究人员表示,在基因组序列比对中,使用特定种群的参考可以提高比对质量。“我们的CPC序列无疑提供了对亚洲人群,特别是中国人基因组变异的更全面的了解。” 在连续性和基本水平精度方面,CPC序列与当前的人类参考基因组版本——GRCh38旗鼓相当,甚至更胜一筹。与人类泛基因组参考联盟(Human Pangenome Reference Consortium,HPRC)的图谱相比,CPC参考图谱提高了东亚样本短读长的完美比对率(在短基因序列长度的情况下,CPC的比对效果相似性更高)。

“在本次研究中,我们还找到了3629个受CPC特异性(只在CPC序列中表达)古代基因渗透段(现代人类基因组中渗入的古代DNA片段)影响的基因,其中1211个具有潜在功能性影响。这些基因在外源糖醛酸化(脂溶性物质反应)、类黄酮(维生素P)代谢过程,以及抗坏血酸和醛酸(肝脏用来解毒的重要物质)代谢过程中发挥着作用。它们同时还与多种疾病相关,例如结直肠癌、乳腺癌、神经系统疾病等。”

此外,该研究确定了相当大比例的古代起源序列,其中还有一些此前未被HPRC数据充分覆盖的古代序列,研究人员强调:人类泛基因组参考联盟的下一步工作中有必要包含更多不同的亚洲血统样本。

不过,研究也指出,当前评估工具仍存在局限性,例如,在测序过程出现装配错误的情况下,评估软件无法确定正确的装配。此外,虽然长读长测序技术已经迅速发展,但由于成本问题,短读长测序依然是基因组学研究的主要手段。而目前,由美国加州大学圣克鲁斯基因研究所(University of California Santa Cruz Genomics Institute)的Benedict Paten研究团队开发的短读长测序映射工具Giraffe,在处理局部复杂的基因区域时还存在一些问题。随着泛基因组图谱的简化,完美匹配(覆盖图谱每个顶点的匹配)的读长比例持续下降,这表明基因组图谱的多样性也在减少。在将短读长测序映射到泛基因组上时,如何实现高效且准确的映射仍然是一个亟待解决的问题。

“我们的计划是生成500个个体的单倍型序列,这些序列将具有高质量、分阶段和染色体水平的特征,覆盖56个官方承认的民族,以及一些以前工作从未很好覆盖的未识别民族,例如夏尔巴人(Sherpa)、刀郎人(Dolan)、克里雅人(Keriyan)、僜人(Deng)和罗布人( Lop Nur)。此外,我们还在进一步对CPC基因组中的功能元件(如基因、调控元件和转录异构体)进行全面注释。”研究人员说,“我们期待中国泛基因组联盟作为全球人类基因组学力量的重要组成部分,为构建高质量的泛基因组参考文献,并将其应用于各种基础和临床研究项目做出巨大贡献。”

据悉,此项研究由复旦大学、西安交通大学、中国医学科学院等26家单位联合完成。复旦大学徐书华教授、西安交通大学叶凯教授、中国医学科学院褚嘉祐教授和复旦大学陆艳副教授为论文的共同通讯作者。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

21岁女子被父亲安排嫁给姐夫 丈夫指责其不如姐姐贤惠

花点时间 浏览 81105

美司令暗示"台湾有事"将攻击解放军 国台办回应

环球网资讯 浏览 84626

日本2023年进口纯电车销量突破2万辆 比亚迪表现出色!

智车情报局 浏览 10169

2023年全球最可靠汽车排名,冠亚军让人意外,路虎、特斯拉垫底

买车家 浏览 9926

长安汽车称"扣供应商10%货款"不实 "商务函"为何引风波

澎湃新闻 浏览 13925

乐华娱乐大涨近13% 回应称公司运营正常

网易财经 浏览 9756

"灌篮高手"主题曲乐队发讣告 鼓手于5月22日去世

网易娱乐 浏览 13968

布林肯:美国对日本核污染水排海计划感到“满意”

环球时报国际 浏览 75726

上海一地标消失:烟囱上"温度计"拆了 居民曾靠它穿衣

上观新闻 浏览 95124

30岁提前"垮脸"?一篇拯救40+熟龄肌

言安堂 浏览 11907

全明星正赛:东部轰211分轻取西部破纪录 利拉德39分荣膺MVP

罗说NBA 浏览 9755

德天空:戴尔确定将加盟拜仁,他已经抵达慕尼黑

懂球帝 浏览 10031

中纪委点名3个副省级"虎" 有人搞权色交易、权钱交易

政知新媒体 浏览 66421

网红减肥产品效果来自禁药,副作用远大于减肥作用

趣看热点 浏览 22653

"多巴胺风格"走红,好心情还能穿出来?

NOWRE现客 浏览 13783

高通任命Akash Palkhiwala为首席财务官兼首席运营官,进一步扩展职责范围

超能网 浏览 9732

2023年中信证券承销保荐收入28.1亿元,保荐30家企业,22家已破发

资本百科 浏览 9808

20万请曹姓明星带货3个月成交278元 公司起诉法院判了

都市快报橙柿互动 浏览 102099

当中国出口全看汽车 你是喜欢哭来还是喜欢笑?

水皮M0RE 浏览 13733

女神范儿穿搭分享:这24套气质搭配可以参考,优雅时尚还好看

静儿时尚达人 浏览 9554

成都车展实拍坦克500,这家伙肯定能卖爆?

车业杂谈 浏览 17860
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1