据物理学家组织网5月5日报道,最近,美国能源部联合基因组研究所(DOE JGI)、太平洋生物科学公司(PacBio)与华盛顿大学合作,开发出一种改良的基因组组装工艺流程,生成的读取片段达到数万个核苷酸长度,最终的组装序列准确率大于99.999%。以往的桑格技术只有700个核苷酸,新工艺大大提高了测序组装和分析的成本效益。相关论文在线发表于5月5日的《自然·方法学》上。
人们在降低成本和DNA测序通量上已取得巨大进步,但在重建基因组过程中,仍面临很大挑战。现有技术擅于造出短DNA字母片段(读取片段),经过计算把它们拼一起(组装)成为长链,以此来确定目标序列中这些字母的序列和功能。基因组装就好比把几百万的“拼图”拼在一起,而事先不知道原图是什么样子。由于DNA片段非常小而数量却极大,用目前流行方法来组装非常困难。
研究小组描述这一工艺为“从DNA样品制备到最终基因组确定的全自动过程”,所用技术叫做HGAP(分级基因组组装过程)。利用太平洋生物科学公司的单分子实时DNA测序平台,生成的读取片段达到数万个核苷酸长度,比人类基因组计划时期的主力技术——桑格测序技术还要长。
桑格技术只能产出约700个核苷酸的读取片段,而且要建多个DNA库控制多种运行,结合数据分析才能填补碱基编码空缺。后桑格法也需要多个库,但结合了优选技术。据研究小组报告,HGAP则相反, “只需准备一个DNA库,就会自动连续不断地读取单分子实时测序完成组装,而不需要循环一致测序。” 他们还用DOE JGI以往测序过的3种细菌对新方法进行了测试,收集数据进行了对比,发现HGAP方法最终组装好的序列准确率大于99.999%。
“我们一直在寻找新做法,在产出高质量数据的同时提高效率。”DOE JGI基因组技术副主管兰恩·潘那奇奥说,“我们在研究多种改良技术以实现规模经济效益,这只是其中之一。”在全世界已完成或正在进行的两万多个基因组项目中,超过20%在使用DOE JGI的测序技术,大多集中在环境生物学、能源和碳处理方面。目前,研究小组正在进一步扩展这种新方法的应用范围,以研究更复杂有机生物的基因组。
太平洋生物科学公司首席科学官乔纳斯·克拉奇也表示,通过与JGI微生物和微生物基因组组装与注释领域的科学家合作,他们才能改变单分子测序组装方法,使组装结果质量更高,而且在速度和价格方面能与下一代测序与组装方法竞争。 |