(图片来源:mcmurryjulie/Pixabay)
维康桑格研究院的研究人员编辑了40,000个DNA片段,分析了10亿个所得DNA序列,用以揭示基因编辑的效应,并开发出一种可以向预测工具学习的机器。这将有助于研究人员使用CRISPR-Cas9探究疾病机制和药物靶标。
该研究发表在2018年11月27日发行的Nature Biotechnology杂志上,科学家可以利用新成果进行预测,获得使CRISPR-Cas9基因编辑技术更可靠的最佳靶标序列,进而使得该技术更加低廉和有效。
研究人员利用CRISPR-Cas9基因编辑技术可剪切基因组中任意位点的DNA,产生突变,并关闭特定基因的表达。世界各地的科学家们用这项至关重要的技术探究从癌症到罕见病在内的各种疾病中的关键基因。现在该技术还被应用于试验性治疗中,用于纠正人类基因中的有害突变。
一段特定向导RNA与靶标DNA上的序列准确结合,引导Cas9“剪刀”在正确的位置剪切DNA。然而,我们难以准确预测最终产生什么样的突变,因为细胞在修复Cas9造成的损伤,即连接DNA断点时会进一步产生DNA变化,
为了研究这一课题,研究人员合成了超过4万对不同的靶标DNA和向导RNA,对它们进行CRISPR-Cas9编辑。通过对不同细胞中的每对序列进行深度测序,他们详细分析了DNA如何剪切和连接。研究人员发现,(DNA)修复有赖于DNA和向导RNA的具体序列,且可用相同进行序列重复。
接下来,研究人员利用海量序列创造出一种向计算工具学习的机器,这种机器可以产生确定修复结果的通用规则。这一叫作FORECasT的程序使研究人员仅用靶标DNA就能够预测修复后序列。
来自维康基金桑格研究所的并列第一作者Luca Crepaldi博士称:“我们对CRISPR-Cas9的功能进行了迄今为止最为全面的研究,分析了超过十亿个DNA序列才得以研究这一过程。我们的研究显示,细胞修复特定靶标序列的方式是相同的,从而证明这种细胞修复机制是可重复的。”
来自维康基金桑格研究所的共同第一作者Felicity Allen博士说:“我们产生的海量序列数据及CRISPR-Cas9编辑后发生可重复的DNA修复这一发现共同说明,我们可以利用机器学习的方法创造出一种预测工具。我们的数据资源可以仅通过靶标DNA即准确预测CRISPR-Cas9基因编辑导致的突变。这样做不仅可以节省时间,还能为今后CRISPR-Cas9的应用提供依据,此外这项成果对所有利用基因编辑技术研究健康和疾病的研究者开放。”
本研究高级作者,来自维康基金桑格研究所的资深作者Leopold Parts博士说:“CRISPR-Cas9是一个研究中将突变引入细胞的极其重要的方法,同时在疾病治疗方面的效果也颇受期待。我们的研究可使科学家们了解CRISPR-Cas9编辑在细胞中的效应,从而可以更好地设计实验,为未来在治疗方面的应用提供基础。”
参考文献:
1.Felicity Allen, Luca Crepaldi, Clara Alsinet, Alexander J. Strong, Vitalii Kleshchevnikov, Pietro De Angeli, Petra Páleníková, Anton Khodak, Vladimir Kiselev, Michael Kosicki, Andrew R. Bassett, Heather Harding, Yaron Galanty, Francisco Mu?oz-Martínez, Emmanouil Metzakopian, Stephen P. Jackson, Leopold Parts. Predicting the mutations generated by repair of Cas9-induced double-strand breaks. Nature Biotechnology, 2018; DOI: 10.1038/nbt.4317
翻译:谢梦莹
审校:董子晨曦
引进来源:维康信托基金会桑格研究院