据发表在最新一期《自然·生物技术》杂志上的新研究,美国研究人员开发了一种人工智能模型,可预测RNA靶向CRISPR工具的脱靶活性。该模型可精确地设计向导RNA并调节基因表达,这些精确的基因控制可用于开发基于CRISPR的新疗法。
美国纽约大学、哥伦比亚大学工程学院和纽约基因组中心研究人员进行的这项研究,将深度学习模型与CRISPR筛选相结合,以不同的方式控制人类基因的表达,类似于轻按电灯开关将其完全关闭,或通过调光旋钮调低电灯亮度。
CRISPR基因编辑技术通常使用Cas9酶来靶向DNA。近年来,科学家发明了另一种类型的CRISPR,它使用Cas13酶来靶向RNA。研究人员此次创建了一个使用Cas13进行RNA靶向CRISPR筛选的平台,以更好地了解RNA调控并识别非编码RNA的功能。
该研究的一个关键目标是最大限度地提高RNA靶向CRISPR对预期靶标RNA的活性,并最大限度地减少可能对细胞产生有害副作用的其他RNA的活性。
研究团队在人类细胞中进行了一系列RNA靶向CRISPR筛选。他们测量了20万个针对人类细胞中必需基因的向导RNA的活性,包括“完美匹配”向导RNA和脱靶错配、插入和缺失。
研究人员设计了一个深度学习模型TIGER(通过向导RNA设计靶向抑制基因表达),该模型根据CRISPR筛选的数据进行训练。将深度学习模型生成的预测与实验室的人体细胞测试进行比较,TIGER能够预测在靶和脱靶活动,这也是人类拥有的第一个能预测脱靶的工具。
RNA靶向CRISPR具有广泛应用,包括RNA编辑、调低RNA阻断特定基因的表达,以及确定候选药物的高通量筛选。为了更好地掌握RNA调控与功能,科学家设计了TIGER脱靶预测,其通过部分抑制基因表达,实现精确调节基因剂量。在临床上,这可能对诸多基因拷贝过多的疾病有用,例如唐氏综合征、某些形式的精神分裂症,甚至异常基因表达可能导致的癌症。