编辑:xmsouhu 来源:xmsouhu
2024-06-13 18:06:44
2024年4月23日,AI卵白质设计初创公司Profluent Bio联合首创人兼首席执行官Ali Madani团队在bioRxi预印版上发表了一篇题为“Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences”的论文,研究展示了语言模型可以乐成生成多样化的CRISPR-Cas卵白,并证明它们可以在人类细胞中作为功能基因编辑器组装。这是首次通过完全由机器学习设计的卵白乐成编辑人类基因组,并发布了世界上第一个开源AI基因编辑器——OpenCRISPR-1,该工作原理与 CRISPR-Cas9 类似,但具有 400 多个突变,而且脱靶编辑减少了 95%,从而提高了其精确度。
这篇文章中,研究人员使用了人工智能(AI)技术,特别是大型语言模型(LLMs),来设计一种新的基因编辑工具OpenCRISPR-1。以下是他们设计OpenCRISPR-1的主要步调:
1. 数据集构建:研究人员通过系统地挖掘26万亿字节的组装基因组和宏基因组数据,构建了一个包罗凌驾一百万个CRISPR操纵子的数据集,这个数据集被称为CRISPR-Cas Atlas。
2. AI模型训练:研究人员使用该数据集训练AI模型,以生成新的CRISPR-Cas卵白序列。
图1 CRISPR-Cas系统设计的语言建模方法概述
3. 序列生成:通过微调AI模型,研究人员生成了四百万序列,其中一半是直接从模型生成的,另一半是通过使用自然卵白的N端或C端序列作为提示来引导生成特定家族的序列。
4. 序列筛选:所有生成的序列都根据一系列BLAST和HMM比对尺度进行了筛选,以去除退化序列。
图2 生成的卵白家族在差别CRISPR-Cas系统类型中的频率
5. 结构预测:研究人员使用AlphaFold2对生成的序列进行了结构预测,以确保它们能够接纳与自然卵白相似的折叠结构。
图3 Cas9样卵白的预测结构
6.功能评估:研究人员在人类细胞中对生成的Cas9样卵白进行了功能评估,以确定它们是否能够作为基因编辑工具。
图4 对合成的Cas酶进行编辑效率、脱靶编辑效率特异性比力等功能评估
7. 特异性编辑:研究人员特别关注了与SpCas9(一种广泛使用的CRISPR-Cas效应卵白)兼容的序列,以便于在相同的基因组靶标上直接比较卵白质活性。
8. OpenCRISPR-1的选定:在一系列实验和评估之后,研究人员确定了一种名为PF-CAS-182的卵白,它在活性和特异性方面与SpCas9相当,但在序列上与之有显著差别。这个卵白被命名为OpenCRISPR-1,并公开发布,以促进其在研究和商业应用中的广泛使用。
9. 进一步的实验验证:研究人员还对OpenCRISPR-1进行了额外的实验验证,包罗测试其在差别PAM序列上的活性,以及将其转化为底编辑系统的能力。
图5 OpenCRISPR-1卵白编辑效率、相对活性比力和差别靶位点的编辑效率比力
CRISPR基因编辑已经有彻底改变医学领域的潜力,而将人工智能添加到其中将其提升到一个全新的水平。Ali Madani等人的研究是AI在生物技术领域应用的一个突破,为未来的基因编辑技术发展提供了新的可能性,OpenCRISPR-1只是冰山一角,未来AI与CRISPR的结合将会更加紧密,让我们拭目以待吧。
参考链接:https://www.profluent.bio返回搜狐,检察更多
责任编辑: