前沿 | 新算法揭示罕见crispr基因模块 有望催生更安全有效基因组疗法-pg电子官方
2023-11-27 10:11:06
3
美国麻省理工学院和哈佛大学博德研究所最新开发出一种名为flshclust的新算法,在数十亿个蛋白质序列中发现了188个罕见且以前未知的crispr连接基因模块,其中包括新的vii型crispr-cas系统。新发现为利用crispr系统和了解微生物蛋白质的功能多样性提供了新机会。
crispr系统已被用来开发越来越多的新型生物分子方法,包括著名的crispr/cas介导的基因组编辑。而此前未知的crispr系统的出现,将推动这些生物技术进一步发展。
不过,尽管crispr工具箱已通过蛋白质序列数据库得到扩展。但常用的算法在挖掘包含数十亿蛋白质呈指数增长的数据集时,显得不切实际。
为了解决这一限制,研究团队开发了flshclust算法,这是一种通过序列相似性对蛋白质进行聚类的算法,与目前可用的方法不同,它能快速有效地分析大量蛋白质序列数据库。
利用新算法,团队在包含80亿个蛋白质和1020万个crispr阵列的宏基因组数据库中搜索罕见的crispr系统,发现了188个以前未知的crispr相关基因,同时鉴定并表征了一类新的包含crispr系统的cas-14(即vii型),其作用于rna。
此次新发现的系统十分罕见。研究人员表示,这种先前未知的cas基因和crispr系统的发现,极大地扩展了crispr的多样性,揭示了crispr系统前所未有的组织和功能的灵活性与模块化,同时也表明大多数变异都是罕见的。(来源:科技日报)