介绍

CD-HIT是一种非常广泛使用的程序,用于聚类和比较蛋白质或核苷酸序列。CD-HIT最初由伯纳姆研究所(现为Sanford-Burnham医学研究所)的Adam Godzik博士实验室的李伟中博士开发。

CD-HIT速度非常快,可以处理非常大的数据库。CD-HIT有助于显着减少许多序列分析任务中的计算和手动工作,并有助于理解数据结构和纠正数据集中的偏差。

CD-HIT包有CD-HIT、CD-HIT-2D、CD-HIT-EST、CD-HIT-EST-2D、CD-HIT-454、CD-HIT-PARA、PSI-CD-HIT、CD-HIT-OTU、CD-HIT-LAP、CD-HIT-DUP和十几个脚本。

开发语言:Python。

一句话描述:CD-HIT是一款用于聚类和比较蛋白质或核苷酸序列的工具。

建议的版本

建议使用版本为“CDHIT-4.8.1”。