介绍
CPAT是一种基于RNA序列特征预测RNA编码概率的生物信息学工具。为了实现这一目标,CPAT从一组已知的蛋白质编码基因和另一组非编码基因中计算以下4种语言特征的分数。
- 开放阅读框大小
- 开放阅读框覆盖
- 菲克特测试代码
- 六聚体使用偏差
然后,CPAT将使用这4个特征作为预测变量,将“蛋白质编码状态”作为响应变量,构建一个逻辑回归模型。在评估性能并确定概率截止后,该模型可用于预测新的RNA序列。
语言:Python。
一句话描述:一种基于RNA序列特征预测RNA编码概率的生物信息学工具。
协议:GNU General Public License。
建议的版本
建议使用的版本为“CPAT 3.0.4”。