目前有很多种预测二硫键的方法,比如,DISULFIND[27]、Pair-Wise SVM[28]、SS_S VR [29]、FS_SVR[20]、DBCP[19]、DISLOCATE(DISLOCATE+MIp+iCOV)[21]、DMC[24]等等。这些

方法大体可以分为三类:(Ⅰ)二硫键状态预测,即判断半胱氨酸残基是否可以形成 二硫键;(Ⅱ)已知半胱氨酸是否形成二硫键的信息来预测二硫键的组成模式;(Ⅲ) 对上述两者都进行预测。最近,利用机器学习的方法预测蛋白质二硫键模式受到越来 越多人的关注,从实验的结果来看,运用先进的机器学习算法可以很大程度上提高预 测性能[19-24, 28],选取有效的特征跟利用强大的机器学习算法成为可以显著影响影响以 机器学习为基础的预测二硫键连接模式方法预测性能的两个重要方面。近几年来,人 们已经发掘出了很多有效的特征以及特征资源,比如说位置特异性矩阵[19, 20]、预测出 的蛋白质二级结构[29]、协变异[23, 30]、残基间距[28]、还有亚细胞定位[21]等等。这些特征 对于预测二硫键模式已经被证明是非常有效的。在分类器方面,很多先进的机器学习 算法,例如支持向量回归(SVR)[20, 29]和限制文法的隐条件随机场(GRHCRFs)[21]等, 都在预测二硫键连接模式预测中得到了广泛的应用。下面就简要介绍一下上面提到的 二硫键连接模式预测方法:

DISULFIND:DISULFIND 是一个既可以预测半胱氨酸是否成键又可以预测二硫键连 接模式的在线服务工具,此工具通过组合机器学习算法进行蛋白质链内二硫键模式的 预测,跟其他此类工具相似,DISULFIND 把预测步骤分为两个部分,第一步,对于每 个半胱氨酸,都用一个二分类分类器预测它是否可以成键。第二步,根据这些已知的 半胱氨酸成键信息来完成对二硫键连接模式的预测。

Pair-Wise SVM:此研究提出了一个新特征,此特征表示了在序列中两个氧化的半 胱氨酸之间的距离。除此之外,本研究还进一步使用了支持向量机和有权图匹配技术 来预测蛋白质二硫键的连接模式。使用了 DOC 特征之后,在他们所使用的数据集上的 预测准确度已经可以达到 63%,远高于当时的其它预测工具,Pair-Wise SVM 证明, 使用非局部特征 DOC 结合半胱氨酸的局部特征可以有效提高预测性能。并且,如果运用适当的归一化方法,DOC 对于二硫键的预测是一个有效的特征。 Fs_SVR:本方法总结了前人所使用特征,并在此基础上使用特征选择技术使预测

性能获得提高。Fs_SVR 同时也证明,全局特征,比如蛋白质组成、序列长度、蛋白质 质量等,对于二硫键预测几乎没有影响。在预测二硫键的一般特征中还存在冗余信息, 可以通过特征选择降维并去除冗余来提高二硫键模式的预测精度。68474

SS_SVR:本方法把多序列特征向量和预测的蛋白质二级结构作为特征,使用支持向 量回归模型,在尝试了多种序列编码体系之后,最终得到的预测精度可以达到 74.4%。 这说明,多序列特征向量结合蛋白质的二级结构可以显著提高二硫键连接模式的预测 精度。论文网

DMC:在 DMC 之前的研究中,已经可以证明支持向量机在预测蛋白质领域可以获得 很好的预测性能,在他们这篇文章中,他们还加入了新的特征,协变异分析特征,并 且通过新特征,使预测性能获得了 5%的提高。

DBCP:跟 DISULFIND 一样,DBCP 在线预测工具在蛋白质中半胱氨酸是否成键信息 未知的情况下进行二硫键连接模式的预测。DBCP 完成了下面四个步骤:1,二硫键链 分类,即预测蛋白质链是否存在二硫键;2,半胱氨酸分类:预测半胱氨酸是否成键; 3,二硫键分类;4,基于上面的结果,预测二硫键信息。DBCP 把通过 MODELLER[2]预测

上一篇:计算机视觉技术国内外研究现状
下一篇:Web信息抓取技术研究现状

公路安全评价宏观预测道...

股票价格趋势的预测方法国内外研究现状

预测焊焊接残余应力和变形国内外研究现状

话务量预测模型国内外研究现状

灰色系统理论交通事故预测国内外研究现状

风速时间序列预测的研究意义及研究现状

时间序列预测的研究背景和国内外研究现状

新課改下小學语文洧效阅...

老年2型糖尿病患者运动疗...

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析

网络语言“XX体”研究

互联网教育”变革路径研究进展【7972字】

麦秸秆还田和沼液灌溉对...

ASP.net+sqlserver企业设备管理系统设计与开发

张洁小说《无字》中的女性意识

安康汉江网讯