随着生物技术的迅速发展,对DNA甲基化的研究日渐活跃。尤其是在医学界中,研究人员对DNA甲基化过程十分关注。长久以来,人们一直怀疑DNA甲基化过程以各种形式参与了不同组织中肿瘤、癌症的病变[3]。近年来,越来越多的研究表明,甲基化过程在几乎所有癌症的病变中都扮演了举足轻重的角色。因此,DNA甲基化的研究对医学中疾病的分类、医疗方式的分类、特别是对具有生物特性的疾病进行分类治疗都具有重要作用。DNA甲基化异常会促进癌症的发生,但与此同时,这一特性也为医学人员提供了诊断以及治疗癌症的新思路。因此,DNA甲基化位点的识别方法研究对生物医药学的基础研究和药物开发都具有重要作用。80371

近年来开发的一系列DNA甲基化识别工具不仅为实验检测技术提供了有效的帮助和补充,同时也表明DNA甲基化过程本身是有规律可循的。这一点启发了研究人员对于DNA甲基化内在机制的进一步探索。Cokus等学者通过分析拟南芥基因组中四核苷酸的分布频率,发现其中存在一些DNA甲基化的特殊序列模式[4]。利用深层序列分析,合作者表示前列腺癌中也存在着DNA甲基化的独特模式[5]。Bibikova等人通过对结肠癌、肺癌、前列腺癌和乳腺癌等癌症的细胞系同正常细胞基因中的位点的甲基化状态的聚类分析指出,各种癌症病变都存在其特异的甲基化生物标记。这些发现进一步证实了甲基化位点与他们所处的序列环境有关。从这些发现来看,单独基于序列信息来进行甲基化位点识别不仅是可行的,更是极其重要的。尤其是随着人类基因组计划的实施,人类基因的测序工作完成,生物信息不断增长,传统的实验技术已经无法满足研究需求。虽然传统实验检测能够精确地识别甲基化位点,但是实验检测必须要通过化合合成或者从原材料中提取DNA序列才能进行详细分析,过程中不仅需要大量硬件设备支持,还要投入大量的人力、资金、时间等等。面对人类基因组计划中获得的数以亿计的基因组DNA序列数据,对这些DNA序列逐一进行费时费力的传统实验检测显然是不切实际的。开发能够快速准确识别甲基化位点的计算方法已经成为基础科学研究和药物研究开发的迫切需求。一方面,计算方法能够弥补传统实验技术无法应对大量数据的局限性;另一方面,计算方法还能够深度挖掘数据中的隐藏特征,为科研人员进一步研究DNA甲基化过程提供重要依据和研究思路。论文网

在过去的数十年间,已经有学者尝试在系统、人工智能、模式识别以及信息处理等方法的基础之上建立对DNA序列的性质、修饰属性以及功能进行预测的模型,借此通过计算方法来识别甲基化位点。例如,Bhasin等人开发了Methylator工具来对DNA序列中甲基化的CpG进行检测[6]。该工具基于近三千个人类DNA甲基化模式数据,并以序列中CpG位点前后39bp的序列模式为特征,利用SVM算法进行分类预测。之后,Fang等人基于人脑组织全基因组范围的甲基化数据,又开发了MethCGI方法来预测人类大脑中CpG岛的甲基化状态[7]。尽管这些预测器在DNA甲基化位点的识别及相应技术的发展中起了重要作用,他们也有各自的不足和局限。如Methylator的训练数据集没有区分组织,而且无法应对细胞生长过程中单个CpG二核苷酸甲基化状态的动态变化。此外,这两个预测器都无法消除异体同形偏差带来的误差影响,因此其准确率是被高估的,且这两个预测器都没有考虑DNA序列的顺序信息,预测器的能力受限,因此应用相对有限。

上一篇:算机视觉中行人检测国内外研究现状
下一篇:程序设计竞赛自动阅卷系统研究现状

社区的三维可视化国内外研究现状

不同形貌SnO2纳米材料的光...

钒氧化物电极材料研究现状

历史文化街区旅游质量文献综述和参考文献

数学文化与数学教学之间...

文化旅游国内外研究现状和发展趋势

纳米二氧化锆表面改性的研究现状

我国风险投资的发展现状问题及对策分析

互联网教育”变革路径研究进展【7972字】

安康汉江网讯

LiMn1-xFexPO4正极材料合成及充放电性能研究

老年2型糖尿病患者运动疗...

新課改下小學语文洧效阅...

ASP.net+sqlserver企业设备管理系统设计与开发

麦秸秆还田和沼液灌溉对...

张洁小说《无字》中的女性意识

网络语言“XX体”研究