虽然在19世纪70年代就已经有三个国家的生物学家们确认了mRNA上面的修饰——m6A的存在,这种修饰非常普遍,但是人们一直不清楚这种修饰有何功能。直到2012年科学家们发现了m6A的修饰是可逆的,引起了人们对于RNA甲基化识别的关注。作为一个新兴的研究领域,科学家们对此投入了极大的精力,花费了大量时间去探寻,也使得RNA甲基化识别技术蓬勃发展。83297
传统的生物实验方法对于实验环境和实验人员的要求很高,不但费时费力,而且难于操作。伴随着像MeRIP-Seq[3]和m6A-seq等高通量技术的发展,以及后基因组时代的爆发式增长,我们迫切需要有一种好的机器学习的算法,来快速而准确的实现RNA的甲基化位点检测,以加速基因组的全分析进程。到目前为止,国内外已经发现了多种RNA甲基化识别方法,比如基于伪核苷酸特征的RNA甲基化识别方法,BLAST[4]方法等,但是最后的实验结果并不太好。论文网
参 考 文 献
[1] W。 Chen, P。 Feng, H。 Ding, H。 Lin, and K。C。 Chou(2015), iRNA-Methyl: Identifying
N6-methyladenosine sites using pseudo nucleotide composition, Analytical Biochemistry, vol。 490, pp。 26-33。
[2] Zi L, Xuan X, Qiu WR, Chou KC (2015)。 iDNA‐Methyl: Identifying DNA methylation
sites via pseudo trinucleotide composition。 Analytical Biochemistry 474: 69-77。
[3] K。 C。 Chou(2011), “Prediction of protein cellular attributes using pseudo-amino acid composition,” Proteins, 2011,43(3):vol。 43, no。 3, pp。 246-55, May 15。
[4] H。 Lin, E。 Z。 Deng, H。 Ding, W。 Chen, and K。 C。 Chou(2014), iPro54-PseKNC: a sequence-based predictor for identifying sigma-54 promoters in prokaryote with pseudo
k-tuple nucleotide composition, Nucleic Acids Research, vol。 42, no。 21, pp。 12961-12972。 [5] C。 Cortes, and V。 Vapnik, Support-vector networks。 Machine Learning, vol。 20, no。 3, pp。 273-297。
[6] S。 H。 Guo, E。 Z。 Deng, L。 Q。 Xu, H。 Ding, H。 Lin, W。 Chen, and K。 C。 Chou(2014)。 iNuc-PseKNC: a sequence-based predictor for predicting nucleosome positioning in genomes with pseudo k-tuple nucleotide composition。 Bioinformatics, vol。 30, no。 11, pp。 1522-1529。
[7] Liu B, Liu F, Fang L, Wang X, Chou KC (2015)。 rep RNA: a web server for generating various feature vectors of RNA sequences。 Molecular Genetics & Genomics。
[8] Liu B, Liu F, Wang X, Chen J, Fang L, et al。 (2015)。 Pse in One: a web server for generating various modes of pseudo components of DNA, RNA, and protein sequences。 Nucleic Acids Research。
[9] Wei C, Peng‐Mian F, Hao L, Kuo‐Chen C (2013)。 iRSpot‐Pse DNC: identify
recombination spots with pseudo dinucleotide composition。 Nucleic Acids Research 41: e68。 [10] Chou KC (2011)。 Some remarks on protein attribute prediction and pseudo amino acid composition。 J Theor Biol 273: 236‐247。
[11]张燕平,查永亮,赵 姝,等。基于自相关系数和 Pse AAC 的蛋白质结构类预测[J]。 计算机科学与探索,2014,8(1):103-110
[12] S。 Schwartz, S。D。 Agarwala, M。R。 Mumbach, M。 Jovanovic, P。 Mertins,A。 Shishkin, Y。 Tabach, T。S。 Mikkelsen, R。 Satija, G。 Ruvkun, S。A。 Carr, E。S。 Lander, G。R。 Fink, A。 Regev, High-resolution mapping reveals a conserved,widespread, dynamic mRNA methylation program in yeast meiosis, Cell 155(2013) 1409-1421。
[13] D。 Dominissini, S。 Moshitch-Moshkovitz, S。 Schwartz, M。 Salmon-Divon,L。 Ungar, S。 Osenberg, K。 Cesarkas, J。 Jacob-Hirsch, N。 Amariglio, M。 Kupiec,R。 Sorek, G。 Rechavi, Topology of the human and mouse m6A RNA methylomes revealed by m6A-seq, Nature 485 (2012) 201-206。