第一章 绪论 1
1。1 概述 1
1。2 研究背景 1
1。3 研究现状 2
1。4 本文主要内容 4
第二章 RNA 序列甲基化识别过程 5
2。1 甲基化识别过程简介 5
2。2 数据集说明 6
2。3 特征提取 7
2。4 分类器设计 7
2。5 评价指标 8
2。6 验证方式 9
第三章 基于统计方法的 RNA 序列特征提取 11
3。1 统计学方法与思想 11
3。2 基于统计方法进行特征提取 11
3。2。1 核酸组成成分 12
3。2。2 累计核苷酸频率 12
3。2。3 位置特异性 12
第四章 基于统计特征的 RNA 甲基化识别 14
4。1 基于 NC 的甲基化识别 14
4。2 基于 ANF 的甲基化识别 14
4。3 基于位置特异性的甲基化识别 14
4。3。1 基于 PSNP 的甲基化识别 14
4。3。2 基于 PSDP 的甲基化识别 14
4。4 基于组合属性的甲基化识别 15
4。4。1 基于 PSNP 和 PSDP 的甲基化识别 15
4。4。2 基于 PSNP 和 NC 的甲基化识别 15
4。4。3 基于 PSNP 和 NC 及 ANF 的甲基化识别 16
第五章 实验结果对比与分析 17
5。1 实验结果对比 17
5。2 实验小结 19
结 语 20
致 谢 21
参 考 文 献 22
第一章 绪论
1。1 概述
目前,人们已经在真核 mRNA 中发现了一百多种转录 RNA 变型,在这些变型中, 六甲基腺嘌呤(m6A)是最丰富的一种。自 70 年代中期人们在哺乳动物基因中发现 了第一个甲基化核苷酸以来[1],为了解其确切的功能和机制,人们关于 m6A 的研究 已经进行了几十年。六甲基腺嘌呤(m6A),最初有着共有基序 GAC 的腺嘌呤(A), 是 RNA 中最丰富的变型之一,并在许多生物进程中起到至关重要的作用。为了更 好地理解 m6A 的调整机制,我们很有必要在一个全组基因范围内描绘出它的各个位 置。文献综述
1。2 研究背景
m6A 最初在细菌 DNA 中被发现,1955 年 Dumn 等人在观察胸腺嘧啶的结果类 似物对需 T 菌株的影响时发现了 m6A,人们进而对其进行深入研究[1]。本节主要围绕 RNA 序列甲基化识别研究背景展开描述。
在基因信息从 DNA 到蛋白质的传递过程中,RNA 起到了一种不可或缺的连接 作用。由于 mRNA 和蛋白之间的紧密联系,当蛋白水平难以确定时,目前关于基 因表达的 mRNA 数据便得到了认可。但细胞蛋白水平不一定与 mRNA 水平相关, 这表明转录后的 mRNA 调节在基因表达中起到了至关重要的作用。