基于统计特征DNA序列甲基化识别方法任务书

毕业设计（论文）题目：基于统计特征的 DNA 序列甲基化识别方法研究

一、毕业设计（论文）内容及要求（包括原始数据、技术要求、达到的指标和应做的实验等）

通过统计的方法提取 DNA 序列的特征向量，根据特征向量构建一个 DNA 序列样本甲基化位点检测的分类器，通过 Jackknife 进行交叉验证，通过 Sp、Sn、Acc 和 Mcc 等指标对实验结果进行评价。主要内容：（1）对 DNA 甲基化位点数据集上的样本抽取统计特征，（2）构建基于特征的分类器，并确定分类器的参数；（3）对公共数据集采用所设计分类器，进行交叉验证测试；（4）对公共数据集的实验结果进行评价分析。78075

二、完成后应交的作业（包括各种说明书、图纸等） 1。毕业设计论文

2。源程序

3。技术文档

4。英文原文及译文主要参考资料（包括书刊名称、出版年月等）:

[1] Zi L, Xuan X, Qiu WR, Chou KC (2015)。 iDNA‐Methyl: Identifying DNA methylation sites via pseudo trinucleotide composition。 Analytical Biochemistry 474: 69-77。

[2] W。 Chen, P。 Feng, H。 Ding, H。 Lin, and K。C。 Chou(2015), iRNA-Methyl: Identifying N6-methyladenosine sites using pseudo nucleotide composition, Analytical Biochemistry, vol。 490, pp。 26-33。

[3] K。 C。 Chou(2011), “Prediction of protein cellular attributes using pseudo-amino acid composition,” Proteins, vol。 43, no。 3, pp。 246-55, May 15。

[4] H。 Lin, E。 Z。 Deng, H。 Ding, W。 Chen, and K。 C。 Chou(2014), iPro54-PseKNC: a sequence-based predictor for identifying sigma-54 promoters in prokaryote with pseudo k-tuple nucleotide composition, Nucleic Acids Research, vol。 42, no。 21, pp。 12961-12972。论文网

[5] C。 Cortes, and V。 Vapnik, Support-vector networks。 Machine Learning, vol。 20, no。 3, pp。 273-297。

[6] S。 H。 Guo, E。 Z。 Deng, L。 Q。 Xu, H。 Ding, H。 Lin, W。 Chen, and

K。 C。 Chou(2014)。 iNuc-PseKNC: a sequence-based predictor for predicting nucleosome positioning in genomes with pseudo k-tuple nucleotide composition。 Bioinformatics, vol。 30, no。 11, pp。 1522-1529。

[7] Liu B, Liu F, Fang L, Wang X, Chou KC (2015)。 rep RNA: a web server for generating various feature vectors of RNA sequences。 Molecular Genetics & Genomics。

[8] Wei C, Peng‐Mian F, Hao L, Kuo‐Chen C (2013)。 iRSpot‐Pse DNC: identify recombination spots with pseudo dinucleotide composition。 Nucleic Acids Research 41: e68。

[9] Chou KC (2011)。 Some remarks on protein attribute prediction and pseudo amino acid composition。 J Theor Biol 273: 236‐247。

[10] 张燕平，查永亮，赵姝，等。基于自相关系数和 Pse AAC 的蛋白质结构类预测[J]。计算机科学与探索，2014，8（1）：103-110

上一篇：泊松分布及泊松过程在金融保险中的应用任务书

下一篇：概率论中几个不等式的应用任务书

基于统计特征DNA序列甲基化识别方法任务书

镇江市大气PM10和PM2.5比值...

江苏省城镇居民消费结构的统计任务书

基于对称正定矩阵一道习题的简单任务书

概率统计中的计算机随机...

EXCEL软件的统计功能应用任务书

单片机的点阵游戏机设计任务书

南京红桔20L盖注塑模具任务书

老年2型糖尿病患者运动疗...

安康汉江网讯

互联网教育”变革路径研究进展【7972字】

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析

新課改下小學语文洧效阅...

麦秸秆还田和沼液灌溉对...

ASP.net+sqlserver企业设备管理系统设计与开发

张洁小说《无字》中的女性意识

网络语言“XX体”研究