毕业设计(论文)题目:基于统计特征的 DNA 序列甲基化识 别方法研究
一、毕业设计(论文)内容及要求(包括原始数据、技术要求、达 到的指标和应做的实验等)
通过统计的方法提取 DNA 序列的特征向量,根据特征向 量构建一个 DNA 序列样本甲基化位点检测的分类器,通过 Jackknife 进行交叉验证,通过 Sp、Sn、Acc 和 Mcc 等指标对 实验结果进行评价。主要内容:(1)对 DNA 甲基化位点数 据集上的样本抽取统计特征,(2)构建基于特征的分类器, 并确定分类器的参数;(3)对公共数据集采用所设计分类器, 进行交叉验证测试;(4)对公共数据集的实验结果进行评价 分析。78075
二、完成后应交的作业(包括各种说明书、图纸等) 1。 毕业设计论文
2。 源程序
3。 技术文档
4。 英文原文及译文主要参考资料(包括书刊名称、出版年月等):
[1] Zi L, Xuan X, Qiu WR, Chou KC (2015)。 iDNA‐Methyl: Identifying DNA methylation sites via pseudo trinucleotide composition。 Analytical Biochemistry 474: 69-77。
[2] W。 Chen, P。 Feng, H。 Ding, H。 Lin, and K。C。 Chou(2015), iRNA-Methyl: Identifying N6-methyladenosine sites using pseudo nucleotide composition, Analytical Biochemistry, vol。 490, pp。 26-33。
[3] K。 C。 Chou(2011), “Prediction of protein cellular attributes using pseudo-amino acid composition,” Proteins, vol。 43, no。 3, pp。 246-55, May 15。
[4] H。 Lin, E。 Z。 Deng, H。 Ding, W。 Chen, and K。 C。 Chou(2014), iPro54-PseKNC: a sequence-based predictor for identifying sigma-54 promoters in prokaryote with pseudo k-tuple nucleotide composition, Nucleic Acids Research, vol。 42, no。 21, pp。 12961-12972。论文网
[5] C。 Cortes, and V。 Vapnik, Support-vector networks。 Machine Learning, vol。 20, no。 3, pp。 273-297。
[6] S。 H。 Guo, E。 Z。 Deng, L。 Q。 Xu, H。 Ding, H。 Lin, W。 Chen, and
K。 C。 Chou(2014)。 iNuc-PseKNC: a sequence-based predictor for predicting nucleosome positioning in genomes with pseudo k-tuple nucleotide composition。 Bioinformatics, vol。 30, no。 11, pp。 1522-1529。
[7] Liu B, Liu F, Fang L, Wang X, Chou KC (2015)。 rep RNA: a web server for generating various feature vectors of RNA sequences。 Molecular Genetics & Genomics。
[8] Wei C, Peng‐Mian F, Hao L, Kuo‐Chen C (2013)。 iRSpot‐Pse DNC: identify recombination spots with pseudo dinucleotide composition。 Nucleic Acids Research 41: e68。
[9] Chou KC (2011)。 Some remarks on protein attribute prediction and pseudo amino acid composition。 J Theor Biol 273: 236‐247。
[10] 张燕平,查永亮,赵 姝,等。基于自相关系数和 Pse AAC 的蛋白质结构 类预测[J]。计算机科学与探索,2014,8(1):103-110