(7)当 N+ =N+/2 ,且 N- =N- / 2 时,则 Acc=0。5,Mcc=0,这表明预测结果和随
机预测是一样。
2。6 Jackknife 和 k 重交叉验证
在统计学习领域,以下三种验证方法通常被用来验证统计预测:独立的数据集测 试、抽样(或 k 重交叉验证)检验,和 Jackknife 测试(或留一法测试)[19,20]。这三
种方法,通过参考文献[20]的公式证明和实验的论证,Jackknife 测试被认为是最好的 一个,给定一个基准数据集可以得到唯一的结果。因此,Jackknife 测试已被广泛公认 和越来越多地被调查者使用去提高预测的准确性。在其运行的过程中,在基准数据集 每一个样本都会被单独挑选出来做测试集,并由数据集中剩余的样本作训练集。
然而,Jackknife 测试的数据集时间复杂度与样本数据集的规模是相等的,这使得 它执行比较耗时。因此,本文以 SVM 分类器作为预测引擎,使用 10 重交叉验证测 试进行参数的优化和特征的选择,而 Jackknife 测试用来评价分类器预测性能,以便 提供给不同预测模型一个公正的性能评价。