2。2。1 弱分类器的训练
本科毕业设计 第 7 页
设训练样本集是 , 表示样本集合的势,样本 x , f 表示某一样本特征,则 f (x)
便表示样本 x 的 f 特征值。 h(x, f , p,) 表示我们要训练的弱分类器:
其中 p 的作用是保持 (2。7) 中不等式的方向永远是小于号,故 p 只能取 1 或-1。表示将 划 分成目标和非目标两个部分的最佳阈值。 p,都是待定参数,按下面的方式计算求得。
对样本集合 中所有样本 x ,计算其特征值 f (x) 。将所有特征值从小到大排序,得到序 列 Sequence。记样本集合 中包含目标的样本个数是 T ,不包含目标的样本个数是 T ,阈 值前面的所有包含目标的样本个数是 S ,阈值前面的所有不包含目标的样本个数是 S 。
固定阈值进行分析,我们知道这个弱分类器的目的的将样本集合 按阈值的值简单
分成一个决策树模型,该模型有两种参考:模型一是 f (x) 小于的样本 x 属于包含目标的类
别,而其他属于不包含目标的类别;模型二与模型一相反,是 f (x) 小于的样本 x 属于不包
含目标的类别,而其他属于包含目标的类别。图 2。3 给出两个模型的示意图,左图为模型一, 右图为模型二