1。4 本文的内容安排
本文有四个章节:
第一章,绪论。回顾和分析了目前对高维数据模型及正则化估计方法的研究现状和应用需求,概述了高维数据模型的要点和高维数据分析的解决思路,同时说明了本文的组织和内容安排。
第二章,高维数据分析的理论基础。深入了解基本的高维数据分析的理论基础、分析模型和所采取LASSO算法的特点,并更进一步地阐述了算法的基本操作和实现步骤,最后总结归纳了自己对LASSO算法基本思想的理解,并提出了对高维数据分析模型采用算法及输出结果效果优劣的评价方法。
第三章,实验核心算法FISTA及具体实现。提出了在解决LASSO问题时采用的具体算法,并先行介绍了作为FISTA原型的迭代收缩阈值算法(Iterative Shrinkage-Thresholding Algorithm, ISTA)。详细说明了FISTA算法的主要思想、数学模型和实现步骤。
第四章,实验过程。详细说明了实验的具体过程。介绍了实验环境、实验配置及实验所采用的数据。接着详细描述了FISTA算法的具体应用步骤和时间复杂度。采用真实数据进行了实验验证,并于OMP算法的效果进行对比。最后对实验结果进行了分析和总结。
2 高维数据分析的理论基础
2。1 高维数据分析模型及实际应用
变量的稀疏性是绝大多数高维数据的一个共同特征[9]。为了减少模型误差,增强可解释性,研究者们可以从大量变量中选取影响变量,进而进行特征选择——进行高维数据分析的必要条件。本文在这里介绍几种高维数据分析模型。来;自]优Y尔E论L文W网www.youerw.com +QQ752018766-
2。1。1 高维数据模型A
高维数据模型A:在观测数(n)远大于变量数(p)时,真实变量个数d包含在样本数n里,或者小于样本数n。
其中,所有自变量中对因变量的值真正起作用的变量的集合,就是真实变量。
称为真实变量,可以将归入真实变量集内:如果自变量的较小变化能引起y的变化或者y的大幅变化。反之,就不是真实变量,不能归入真实变量集中:若发生较大变化的同时,y没有发生变化或者变化的幅度很小。