(3)必须事先给出要生成簇的数目k,对初始条件较为敏感;
(4)只能发现球状簇;
(5)对数据的输入顺序非常敏感;
1.3本文的主要研究内容及框架
本文的课题为混合型数据的聚类分析及R软件实现,主要内容是混合型数据的聚类分析。第一章是绪论,主要介绍课题的研究背景及意义、混合型数据聚类分析的方法及研究现状和本文的主要研究内容及框架。第二章是聚类分析的分类及算法,主要介绍了聚类分析的基本概念,系统聚类算法及R实现,K-means聚类算法及R实现,模糊聚类及R实现和有序样品聚类算法。第三章是混合型数据聚类分析的处理方法,主要介绍了混合型数据的概念和距离矩阵的计算、混合型数据的聚类算法及PAM算法和CLARA算法的R实现和评价。第四章是混合型数据聚类的实证分析,主要介绍混合型数据的选取和探索性分析、PAM算法和CLARA算法执行混合型数据聚类及R软件实现、混合型数据聚类结果的解释。第五章是总结与展望。
本文的研究方法是,首先查阅文献资料,总结前人的研究成果,然后在前人的基础上添加一些自己的认识和运用,最后完成混合型数据的聚类分析及R软件实现的论文的撰写。研究框架是先介绍聚类算法的基本思想,然后介绍算法步骤,最后用R包中的函数对数据进行聚类。