1 粗糙集理论历史发展
二十世纪九十年代,波兰学者Pawlak提出了粗糙集理论,并发表了第一本关于粗糙集的专注《Rough Sets: Theoretical Aspects of Reasoning about Data》。之后的几十年,粗糙集理论迅速发展,并逐渐从东欧走向世界。在粗糙集广泛传播的过程中,中国的学者也逐渐认识到粗糙集理论的重大发展潜力,开始致力于粗糙集理论的广泛研究。随着研究的不断深入,开始不断涌现出诸多粗糙集研究学者和团队(如刘清、张文修、梁吉业、苗夺谦、王国胤、钱宇华、杨习贝等学者),并在粗糙集研究领域获取了一系列的研究成果,为粗糙集在中国乃至世界的传播和发展做出了极大的贡献。
近年来,随着粗糙集不断增长的影响力,与粗糙集理论研究相关的国际国内会议也越来越多。“第一届国际粗糙集研讨会”于1992年在波兰召开,自此以后每年都有关于粗糙集理论及其应用的国际学术会议召开。与此同时,一些国内外重要学术期刊(如Information Sciences, Transactions on Rough Set, Knowledge-based System, 计算机学报,软件学报,自动化学报等)大量刊登与粗糙集相关的学术论文,成为了粗糙集理论交流和最新研究动态展示的重要平台。84451
2 粗糙集理论的研究现状
近年来,随着粗糙集理论的普及,越来越多的研究者投身其中,并取得了丰硕的研究成果。纵观文献,对于粗糙集理论的研究方向可总结为如下2点:
(1) 粗糙集模型泛化推广的研究
信息粒化和近似逼近是粗糙集模型的基石,对于粗糙集模型的泛化也存在着信息粒化和近似逼近两个方向。 论文网
在信息粒化方向,经典粗糙集是建立在一种不可分辨关系的基础上对于论域的划分。然而,因不可分辨关系的约束过于严格,在客观世界上常无法找到与其严格对应的应用场景。为此,中外诸多学者采用弱不可分辨关系对于经典粗糙集模型进行泛化,使其能更容易的在现实场景找到与之对于的应用实例。例如:为减少连续型数据转换为离散型数据造成的信息损失,1990年Dubois和Prade提出了模糊粗糙集理论[31]。
从近似逼近的角度考虑,为了给粗糙集模型的近似逼近找到一个语义解释,Yao和Wong于1992年提出了决策粗糙集理论[32-33]。决策粗糙集真正的贡献在于它不仅给出了概率正、负和边界域这个结果,更重要的是,它给出了基于贝叶斯决策论[34]的一个语义模型,同时也给出了一个实际、有效的解释和计算阈值的方法。也就是说,决策粗糙集[35-37]是一个有坚实理论基础同时又实用的一个模型。
(2) 粗糙集理论的属性约简研究
从理论与应用的视角来考虑,属性约简是粗糙集方法研究的核心问题之一。众所周知,在数据集中,每个属性(特征)的重要性程度是不尽相同的,因而所谓属性约简,就是考虑在一些度量标准的前提条件下(如近似质量、熵、近似分布),选择出数据集中重要的属性,并剔除冗余属性。经历了三十余年的发展,目前粗糙集理论中常用的属性约简算法大致可归为2类:穷举算法与启发式算法。尽管穷举法可以求得信息系统的所有约简,如分辨矩阵方法[38]及回溯方法皆属于穷举法范畴,但是由于其计算过程过于复杂,并不适合数据规模较大、数据组成较复杂数据集的约简;利用贪心策略设计的启发式算法[39]虽然仅能求得数据集的一个约简,但由于其时间效率较高而备受青睐。