Indexed by:
Abstract:
经典的粗糙集理论是Z. Pawlak于1982年提出的处理数据集不一致性的数学理论. 实际中对复杂数据分析的需要推动了经典的粗糙集模型向更广义的粗糙集模型的拓展, 这些推广的粗糙集模型已经在数据挖掘和机器学习等领域得到了广泛的应用.
属性约简和规则提取是粗糙集在应用方面研究的热点问题. 考虑到实际数据一般含有冗余的属性而导致提取的规则不紧凑, 本文主要基于有关推广的粗糙集从提取紧凑规则的角度对覆盖决策系统、区间值决策系统以及模糊决策系统展开属性约简方面的研究. 主要创新工作如下:
(1) 将经典决策系统中决策规则的概念及其置信度的度量拓展到覆盖决策系统情形, 提出了覆盖粒规则的概念并研究了覆盖粒规则之间的蕴含关系, 建立了覆盖决策系统保持置信度的属性约简框架, 以提取置信度不小于给定阈值的紧凑规则, 进一步提出了计算所有约简的组合优化方法, 并通过数值试验评估了约简方法的有效性.
(2) 通过在区间值信息系统上定义恰当的二元关系, 提出了区间值粒规则的概念并给出了其置信度的度量, 研究了如何从区间值决策系统提取紧凑的确定性规则以及紧凑的置信度不小于给定阈值的可能性规则的方法, 建立了区间值决策系统保持置信度的属性约简框架以及计算所有约简的组合优化算法. 进一步, 通过数值试验对约简方法的有效性和可能性规则在决策中的作用进行了评估.
(3) 基于一般模糊关系研究了模糊粗糙集的粒结构, 基此粒结构提出了模糊粒规则的概念, 建立了模糊决策系统的属性约简框架. 进一步给出了计算模糊决策系统所有约简的布尔推理方法以及搜索一个约简的启发式算法. 作为模糊粒规则的应用, 设计了一个规则分类器, 并通过数值试验评估了分类器的有效性.
(4) 针对混合数据集基于模糊下近似的粒结构, 提出了一种新的信息熵并基此对模糊粗糙集的属性约简进行了等价刻画. 进一步基于该信息熵给出了混合数据特征选择的算法, 并通过数值试验评估了改进算法的有效性.
Keyword:
Reprint Author's Address:
Basic Info :
Degree: 理学博士
Year: 2014
Language: Chinese
Affiliated Colleges: