基于复杂类型数据的发现特征子空间模型(DFSSM)的研究 |
| |
作者姓名: | 杨炳儒 唐 菁 |
| |
作者单位: | 北京科技大学信息工程学院,北京 100083;北京科技大学信息工程学院,北京 100083 |
| |
基金项目: | 国家自然科学基金重点资助项目(69835001);国家教育部科技重点资助项目(教技司[2000]175) |
| |
摘 要: | 探讨围绕知识发现领域中较为宏观、较为重大的问题。首先,根据复杂类型数据(包括Web数据、多媒体数据、空间数据、时间序列数据等)所具有的非线性动力学性质和特征,采用模式(定义为Hilbert空间中的矢量)来定量地表征复杂类型数据的多变性及具有的不确定状态和行为,并用模式的变化来刻画其整体知识发现过程的发展和演变规律;其次,以知识发现系统内在机理的研究为基础,构造了复杂类型数据知识发现系统的总体结构模型——发现特征子空间模型DFSSM;最后,用基于Web的文本挖掘系统和基于图像信息(气象云图)的知识发现系统作为实例进行了验证,结果表明DFSSM方法对于非结构化的文本数据及图像数据类型的知识发现过程具有指导性作用。因此,该结构模型具有较好的实用性与普适性,有望拓展到其他复杂类型数据的知识发现过程中。
|
关 键 词: | 复杂类型数据;数据挖掘;文本挖掘 |
|
| 点击此处可从《中国工程科学》浏览原始摘要信息 |
|
点击此处可从《中国工程科学》下载全文 |