共查询到18条相似文献,搜索用时 546 毫秒
1.
基于知网的领域概念抽取与关系分析研究 总被引:2,自引:0,他引:2
唐一之 《湘潭大学自然科学学报》2009,31(1)
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度. 相似文献
2.
3.
语义信息集成是目前屏蔽数据之间半结构性、异构性和分布性的主要方法,其目的是为用户提供最大范围的精确数据.本文以解决信息集成中的语义冲突为目的,采用Ontology描述全局数据概念、树型结构描述局部数据概念.在此基础上,给出数据的逻辑定义方法,利用相似度计算匹配值来实现数据在语义集成中的匹配,并描述语义信息集成中的映射算法.最后,给出了实验数据和算法执行结果,验证了此方法的正确性. 相似文献
4.
PBC:一种基于路径的XML文档聚类方法 总被引:2,自引:0,他引:2
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度. 相似文献
5.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳... 相似文献
6.
7.
基于广义粗糙集的属性约简 总被引:1,自引:0,他引:1
目前,人们对广义粗糙集的研究主要集中在集合的近似计算上,而真正利用广义粗糙集进行属性约简的研究还很少见.基于广义粗糙集理论研究了信息系统中属性约简的问题.首先定义了关系信息系统及其属性约简的概念.然后给出了属性约简的判定定理和辨识矩阵并详细地研究了属性约简的基本性质.最后给出了计算信息系统中属性的所有约简的一般方法. 相似文献
8.
9.
《哈尔滨师范大学自然科学学报》2017,(2)
针对传统以欧氏距离为相似性度量的K-均值聚类算法应用于时间序列数据上存在的时间轴偏移敏感性问题及以动态时间轴弯曲距离为相似性度量的高计算复杂性问题,提出基于小波变换的动态时间弯曲距离作为相似性度量方法,根据提取的小波低频系数与原时间序列之间的低能量差异来选择小波变换的尺度,能保证选取的特征在拥有尽量低的维数的同时保留时间序列主要信息.实验结果显示,基于小波动态时间弯曲距离的K均值聚类比基于欧氏距离的K均值聚类效果好,运行速度比动态弯曲距离快. 相似文献
10.
针对JPEG压缩图像,根据感知相似性,提出一种基于颜色聚类带相关反馈的快速压缩域索引和检索方法.该方法直接在YCbCr空间上进行,可提高图像特征提取的速度、节省存储空间.实验结果证明了本方法的有效性. 相似文献
11.
距离测度是度量两个直觉模糊集的重要方法,在聚类分析中被广泛应用.本文基于相异度矩阵的思想,在直觉模糊多属性聚类中,定义了距离测度矩阵,然后根据不同的阚值要求转化为布尔矩阵进行聚类,最后通过实例验证该方法的有效性. 相似文献
12.
结合上下文特征和图割算法的车载点云聚类方法 总被引:1,自引:1,他引:0
可靠、准确的点云聚类是后续高精度场景目标分析与解译的基础.该文提出了一种基于上下文特征和图割算法的车载点云聚类方法.首先用DBSCAN (density-based spatial clustering of applications with noise)对点云数据进行过分割,得到密度可达的超体素;然后引入空间和属性上下文特征来描述超体素间的关联,并用于定义超体素构建的图模型边的权值;最后基于多标记的图割优化算法得到最佳超体素聚簇.实验结果表明,该方法能够有效改善点云聚类过分割,从而提高聚类的精度. 相似文献
13.
14.
15.
利用高光谱技术可估测水稻冠层叶绿素含量,为水稻的长势遥感监测与农艺决策提供科学依据. 基于地面实测水稻叶片光谱数据,提出了一种粗糙集属性简约和支持向量回归相结合的叶绿素反演方法,解决了植被光谱指数相关性高易造成计算冗余以及降低水稻叶片叶绿素高光谱反演效率的问题. 首先选择18 个与水稻叶绿素含量相关性较大的植被光谱指数作为因变量,利用粗糙集约简植被指数数据空间得到含有6 个植被光谱指数的简约核;然后采用支持向量回归方法反演叶绿素含量. 基于全部指数反演及基于简约核指数反演的R2 分别为0.858 6与0.850 6. 因此,该方法与采用全部指数进行反演的结果相比,不但具有相当的反演精度,而且有效缩短了反演算法步骤及时间,为大数据处理提供了新的技术方法. 相似文献
16.
基于相似关系的不完备模糊决策信息系统知识约简 总被引:2,自引:0,他引:2
魏大宽 《湖南师范大学自然科学学报》2006,29(2):18-23
在不完备信息系统和模糊决策信息系统及其粗糙集模型的基础上,提出了不完备模糊决策信息系统的概念,并基于相似关系及其粗糙集模型,给出了不完备模糊决策信息系统的粗糙集模型.该模型是不完备信息系统,完备模糊决策信息系统和经典决策信息系统粗糙集模型的推广.还给出了该系统的知识约简及其算法. 相似文献
17.
一种基于SOM和层次凝聚的中文文本聚类方法 总被引:2,自引:0,他引:2
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。 相似文献
18.
针对基于模板的目标跟踪算法存在模板冗余高、难以适应非刚性目标外观多变的问题,提出一种基于粒子滤波的模板在线聚类目标跟踪方法.首先建立用于描述目标和背景的正、负模板集,然后抽取候选粒子,使用候选粒子与正、负模板集的类内距离以及正、负模板集之间的类间距离来构建似然函数,最后依据最大后验概率准则确定最佳候选粒子作为跟踪结果.根据视频序列中连续变化的目标状态,将一定范围内的相似目标状态视为一个状态类,确定当前状态类的聚类半径.采用均值漂移算法对正模板集及最近几帧跟踪结果进行聚类,并将聚类后的中心集作为新的正模板集.实验表明,该算法能保留目标不同的外观状态,在复杂情况下仍能准确跟踪目标. 相似文献