首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 546 毫秒
1.
基于知网的领域概念抽取与关系分析研究   总被引:2,自引:0,他引:2  
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度.  相似文献   

2.
聚类是通过数据标签或者属性,将一系列经验数据按照相似性或者相近性进行归类.基于密度属性展开的聚类算法,主要聚焦在聚类中心的确定和剩余点如何分配的问题上展开讨论.针对基于密度峰值的可训练最短路径算法,通过密度峰值确定聚类中心,提出使用截断阈值、对路径图进行剪枝的算法改进.然后基于最短路径法对剩余点进行全局分配.实验结果证明,在保持聚类精度的同时,有效地提升了算法执行效率.  相似文献   

3.
语义信息集成是目前屏蔽数据之间半结构性、异构性和分布性的主要方法,其目的是为用户提供最大范围的精确数据.本文以解决信息集成中的语义冲突为目的,采用Ontology描述全局数据概念、树型结构描述局部数据概念.在此基础上,给出数据的逻辑定义方法,利用相似度计算匹配值来实现数据在语义集成中的匹配,并描述语义信息集成中的映射算法.最后,给出了实验数据和算法执行结果,验证了此方法的正确性.  相似文献   

4.
PBC:一种基于路径的XML文档聚类方法   总被引:2,自引:0,他引:2  
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度.  相似文献   

5.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳...  相似文献   

6.
传统的基于关键字语法匹配的信息检索技术,查询返回的结果往往存在很大的信息冗余。而引入基于本体(Ontology)的语义检索技术,通过定义明确的领域概念、属性和实例来建立领域本体及其推理机制,发掘概念、实例之间隐含的信息,从而实现基于语义的智能地理信息检索。本文以交通领域本体为例,在使用Protégé建好交通本体之后,基于Jena推理机和SWRL推理规则语言,自定义了一些基本的本体推理规则,并设计了一套面向具体应用的本体推理机制,以解决实际的应用问题。  相似文献   

7.
基于广义粗糙集的属性约简   总被引:1,自引:0,他引:1  
目前,人们对广义粗糙集的研究主要集中在集合的近似计算上,而真正利用广义粗糙集进行属性约简的研究还很少见.基于广义粗糙集理论研究了信息系统中属性约简的问题.首先定义了关系信息系统及其属性约简的概念.然后给出了属性约简的判定定理和辨识矩阵并详细地研究了属性约简的基本性质.最后给出了计算信息系统中属性的所有约简的一般方法.  相似文献   

8.
基于包含运算区分属性特征,通过对每个属性对应的对象集合进行包含和交运算来判断属性特征.利用包含、交运算判断了所有属性特征,得到了属性协调集和约简集,达到了概念格属性约简的目的.  相似文献   

9.
针对传统以欧氏距离为相似性度量的K-均值聚类算法应用于时间序列数据上存在的时间轴偏移敏感性问题及以动态时间轴弯曲距离为相似性度量的高计算复杂性问题,提出基于小波变换的动态时间弯曲距离作为相似性度量方法,根据提取的小波低频系数与原时间序列之间的低能量差异来选择小波变换的尺度,能保证选取的特征在拥有尽量低的维数的同时保留时间序列主要信息.实验结果显示,基于小波动态时间弯曲距离的K均值聚类比基于欧氏距离的K均值聚类效果好,运行速度比动态弯曲距离快.  相似文献   

10.
针对JPEG压缩图像,根据感知相似性,提出一种基于颜色聚类带相关反馈的快速压缩域索引和检索方法.该方法直接在YCbCr空间上进行,可提高图像特征提取的速度、节省存储空间.实验结果证明了本方法的有效性.  相似文献   

11.
距离测度是度量两个直觉模糊集的重要方法,在聚类分析中被广泛应用.本文基于相异度矩阵的思想,在直觉模糊多属性聚类中,定义了距离测度矩阵,然后根据不同的阚值要求转化为布尔矩阵进行聚类,最后通过实例验证该方法的有效性.  相似文献   

12.
结合上下文特征和图割算法的车载点云聚类方法   总被引:1,自引:1,他引:0  
可靠、准确的点云聚类是后续高精度场景目标分析与解译的基础.该文提出了一种基于上下文特征和图割算法的车载点云聚类方法.首先用DBSCAN (density-based spatial clustering of applications with noise)对点云数据进行过分割,得到密度可达的超体素;然后引入空间和属性上下文特征来描述超体素间的关联,并用于定义超体素构建的图模型边的权值;最后基于多标记的图割优化算法得到最佳超体素聚簇.实验结果表明,该方法能够有效改善点云聚类过分割,从而提高聚类的精度.  相似文献   

13.
谱聚类是一种以图和相似性为基础的聚类新算法.当图像很大时,计算相似性矩阵及其特征值和特征向量十分耗时.为了将谱聚类算法应用于大规模聚类问题,该文提出一种两阶段纹理图像分割算法,采用改进的分水岭算法进行预分割,然后用特征值尺度化特征multiway谱聚类算法进行最终分割.为了检验算法性能,将其应用于纹理图像分割,分割结果令人满意.  相似文献   

14.
提出一种基于模糊聚类的可解释性建模方法.利用提出的一种含有熵的聚类有效性函数来评价模糊聚类方法的有效性和可解释性,从而确定模糊规则数和模型前提参数,然后利用最小二乘法来辨识模型的结论参数,最后采用梯度下降法来调整模型的参数.该方法应用于Box-Jenkins 数据仿真实例,仿真结果表明该方法不但能保证系统的精确性,还具有很高的可解释性.  相似文献   

15.
利用高光谱技术可估测水稻冠层叶绿素含量,为水稻的长势遥感监测与农艺决策提供科学依据. 基于地面实测水稻叶片光谱数据,提出了一种粗糙集属性简约和支持向量回归相结合的叶绿素反演方法,解决了植被光谱指数相关性高易造成计算冗余以及降低水稻叶片叶绿素高光谱反演效率的问题. 首先选择18 个与水稻叶绿素含量相关性较大的植被光谱指数作为因变量,利用粗糙集约简植被指数数据空间得到含有6 个植被光谱指数的简约核;然后采用支持向量回归方法反演叶绿素含量. 基于全部指数反演及基于简约核指数反演的R2 分别为0.858 6与0.850 6. 因此,该方法与采用全部指数进行反演的结果相比,不但具有相当的反演精度,而且有效缩短了反演算法步骤及时间,为大数据处理提供了新的技术方法.  相似文献   

16.
基于相似关系的不完备模糊决策信息系统知识约简   总被引:2,自引:0,他引:2  
在不完备信息系统和模糊决策信息系统及其粗糙集模型的基础上,提出了不完备模糊决策信息系统的概念,并基于相似关系及其粗糙集模型,给出了不完备模糊决策信息系统的粗糙集模型.该模型是不完备信息系统,完备模糊决策信息系统和经典决策信息系统粗糙集模型的推广.还给出了该系统的知识约简及其算法.  相似文献   

17.
一种基于SOM和层次凝聚的中文文本聚类方法   总被引:2,自引:0,他引:2  
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。  相似文献   

18.
针对基于模板的目标跟踪算法存在模板冗余高、难以适应非刚性目标外观多变的问题,提出一种基于粒子滤波的模板在线聚类目标跟踪方法.首先建立用于描述目标和背景的正、负模板集,然后抽取候选粒子,使用候选粒子与正、负模板集的类内距离以及正、负模板集之间的类间距离来构建似然函数,最后依据最大后验概率准则确定最佳候选粒子作为跟踪结果.根据视频序列中连续变化的目标状态,将一定范围内的相似目标状态视为一个状态类,确定当前状态类的聚类半径.采用均值漂移算法对正模板集及最近几帧跟踪结果进行聚类,并将聚类后的中心集作为新的正模板集.实验表明,该算法能保留目标不同的外观状态,在复杂情况下仍能准确跟踪目标.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号