首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
针对领域本体构建过程中获取概念间语义关系的困难, 提出了一种新的本体关系学习方法——概念特征词法, 支持自动化地构建领域概念间的关系集合. 该方法首先基于语境将领域概念表示为特征词向量模型, 然后通过计算向量的相似度来确定两个概念之间是否存在语义关系. 依据领域专家定义的金标准, 对概念特征词法的学习结果做了详细的性能分析. 结果表明: 相较于已有方法, 本文方法的准确率和召回率更令人满意. 概念特征词法可广泛应用于本体构建、文本挖掘和语义检索等领域.  相似文献   

2.
为了解决远程教育不可避免地产生的"孤独"学习者的问题,把具有相同学习兴趣的学习者组织到同一个学习社区中进行协作式学习.学习社区建立的重点和难点在于学习者之间相似关系的判定和计算,针对传统的向量空间模型中术语问语义相关性被忽略的不足,提出基于本体的向量空间模型来计算学习者的兴趣特征向量,根据兴趣的隐性表示获取对应的显式表示,此计算模型提高了兴趣相似性比较的精确程度.同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社区的自组织算法.针对基于本体的向量空闻模型使用本体中的概念构造向量空间表现出的巨大维数,运用概念索引降维法对兴趣特征矩阵进行合理降维,大大减少了计算的复杂性.最后,以网络学习案例来进行实验分析,验证该模型算法具有较高的效率和良好的扩展性.  相似文献   

3.
在技术供需文本匹配视角下,提出了一种基于语义相似聚类的技术需求识别模型.首先,采集网络中技术需求文本提取关键短语;然后,建立领域专利技术转让索引库,基于需求关键短语检索出高相关专利,构建专利技术供给背景库,并对背景库中专利标题与摘要进行分词;第三,提出基于词向量的供需文本语义匹配度算法,筛选有效技术需求并进行语义相似聚类;最后,考虑技术需求对应的需求量和专利技术转让量,对聚类结果进行二维分类.以新能源领域为例进行实证,识别出有效技术需求195个,基于语义相似聚成12类,结合需求量与专利转让量,将12类技术需求分为“高需求、高转让”、“高需求、低转让”、“低需求、高转让”、“低需求、低转让”四大类.该研究为网络技术需求挖掘及供需匹配提供一种新思路.  相似文献   

4.
提出一种新的计算正态云模型相似度方法——基于组合模糊贴近度的正态云相似度方法,该方法利用两种模糊贴近度,并通过计算修正的正态云期望曲线的模糊贴近度度量云模型的相似度。实例表明,与现有方法相比本文方法计算简单,能够更有效的对正态云模型相似度进行度量。  相似文献   

5.
基于层次本体模型(HOM)的语义相似度计算方法   总被引:1,自引:0,他引:1  
本体映射通过计算实体之间的局部的或/和全局的语义相似度来确定实体之间的关系。除了实体之间的局部或/和全局的关系外,在很多情况下整个本体之间的关系对于计算语义相似度也是很有帮助的。本文试图利用这些关系来计算实体之间的相似度以改进本体映射的性能。为此,本文以范畴论为基础提出了一个层次化的本体模型(hierarchical ontology model,HOM)用以形式化描述这种关系。在此基础上,还提出了一种本体映射算法HOM-Matching,该算法利用本体之间的关系来计算实体之间的语义相似度。两组实验表明:通过设定合适的参数,该算法可以较好地提高本体映射的性能。  相似文献   

6.
针对现有云模型相似性度量方法结果不稳定以及区分度不高的问题,提出一种云相似度的概念跃升间接计算方法,以表征云相似性的期望曲线相交区域为切入点,将其面积的计算转移至更高层次概念上,实现原相交区域代表概念比重的等价转换。讨论了期望曲线交点数目及位置的不同情形,并给出相应的判别规则;在此基础上,通过计算截断熵获得综合云,实现概念的跃升;以综合云与各基础云的期望曲线相交面积作为相似性的新度量标准,给出了相似度的间接计算公式。通过设计的仿真算例以及具体应用的实验结果,验证了该方法的有效性和普适性。  相似文献   

7.
现有的基于本体的抱怨处理方法大多都依赖企业员工概括当前的顾客抱怨为关键词并用于检索解决方案,故不适用于数量巨大且传播速度快的网络抱怨.针对这个问题,本文引入相似性度量技术,提出一种基于本体的通信服务行业网络抱怨案例相似度计算方法.构建该行业的网络抱怨案例本体,基于该本体,建立聚合抱怨内容相似度、抱怨产品相似度和抱怨问题相似度的抱怨案例相似度模型;在理论上证明所建立的聚合模型的高准确性,并在实验中验证其高准确性,同时还使用平均绝对误差、准确率、精确度、召回率和F1值对其性能进行评价.理论证明结果表明,聚合模型比基准模型准确性更高.实验验证结果表明,聚合模型比基准模型准确性更高且性能更佳.  相似文献   

8.
针对传统方法无法有效度量多源异步航迹时空相似性的问题,该文提出了一种适用于多源异步航迹的相似性度量模型。基于时间和空间联合约束下寻找近似时空特征匹配点的思想,通过设置时间和空间阈值上寻找符合要求的匹配点,并通过空间相似函数度量匹配点的相似性,确定最优匹配点并计算多源航迹间的航迹时空相似度。实测数据表明,该模型可以有效度量异类传感器航迹的相似性,且时间性能较优。基于该模型的航迹关联算法在仿真的复杂多目标环境中的关联准确性优于现有算法,且在对海雷达误差估计中得到了应用。  相似文献   

9.
基于网络浏览行为,研究小众领域的用户画像建模方法.本文提出构造领域文本伪本体的方法,并从用户的网络浏览行为中挖掘用户兴趣,生成了基于领域兴趣的用户画像,随后将构建的用户画像应用于个性化推荐领域,解决了小众领域因用户量少、信息不足而难以精准刻画用户画像的问题.该方法在以下三方面显著不同于其他相关研究工作:1)基于领域文本快速构建领域伪本体,构建基于伪本体的用户画像建模方法;2)采用词向量将网页映射到伪本体,构建画像生成算法;3)基于领域概念间相似度构建画像优化算法.最后,本文使用了交响乐团的售票数据及用户的网络浏览数据,采用多个指标进行实证分析,验证了本文提出的画像建模方法的有效性与合理性.  相似文献   

10.
Web服务应用的一个关键问题是如何发现需要的服务.传统的服务发现利用UDDI和WSDL等技术,采用关键字的搜索方法,需要人工干预且缺乏语义、查准率低.针对上述不足提出了一种基于OWL描述的三级匹配模式并对服务请求与服务发布的文本描述、功能描述和服务参数三个方面进行相似度计算,分别得到服务请求与服务发布之间的文本相似度、功能相似度和参数相似度,综合这三个方面的相似度进行排序,帮助服务请求者找出符合其请求的服务.实验表明,该方法在查准率和查全率方面取得了较好查询效果.  相似文献   

11.
如何降低支持向量机海量训练样本的数目,是提高算法速度的关键。提出利用支持向量分布的几何特征建立基于特征空间中支持向量信息测度的快速算法,对于训练样本首先进行基于支持向量信息测度升序排序处理,然后根据训练样本提供的信息测度选择合适的训练样本子空间,在该样本子空间内采用乘性规则直接求取Lagrange因子,而不是传统的二次优化方法;最后针对附加残余样本进行交叉验证处理,直到算法满足收敛性准则。各种分类实验表明,提出的算法具有较好的性能,特别是在训练样本庞大、支持向量数量较多的情况下,能够较大幅度地减少计算复杂度,提高分类速度。  相似文献   

12.
针对航空发动机结构复杂、性能退化参数众多、寿命预测精度低等问题,提出了一种基于退化特征相似性的寿命预测方法。首先通过基于Relief算法的退化特征筛选、基于主成分分析(principal component analysis,PCA)的特征提取和基于核函数的特征平滑,提取低维正交多变量退化特征;然后进行特征的相似性匹配,寻找与当前样本特征片段最相似的一组历史样本中的特征片段集合,将这些片段对应的RUL信息融合并采用密度加权方法得到当前样本的寿命预测估计值;最后通〖JP2〗过美国国家航空航天局(national aeronautics and space administration,NASA)提供的航空涡轮扇发动机仿真数据集验证了该方法的有效性,其寿命预测性能高于现有几种代表性方法。  相似文献   

13.
从极化合成孔径雷达(synthetic aperture radar, SAR)图像中提取多种特征向量堆叠成一个高维特征向量用于地物分类,将导致部分特征向量的分类能力减弱或丧失。针对此问题,将每种特征向量看作为不同视角数据,提出了一种基于一致相似度网络融合的极化SAR图像非监督地物分类方法。首先,将极化SAR图像进行过分割,基于超像素提取5种特征向量以构建5个相似度矩阵;其次,采用一致相似度网络融合多视学习算法生成融合的相似度矩阵;然后,基于该矩阵进行谱聚类;最后,提出一种分类后处理策略修正错分像素。仿真和实测极化SAR图像地物分类结果表明,该方法性能优于其他5种经典方法。  相似文献   

14.
聚类算法常需处理海量和高维的大数据集,为了提高算法的效率,设计并行的聚类算法,以提供更好的计算能力是十分必要的。集群系统是目前流行的高效并行计算环境,针对大数据集聚类问题,集群系统的运用是一种很好的选择。由于RSOM(recursive self-organizing mapping,RSOM)模型具有内在的层次化及分布式结构特点,本文研究了基于集群的集中调度式RSOM树并行算法,并通过视频图像特征集实例证实了算法的可行性。  相似文献   

15.
由于存储成本低,查询速度快,哈希检索算法已被广泛应用于大规模影像检索。针对大规模遥感影像数据集训练低效问题,提出了面向查询点进行特征学习的遥感影像检索方法。首先,利用深度卷积网络对具有多语义标签的遥感影像数据训练集提取遥感影像特征;然后,面向查询点学习得到哈希函数并生成查询点的二进制哈希码;最后,通过迭代学习得到整个数据库的二进制哈希码来实现影像检索,有利于提高检索精度;同时,该方法避免了对整个数据库进行特征提取,从而可以更有效地利用大规模数据库中的监督信息。在3个不同数据集上的实验结果表明,该方法检索性能优于其他多种先进方法。  相似文献   

16.
为了提高海量XML文档集的聚类质量,提出了一种基于向量空间模型的矩阵迭代自组织XML辅助聚类算法。该算法以XML键为基础,把XML文档转化为向量矩阵,通过矩阵迭代自组织学习对XML文档实施取消、分裂与合并等优化措施。为了加速算法的收敛性,在算法中引入辅助策略,虽然不一定达到矩阵向量分类间隔最大化的目标,却在尽可能分类的情况下使得运算时间缩短,其XML键权重调整更有利聚类效果。对比其它向量聚类算法,一系列仿真实验表明所提出算法具有一定的有效性及合理性。  相似文献   

17.
The risk classification of BBS posts is important to the evaluation of societal risk level within a period. Using the posts collected from Tianya forum as the data source, the authors adopted the societal risk indicators from socio psychology, and conduct document-level multiple societal risk classification of BBS posts. To effectively capture the semantics and word order of documents, a shallow neural network as Paragraph Vector is applied to realize the distributed vector representations of the posts in the vector space. Based on the document vectors, the authors apply one classification method KNN to identify the societal risk category of the posts. The experimental results reveal that paragraph vector in document-level societal risk classification achieves much faster training speed and at least 10% improvements of F-measures than Bag-of-Words. Furthermore, the performance of paragraph vector is also superior to edit distance and Lucene-based search method. The present work is the first attempt of combining document embedding method with socio psychology research results to public opinions area.  相似文献   

18.
将高维特征用于跳频电台细微特征个体识别具有很大优势,为了增强对跳频电台的分类识别能力,需要增加特征类型和维数,提高特征集的表征能力,但同时会引入大量冗余特征,导致分类器计算时间过长,分类正确率降低。为了降低高维特征集维数,首先采用相关性快速过滤特征选择算法,删除高维特征集中的不相关冗余特征,得到最优特征集。然后利用经过参数优化的支持向量机(support vector machine, SVM)分类器进行训练分类。实验表明,所提算法能够对高维特征集进行合理的降维,提高了SVM的分类器的分类性能,在保证分类正确率的基础上,降低了运算量,提高了跳频电台细微特征识别的时效性。  相似文献   

19.
针对现有技术体系如何实现定量化的网络化建模和识别技术创新的模式和机理两个主要问题,提出数据驱动的技术创新网络构建方法,挖掘出技术文档的关键字向量,结合向量空间模型实现技术相似度的定量计算,生成技术创新时序网络。讨论了技术创新网络基本结构,分析了技术创新网络的模体类型与特性,并计算了模体重要性剖面以进一步确定其网络特征,得出技术创新具有强合作性且技术创新网络与生物网络以及信号传输网络属于同一个网络超家族的结论。并以技术评论数据为例验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号