首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对领域本体构建过程中获取概念间语义关系的困难, 提出了一种新的本体关系学习方法——概念特征词法, 支持自动化地构建领域概念间的关系集合. 该方法首先基于语境将领域概念表示为特征词向量模型, 然后通过计算向量的相似度来确定两个概念之间是否存在语义关系. 依据领域专家定义的金标准, 对概念特征词法的学习结果做了详细的性能分析. 结果表明: 相较于已有方法, 本文方法的准确率和召回率更令人满意. 概念特征词法可广泛应用于本体构建、文本挖掘和语义检索等领域.  相似文献   

2.
随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model, VSM)进行文本表示,但是该方法面临着文本向量维度较高及文本语义相似度难以度量的问题。提出一种改进的文本相似度计算方法,从大量的特征空间中选择出具有代表性的元数据特征向量元素,以降低向量空间的维度;构建领域概念树并设计基于领域概念树的文本相似度算法,对领域概念中广泛存在的同义词进行处理,以提高文本之间语义相似度度量的性能。实验结果表明:通过降维和概念相似度计算可提高文本相似度计算的性能。  相似文献   

3.
答案选择的主要任务是对问答系统中问题的候选答案排序,当前主流的方法是基于表示学习方法,通过神经网络对问题和答案进行向量表示,然后根据向量相似度对候选答案排序,该类方法忽略了问题和答案的局部关联性。针对这一问题,提出了一种基于多尺度相似度特征的深度学习模型。该模型采取传统的深度学习模型分别提取问题和答案的特征,然后计算各个尺度下的特征相似度得到问答的相似度矩阵,最后采取三种不同的相似度特征学习模型对相似度矩阵学习得到联合相似度。在公开数据集WebQA上进行实验验证,实验结果表明将相似度特征学习方法引入传统深度学习模型获得了较为明显的提升。  相似文献   

4.
基于网络浏览行为,研究小众领域的用户画像建模方法.本文提出构造领域文本伪本体的方法,并从用户的网络浏览行为中挖掘用户兴趣,生成了基于领域兴趣的用户画像,随后将构建的用户画像应用于个性化推荐领域,解决了小众领域因用户量少、信息不足而难以精准刻画用户画像的问题.该方法在以下三方面显著不同于其他相关研究工作:1)基于领域文本快速构建领域伪本体,构建基于伪本体的用户画像建模方法;2)采用词向量将网页映射到伪本体,构建画像生成算法;3)基于领域概念间相似度构建画像优化算法.最后,本文使用了交响乐团的售票数据及用户的网络浏览数据,采用多个指标进行实证分析,验证了本文提出的画像建模方法的有效性与合理性.  相似文献   

5.
本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体(半)自动构建的一项技术。通过研究中文本体学习这一领域存在的问题,提出了基于遗传算法和种子概念的本体概念提取算法。介绍了当前基于非结构化数据源的本体概念主要提取算法,在遗传算法和种子概念的基础上,设计了一种基于非结构化数据源的本体概念提取算法。实验证明,本算法在特定领域本体学习方面取得了良好的效果。  相似文献   

6.
基于相异度核空间的支持向量机算法   总被引:1,自引:0,他引:1  
提出基于相异度核空间的混合流形学习与支持向量机(SVMs)算法用于解决高维数据分类问题. 该算法使用SVMs对流形学习降维后的低维嵌入做分类.通过加常数方法构造了衡量数据点相异度的特征空间. 证明了该特征空间不仅能够衡量数据点之间的相异度,还满足Mercer条件对于支持向量机分类核空间的半正定性的要求. 在仿真实验中,采用UCI机器学习数据库上标准分类数据集为样本. 对比构造的相异度核空间与常用核函数如线性核、多项式核、高斯核在支持向量机分类时的 分类精度来验证有效性和优越性.  相似文献   

7.
基于认知学习的最小风险贝叶斯邮件过滤算法   总被引:9,自引:0,他引:9  
提出了超高维向量空间中的一种新的邮件向量表示方法,在考虑邮件误判风险的基础上,给出了一种基于认知学习模式的邮件过滤新算法。该算法模拟人类的认知学习过程,将系统分类与用户识别有效地结合起来,使得邮件过滤时的误判风险最小化。实验结果表明,算法具有较好的学习能力和学习效果,在邮件过滤应用中,能获得较高的查全率和查准率。  相似文献   

8.
稀疏编码算法是一种常用的图像数据表示方法.为了处理高度非线性分布的数据,文中提出了一种核稀疏概念编码算法,并应用于图像表示.该算法首先对邻域图进行谱分析,提取数据的几何流形结构信息;然后将原始特征空间数据映射到高维特征空间中,利用谱回归在高维特征空间中来计算基向量;最后在高维特征空间中对每个样本逐个进行表示.文中算法不仅能有效地处理非线性结构数据,而且只需求解一个稀疏特征值问题和两个回归问题,计算简单有效.在Yale、ORL和PIE图像库的聚类实验表明,文中算法的准确率和归一化互信息均优于其它几种对比算法.  相似文献   

9.
协同过滤算法和二进制粒子群算法是目前学习资源推荐领域研究热点.然而,协同过滤算法推荐的学习资源过于随机化,不能满足学习者进行整体知识建构的要求.而基于二进制粒子群算法构建的资源推荐模型,以推荐所有学习者完整的学习资源为目标,且模型数据较难预测,不符合在线智能化学习的趋势.针对以上问题,提出了基于多维特征差异的个性化学习资源推荐算法:首先根据学习者和学习资源多维特征差异建立学习资源推荐模型,并考虑了学习偏好;其次引入协同过滤技术对模型数据进行预测;最后针对推荐模型的多目标优化特征,将协同过滤算法和二进制粒子群算法结合,提出了对惯性权重和种群多样性进行动态协同调整的自适应二进制粒子群算法,实现了个性化学习资源推荐.实验证明,该算法具有较好的准确性,能够满足个性化学习资源推荐的需要.  相似文献   

10.
为了提高用户相似度计算的精度和知识推送的准确度,提出了一种基于热门物品惩罚和用户兴趣变化的协同过滤推送算法。该算法首先对知识项进行聚类;其次在每一类中引入用户兴趣度函数来对类内未评分知识项进行评分值预测;然后在每个类的用户相似度计算中引入热门物品权重系数,用以惩罚热门物品对用户相似度的影响;最后在推送当中引入用户兴趣随时间变化的权重系数。实验还采用MovieLens数据集进行了测试,结果表明,改进后的算法比传统的协同过滤算法在推送准确度上有明显提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号