首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对传统协同过滤算法用户相似度计算准确度低的问题,在推荐系统中引入项目属性信息和项目标签信息,提出融合标签和属性信息的混合推荐算法。首先将用户对项目的评分转化为用户对项目属性值及标签的评分,构建用户-属性值偏好矩阵和用户-标签偏好矩阵,将其作为用户描述文件;然后分别根据用户-属性值偏好矩阵和用户-标签偏好矩阵计算用户之间的相似性,并将结果加权平均,得到每个用户的最近邻居列表;最后根据邻居对项目的评分产生推荐结果。由于项目属性值的数量和主要标签数量远低于项目数量,该算法能有效解决协同过滤算法的数据稀疏性问题,同时也能更直观地描述用户的偏好。而且在构建用户描述文件时,考虑到用户偏好随时间变化的规律,对用户不同时间点的评分赋予不同的权重,权重随着时间推移逐渐增大。实验结果表明,该算法能更准确地预测用户对未评分项的评分,提高推荐的准确度和召回率。  相似文献   

2.
为了从文本中可以更加准确地分析其蕴含的内容,给人们的生产生活提供建议,在基于深度学习的传统多标签分类方法的基础上,提出一种融合多粒度特征和标签语义共现的多标签分类模型。该模型利用双向长短时记忆网络双向长短时记忆网络(bidirectional long short-term memory network, Bi-LSTM)提取多粒度的文本特征,获得不同层次的文本特征;并通过计算pmi的方式构建标签关系图,利用图卷积网络(graph convolution network, GCN)深入提取标签的隐藏关系,获得具有标签信息的文本表示;最终融合多粒度文本特征,进行多标签文本分类。在AAPD和news数据集上进行实验。结果表明:所提出模型的Micro-F1值分别达到0.704和0.729,验证了模型的有效性。  相似文献   

3.
针对一词多义现象, 提出一种基于上下文规则的词义消歧算法(CR-WSD), 该算法以定义消歧规则的方式确定多义词在文本中的具体含义, 利用WordNet中知识结构和上下文关系进行语义选择, 完成词义消歧. 用Senseval 3中的全文作为测试集, 实验结果表明该算法能有效地实现词义消歧.  相似文献   

4.
基于领域知识和词向量的词义消歧方法   总被引:3,自引:0,他引:3  
利用无标注文本构建词向量模型,结合特定领域的关键词信息,提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料,通过与Lesk等其他消歧方法进行比较,证明了所提方法的有效性。通过引入不同的领域知识,证明该方法亦可在其他领域的文本消歧任务中加以应用。  相似文献   

5.
在机器翻译涉及的技术很多.其中,语言消歧就被列为机器翻译最为急迫解决的问题之一.本文的的工作首先对语言歧义的问题进行分析。然后论述一些具体消歧方法.  相似文献   

6.
传统的中文词义消歧方法是通过观察文本的上下文信息、词性等显性特征建立消歧模型,本文通过对歧义产生原因进行深入的分析,发现词语之间隐含的语法结构、语义信息等也会导致歧义的产生,可以考虑将这些信息加入消歧模型进行消歧。由于《知网》知识库中对词语之间的搭配信息进行了总结,本文借助《知网》提取训练语料库所获取的词语搭配信息的隐性语义特征,结合显性的上下文特征,采用条件随机场的方法进行词义消歧。最后,通过实验进行词义消歧和效果验证,结果表明:本文采用的方法与传统的条件随机场消歧相比,词义消歧的准确率得到了提高。  相似文献   

7.
本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者、标题、摘要、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.  相似文献   

8.
基于语境计算模型的汉语词义消歧   总被引:1,自引:1,他引:1  
提出利用相对词频(Relative Word Frequency,RWF)来评估词语之间搭配强度。基于相对词频,提出语境计算模型,用于对汉语文本词义进行消歧。选择3个常用多义词进行试验,结果验证了该方法的有效性。  相似文献   

9.
考虑了实体的全局一致性,充分利用了知识库中实体间结构化的语义信息.在PageRank算法的基础上,提出一种基于双向语义关联的实体消歧算法,该算法通过在维基百科中抽取出实体之间的超链接关系构建知识图谱,重新定义两个实体之间的平均最短路径,并联合实体之间的语义信息以完成实体链接消歧的任务.在公开数据集上进行的实验结果显示:该算法能提高实体消歧结果的准确率和召回率,实验结果优于当前主流算法.  相似文献   

10.
在机器翻译中,从原文输入到译语文输出的各个分析和转换层面上都存在着不同类型的歧义现象,因此消歧处理成为机器翻译所面临的最重要同时了难的课题之一。前人 一些机器翻译产生深刻影响的文法理论,但歧义问题始终未能得到圆满解决。在基于SC法的智能汉机器翻译系统(IMT/EC)中,充分利用文法的技术特点,在机器翻译的几个主要阶段处理了不同类型的歧义问题,使IMT/EC的译准率明显提高。  相似文献   

11.
提出一种新的文档表示模型——基于共现词对的向量空间模型。模型以文档中共现的词对为基本考察对象,通过统计学特征选择有代表性的词对来表示文档。基于覆盖算法的文本分类实验表明此模型有较强的文档表示效果,为文本自动化处理提供了一条新思路。  相似文献   

12.
基于类别共生矩阵的纹理疵点检测方法   总被引:8,自引:0,他引:8  
根据有规则纹理的特点,提出了基于类别的共生矩阵来描述纹理特征,从而很好地将正常纹理与疵点区分开.分析了传统的灰度共生矩阵在计算纹理特征时计算量大,且分辨能力差的缺点.为了克服灰度共生矩阵在计算量和分辨能力上的缺点,定义了类别共生矩阵.在类别共生矩阵的算法中,首先学习纹理的一些基本特征以确定类别共生矩阵的一些关键参数,如纹理的概率密度分布、纹理的主方向和周期,以及分类准则等重要参数,然后计算类别共生矩阵并提取白疵点增强、黑疵点增强和一致度等三个特征,最后采用异常点检测的方法即可很好地区分正常纹理和疵点.实验证明,该方法比已有的灰度共生矩阵计算量小,并具有更突出的分辨纹理和疵点的能力.  相似文献   

13.
基于HNC理论的一种词汇歧义消解规则   总被引:1,自引:0,他引:1  
同型岐义的消解问题是自然语言处理中必须面对的一个难题,同型岐义的消解策略的研究和水平的提高,将极大地提高中文信息处理的水平。本文介绍了HNC理论的“同行优先规则”,并举例说明了该规则在词汇岐义消解中的应用。  相似文献   

14.
针对NPM平台上存在大量的软件包没有标签或标记不完善的问题, 提出一种基于seq2seq模型的深度学习方法为软件包推荐标签. 首先, 利用ECMAScript工具分析软件包的源码构建出包的函数调用图, 遍历函数调用图从而将软件包转换成一组具有包语义信息的函数调用序列; 其次, 训练seq2seq模型, 并将训练好的模型用于软件包的标签推荐工作, 该模型能将包的函数调用序列映射到一组预测的标签序列上, 从而完成软件包的标签推荐. 实验结果表明, 该方法能为软件包推荐一组合理的标签, 准确率达82.6%.  相似文献   

15.
基于联系数的多属性决策模型   总被引:1,自引:0,他引:1  
针对权重为区间数且属性值为实数和区间数相混合的多属性决策问题,提出了基于联系数的多属性决策模型.该模型将区间型权重、实数型及区间型属性值转化成联系数的形式,利用联系数的运算规则确定决策方案的排序.该方法集确定与不确定分析为一体,反映了不确定性对结果的影响,所需计算量较少,便于应用.实例分析验证了该方法的有效性和实用性.  相似文献   

16.
以属性测度空间的粗糙集模型为基础,针对S-粗集中元素的动态特性,提出了双向S-属性粗糙集的概念,讨论了双向S-属性粗糙集的性质,并结合实例就双向S-属性粗糙集的精度进行了讨论。  相似文献   

17.
指出了不相容决策表中存在的正域扩展方法的不足,基于决策表局部最小确定性与条件属性对决策的最小确定性程度,构建了一种改进的扩展正域方法。基于改进的扩展正域方法,提出了计算不相容决策表中认知属性核和认知属性约简的算法。实验结果表明了本文方法的有效性。  相似文献   

18.
以提高洪水资源利用率为目标,研究利用实时水雨工情及短期雨洪预报等综合信息的汛期库水位实时动态控制方法,即改进的预蓄预泄法.应用实例表明,在不降低水库上下游防洪标准的前提条件下,可使桓仁水库及梯级库群的发电效益明显增加.该综合信息的汛期库水位实时动态控制方法,对北方水资源短缺地区调节性能较高的大型水库(水电站)汛期实时调度,有较好的借鉴意义.  相似文献   

19.
网页信息隐藏技术是将网页作为隐蔽通道进行秘密信息传输的一种技术。基于网页结构特点,提出了基于标记字典的网页信息隐藏算法,该算法采用多标记组合的思想,在不增加原始网页大小和算法复杂度的基础上,使网页信息隐藏容量提高了2.5倍,也为网页信息隐藏算法的研究提供了思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号