首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
为解决传统的协同过滤算法不能准确理解用户的喜好,影响推荐准确率和推荐效果,提出基于社会化标签语义相似度的协同过滤算法.算法以标签语义相似度为基础,将项目资源和相关标签的语义信息纳入,显著提高了推荐系统的预测性能.研究结果表明:与以具体评分数据为基础的算法相比,该算法较好地解决了词相似度和句子相似度计算问题,推荐准确度和性能较以往的协同过滤算法有明显提高,改善了推荐效果.  相似文献   

2.
为了提高基于标签的个性化推荐技术的准确率,提出了一种基于共同属性和标签共现的标签消歧模型,对已有的基于聚类的标签消歧算法进行改进,针对不同的标签语义问题分别采用不同的方法,缓解了原算法不能识别不同语义的问题。对于多义词语义问题,使用同义词模型进行消歧;对于近义词、同义词语义问题,使用近、同义词模型进行消歧,并将该模型应用于个性化推荐算法。利用公共数据集MovieLens Latest Datasets进行了个性化推荐实验。实验表明,当用户推荐项目数量递增时,推荐算法的准确率和召回率都有提高,能有效消除标签中存在的歧义。  相似文献   

3.
针对地理标签和评论信息的情感倾向对于推荐系统性能的影响,本文基于地理标签和用户评论情感分析提出有关兴趣点的推荐策略,并建立了一种基于内容的推荐模型.本系统首先对用户兴趣点信息进行有效的补充,并实现了用户兴趣点相似度度量.对无标签评论数据进行情感分析及挖掘,获取其情感倾向度.同时本系统结合了时间滑动窗口,更准确地把握用户评论和兴趣点的结合度.最终得到用户个性化推荐排名.本文方法涵盖了本地用户和外地用户的个性化推荐策略.通过实验数据表明,本文模型有效提高了推荐的准确度.  相似文献   

4.
一种基于社会化媒体和社会网络结构的混合推荐模型   总被引:1,自引:1,他引:0  
近年来,社交网络的迅速发展为在线用户之间的沟通和交流带来极大便利,为良好的信息推荐服务提供了丰富的资源,与此同时也为个性化推荐带来了更为复杂的技术挑战.本文通过自然语言处理技术获取用户在社会化媒体(新浪微博)中的个性化兴趣标签信息,应用到自行设计开发的社会化阅读应用牛赞网中.进一步地,利用用户在牛赞网中的阅读行为和社交信息,结合用户的社会化媒体兴趣,提出了一种混合推荐模型.实验基于牛赞网中的实际数据集,并与基于用户的经典协同推荐模型进行了对比,结果表明,提出的模型在推荐性能的几个指标(AUC、准确率、召回率、多样性和新颖性)上都有很大的提高.最后,通过对牛赞网中几个典型用户进行进一步的案例分析后得出,混合推荐模型的最优参数需要根据不同社会化行为的用户进行调节.  相似文献   

5.
个性化推荐服务是高校智慧图书馆的建设重点,基于此,提出了图书推荐系统整体架构.首先从读者的属性、行为、兴趣等标签维度构建用户画像模型,其次考虑读者认知能力存在差异化的特点,将读者按照不同的身份类型划分,再结合基于协同过滤、内容及属性相似度的混合推荐算法进行图书推荐.最后,通过Hadoop大数据平台向目标读者推荐TOP-N图书,实验结果表明,基于该架构模型的图书推荐系统的推荐准确度高,并且有效缓解了推荐系统的冷启动问题.  相似文献   

6.
传统基于物品的协同过滤算法由于物品相似度矩阵稀疏,推荐准确率不高.针对这一问题,提出一种基于标签和改进杰卡德系数的协同过滤算法,进行电视节目个性化推荐.首先,爬取相关信息对原始数据进行扩充,并利用统计学方法对时间特征进行归一化处理,计算用户偏好系数;然后,统计出现次数较高的类别作为推荐类别标签,并利用改进的杰卡德系数构造标签相似度矩阵;最后,根据推荐类别标签的用户偏好系数计算节目的推荐系数.实验结果表明,基于标签的协同过滤算法可以降低稀疏矩阵对推荐准确率的影响,相比基于物品的协同过滤算法,准确率提高了5%,召回率提高了3.1%.另外,使用改进的杰卡德系数计算相似度,减少了热门标签对推荐系统的影响,进一步将准确率提高了5%,召回率提高了2.3%.  相似文献   

7.
标签推荐系统是为目标用户推荐最可能用来标记某个资源的一系列标签.目前基于塔克分解模型,相比传统的FolkRank等算法具有更好的预测质量,但它本身的时间复杂度很高,很难适用于大中型数据集;而正则分解模型的时间复杂度虽然为线性,但预测质量并不高.针对上述问题,在改进塔克分解模型的基础上首先提出成对交互张量分解模型PITD.该模型仅考虑用户、资源和标签3个特征之间的部分两两交互关系,减少了无关信息对模型性能以及效率的影响.进而,利用贝叶斯个性化排序方法对PITD模型进行推导,并设计了相应的优化算法.最后,在真实数据集上的广泛实验表明,PITD模型比对比算法具有更好的推荐性能.  相似文献   

8.
针对NPM平台上存在大量的软件包没有标签或标记不完善的问题, 提出一种基于seq2seq模型的深度学习方法为软件包推荐标签. 首先, 利用ECMAScript工具分析软件包的源码构建出包的函数调用图, 遍历函数调用图从而将软件包转换成一组具有包语义信息的函数调用序列; 其次, 训练seq2seq模型, 并将训练好的模型用于软件包的标签推荐工作, 该模型能将包的函数调用序列映射到一组预测的标签序列上, 从而完成软件包的标签推荐. 实验结果表明, 该方法能为软件包推荐一组合理的标签, 准确率达82.6%.  相似文献   

9.
旅游景点数量庞大,而用户本身旅游次数有限,所以用户旅游数据非常稀疏,进而影响了推荐结果的准确度.为了解决这一问题,从海量游记中提取与旅游景点密切相关的4个因素——地域、时间、主题、类型相关的特征标签,来丰富数据信息.一方面通过基于标签内容的方法为用户推荐感兴趣的景点;另一方面,用景点特征标签描述用户兴趣特征,根据用户兴趣标签找到相似用户群,通过协同过滤的方法为用户推荐感兴趣的景点.实验结果表明,基于标签的协同过滤算法较传统的协同过滤算法推荐准确率提高了63.7%,比基于景点热度的推荐算法提高了22.5%;基于标签内容的推荐算法比基于景点热度的推荐算准确率提高了27.6%.进一步,通过线性加权的方式混合两种算法,使两种算法优势互补,从而得到更好的推荐效果.最终使得基于标签的混合算法的准确率,比基于标签的协同过滤算法提高了61.3%,比基于标签内容的推荐算法提高了54.7%.旅游景点推荐准确度的提高,将带来更好的用户体验,使在线旅游网站更加具有竞争力.  相似文献   

10.
引入云模型改进基于标签的用户相似性和资源相似性度量方法,进而提出了基于标签和云模型的协同过滤算法.通过在Movie Lens数据集上的实验表明:改进后的算法在precision,recall和F1-measure三个指标上均取得较好的推荐效果,推荐效率均优于传统的方法.  相似文献   

11.
针对隐马尔可夫(HMM)词性标注模型状态输出独立同分布等与语言实际特性不够协调的假设,对隐马尔可夫模型进行改进,引入马尔可夫族模型。,该模型用条件独立性假设取代HMM模型的独立性假设。将马尔可夫族模型应用于词性标注,并结合句法分析进行词性标注。用改进的隐马尔可夫模型进行词性标注实验。实验结果表明:与条件独立性假设相比,独立性假设是过强假设,因而基于马尔可夫族模型的语言模型更符合语言等实际物理过程;在相同的测试条件下,马尔可夫族模型明显好于隐马尔可夫模型,词性标注准确率从94.642%提高到97.126%。  相似文献   

12.
语义标注所用标签数目众多,训练数据更为稀疏,用HMM作语义标注面临参数估计不准的难题。不同于传统的解决数据稀疏方法,以《同义词词林》的层次式结构为依据,提出了利用语义层次的提升来改善HMM(hidden Markov model)中参数的估计质量;在算法实现中,采用选择受限策略来解决因语义提升而引起的模型辨别力下降问题。测试表明,在训练数据相对稀疏的情况下,适度调整模型的语义层次可大幅提高语义标注的精度,该方法表现出较好的可塑性。  相似文献   

13.
词性标注是词法分析的基础.HMM是一个数学模型,具有算法成熟、效率高、易于训练的优点;负反馈是一个控制模型,在规则中引入负反馈,可以增强规则的客观性.本文探讨了两个模型,然后将它们应用于词性标注中.实验结果表明两者的结合是有效的和成功的.  相似文献   

14.
以已经分词并进行了词性标注和介词短语标注的《人民日报》为实验语料,选取其中出现频次高于20次的61个介词为实验对象,采用支持向量机、最大熵和条件随机场这3种统计模型,对介词短语边界识别进行了研究.实验结果表明在3种模型中,采用条件随机场模型效果最好,微平均准确率达到了95.68%.  相似文献   

15.
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好.  相似文献   

16.
利用广义系统的传感器故障模型,研究广义系统H∞可靠性控制器的设计问题·首先,建立了广义系统传感器故障的一般模型,在此模型的基础上设计基于观测器的控制器·其次,定义了广义系统的H∞可靠性控制器·接着,用带广义约束的广义代数Riccati不等式(GARI),给出传感器正常及出现部分故障时,所设计的控制器使得闭环广义系统容许且传递函数H∞范数有界的充分条件,即存在H∞可靠性控制器的充分条件·同时,还通过对广义系统的受限等价变换,去掉了广义约束,简化了带广义约束的GARI·进而可以通过解简化后的GARI来设计H∞可靠性控制器·最后,给出一个数值例子来演示设计过程并说明此方法的有效性·  相似文献   

17.
近年来基于字的词位标注的方法极大地提高了汉语分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列数据标注模型,基于字的词位标注汉语分词方法逐渐成为汉语分词的主要技术路线.针对一些领域文本中含有较多的英文词汇、缩写、数字等非汉字子串,提出了一种基于字和子串联合标注的汉语分词方法,该方法将子串看作和汉字等同的一个整体,采用四词位标注集,使用条件随机场模型深入研究了基于字和子串联合标注的汉语分词技术.在CIPS-SIGHAN2010汉语分词评测所提供的文学、计算机、医药、金融四个领域语料上进行了封闭测试,实验结果表明此方法比传统的字标注分词方法性能更好.  相似文献   

18.
为了进一步提高中文语料库中语料的词性标注效率,在分析最大熵模型(MEM)和隐马尔科夫模型(HMM)所涉及理论、算法及其在中文词性标注技术中的应用的基础上,进行了基于MEM和HMM的中文词性标注实验.实验结果显示,基于MEM和HMM的中文词性标注算法都获得了一致性很好且覆盖率较高的标注效果,中文词性标注的准确率、召回率和F1这3个指标均达到92%以上;MEM的标注效果总体上比HMM的稍佳.  相似文献   

19.
简要介绍了表位附加标记的概念、应用、优缺点及其发展前景,并以c-myc标记肽为例,简述如何构建用于融合蛋白表达的植物表达载体,及如何利用标记肽及其特异性抗体表达并纯化融合蛋白质.  相似文献   

20.
为了进一步提高中文语料库中语料的词性标注效率,在分析最大熵模型(MEM)和隐马尔科夫模型(HMM)所涉及理论、算法及其在中文词性标注技术中的应用的基础上,进行了基于MEM和HMM的中文词性标注实验.实验结果显示,基于MEM和HMM的中文词性标注算法都获得了一致性很好且覆盖率较高的标注效果,中文词性标注的准确率、召回率和F1这3个指标均达到92%以上;MEM的标注效果总体上比HMM的稍佳.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号