共查询到20条相似文献,搜索用时 78 毫秒
1.
针对基于网络结构的推荐算法在资源分配过程中采用平均分配方式,产生的推荐结果个性化程度低的问题,提出了一种结合用户偏好和项目属性的网络结构推荐算法。通过用户评分数据和用户对项目属性偏好程度计算用户偏好相似度,在资源分配过程中根据用户偏好相似度调整资源分配方式,使其更加合理,产生更好的个性化推荐结果。Movie Lens数据集上的实验表明,所提出的推荐算法相比于其它算法,显著提高了准确率、召回率、多样性,降低了推荐项目的流行度。 相似文献
2.
针对在自然语言处理中起着关键作用的文本相似度计算问题,提出了一种神经网络深度学习的词向量模型计算方法.利用词向量计算文本语义相似度,并采用高频词滤波的方法削弱扰动的影响.对百度新闻、新浪新闻等的中文词库进行训练,并与传统的检测方法进行对比.实验结果证明了提出方法的有效性和准确性. 相似文献
3.
4.
基于相似关系的变精度粗糙集的数据约简 总被引:1,自引:0,他引:1
柴造坡 《哈尔滨师范大学自然科学学报》2009,25(4):18-21
基于最大相似类的变精度粗糙集模型.此模型把变精度粗糙集的基础由等价关系拓展到条件更弱的相似关系,更好地利用数据间的相关信息,扩大了粗糙集理论的应用范围.讨论了相似变精度粗糙集的性质与属性约简,举例说明了相似的变精度粗糙集在大学生体质检测数据约简中的应用. 相似文献
5.
设计了一种基于VSM模型的动态文本分类器,它能针对文本的不同类别建立不同的特征子空间,各特征子空间之间相互独立,同时能将文本分类中常用的2个评估指标召回率和精确率转化为正确分类率和错分率;考察了特征子空间的维数和判定界值对这2个指标的影响.该动态文本分类器能对用户输入的文本流进行动态分类. 相似文献
6.
熵权属性识别模型在电网公司综合评价体系中的应用 总被引:1,自引:0,他引:1
电网公司综合评价中各单指标的评价结果具有独立性,需要综合考虑各指标的属性.论文通过将熵值法与属性识别模型相结合,建立了电网公司综合评价的熵权属性识别模型,并运用熵值法来确定权重系数,能够避免权重确定的主观性问题.通过一范例对该识别模型进行分析,结果合理,计算简单. 相似文献
7.
《哈尔滨师范大学自然科学学报》2018,(6)
评分预测是推荐系统的重要环节,现在大部分的评分预测是利用用户的历史评分记录来推断该用户将给某个项目打多少分.该方法利用了用户历史评分记录,没有充分利用用户或者项目属性,平均绝对误差较大.针对以上问题,构造一种基于用户自画像的评分预测协同过滤推荐算法.该算法通过计算用户之间历史评分记录的相似度和用户自画像之间的相似度,然后计算出两种相似度的权重,把两种相似度乘以各自的权重进行组合.实验结果表明,构造的评分预测算法较好的减少预测评分和实际评分之间的平均绝对误差,提高了评分预测的准确性. 相似文献
8.
基于优化的文档频和粗糙集的特征选择方法 总被引:3,自引:2,他引:1
特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频方法,然后把粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择方法.该综合方法首先使用基于最小词频的文档频方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集. 相似文献
9.
基于知网的领域概念抽取与关系分析研究 总被引:2,自引:0,他引:2
唐一之 《湘潭大学自然科学学报》2009,31(1)
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度. 相似文献
10.
网络信息过滤机制的研究 总被引:4,自引:0,他引:4
探讨网络信息过滤的相关概念、网络信息过滤系统的体系结构、原理与技术、用户模型的构建、信息过滤算法的改进等问题.在阐述信息过滤一般应用模型的基础上提出网络文本信息过滤模型,分析网络文本信息过滤模型的应用特征及其组件,并着重讨论了布尔逻辑模型、概率模型和向量空间模型的基本原理与方法,最后就模型中两大技术应用存在的问题总结并提出了一些改进意见. 相似文献
11.
针对某市公安110接处警文本描述进行案件分类的需求,参考现有文本分类方法在其他行业的应用,搭建了应用于警情描述的文本分类系统.通过论证常见分类网络适用场合及其优缺点,结合对警情数据中案件描述特征的分析,提出了基于改进卷积循环神经网络的模型,该模型优化了关键特征提取过程,弥补了现有模型短文本局部特征提取不足的缺陷.实验表明,该模型的准确率比常见分类模型提升了2%~3%,且能够有效保证数据局部特征的关联性,可以对案件描述所对应的案件类型进行准确分类,从而提高公安接处警平台的自动化效率. 相似文献
12.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率. 相似文献
13.
随着互联网技术的飞速发展,网络信息资源越来越多,人们通过利用传统的搜索引擎很难获取自己感兴趣的资源,如何快速的获取用户感兴趣图书信息,成为当前急需解决的问题,本文采用基于内容的个性化推荐技术,对用户浏览的图书进行特征提取,并通过相似度计算,把用户最可能感兴趣的图书资源推荐给用户。 相似文献
14.
近年来与网络游戏虚拟财产有关的纠纷层出不穷,这些纠纷的解决不仅涉及运营商和用户的权利,还会影响网络秩序的稳定。对此需要明确网络游戏虚拟财产的法律属性,具体界定游戏运营商与用户之间的权利和义务,以保护相关当事人的权益,并设计一套简便有效的纠纷解决机制,以促进网络游戏产业的健康发展。 相似文献
15.
一种基于SOM和层次凝聚的中文文本聚类方法 总被引:2,自引:0,他引:2
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。 相似文献
16.
17.
《湖南师范大学自然科学学报》2015,(5)
随着互联网的迅速发展,XML已经成为互联网中最常用的数据交换与存储语言,如何从大量的XML文档中提取有价值的信息是目前的研究热点之一.本文提出了一种基于SET/BAG模型的改进的相似度计算方法.该方法将XML文档的每个节点转换成一个对象(由对象名、父对象、属性集合以及该对象相对于其父对象的权重组成),能较完整地表达XML文档的结构信息,并且通过调整重复节点的权重来降低其在相似度计算中的影响.在真实数据集与人工数据集上分别进行实验,仿真实验结果表明,本文提出的基于SET/BAG模型下改进的相似度计算方法能得到很好的聚类结果. 相似文献
18.
19.
20.
深度学习促进了自然语言处理技术的发展,基于文本生成的信息隐藏方法表现出了巨大的潜力.为此,提出了一种基于神经机器翻译的文本信息隐藏方法,在翻译文本生成过程中进行信息嵌入.神经机器翻译模型使用集束搜索(Beam Search)解码器,在翻译过程中通过Beam Search得到目标语言序列各位置上的候选单词集合,并将候选单词依据概率排序进行编码;然后在解码输出目标语言文本的过程中,根据秘密信息的二进制比特流选择对应编码的候选单词,实现以单词为单位的信息嵌入.实验结果表明,与已有的基于机器翻译的文本信息隐藏方法相比,该方法在隐藏容量方面明显提升,并且具有良好的抗隐写检测性和安全性. 相似文献