首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
从语义分析角度出发,对产品评论文本进行情感倾向分析研究。首先在现有的情感词典的基础上整理并构建一个面向产品评论的情感词典;然后以句子为单位对评论文本进行语句分割,根据词频统计提取产品的主要特征词,并构建特征关联词词库,针对不同的特征分别进行情感倾向分析;最后对所有评论文本作加权计算获得其总体情感倾向。实验结果表明,基于语义分析的产品评论挖掘方法具有较好的情感分析效果。  相似文献   

2.
为了解决购物网站信息量过大问题,对用户进行精准商品推荐,提出了一种基于协同过滤算法的电子商务推荐系统,根据网站收集的用户历史行为数据计算物品的相似度,进而预测用户对物品的偏好,根据兴趣度对用户进行物品推荐。在基于协同过滤算法的基础上,考虑了用户活跃度和时间上下文关系对用户兴趣的影响,设计了完整的推荐算法流程。实验证明该算法确实改善了推荐的精确性,说明用户活跃度和时间因素确实对用户行为有影响。  相似文献   

3.
提出融合用户评论的协同过滤推荐算法,通过挖掘电商网站的用户评论信息,获取用户评论中的产品特征和意见,通过计算每个特征意见对的极性,得到特征矩阵,结合用户意见质量形成的用户评分矩阵,求出用户评分的相似度.最后结合特征矩阵和用户评分相似度得出目标用户的综合相似度,并由预测评分得出产品推荐表,对用户进行产品推荐.实验结果表明,提出的算法与常用的推荐算法相比,改善了推荐的质量,同时推荐精度得到提高.  相似文献   

4.
内容推荐算法是在电子商务网站中应用比较广泛的推荐技术之一,主要针对商品之间属性相似度和用户对商品兴趣度建模.但传统的内容推荐算法不能及时反映用户对商品兴趣度的时间变化,基于这点提出一种基于中间商品兴趣度加权的内容推荐算法.改进算法增加了兴趣度时间权重函数和商品时间权重函数,可以提高商品推荐准确率,仿真试验结果证明该算法是有效的.  相似文献   

5.
推荐系统广泛地应用在网络平台中,推荐模型需要预测用户的喜好,帮助用户找到适合的电影、书籍、音乐等商品.通过对用户评分和评论信息的分析,可以发现用户关注的商品特征,并根据商品的特征,推测用户对该商品的喜好程度.本文提出将评论中隐含的语义内容与评分相结合,设计并实现了一种新颖的商品推荐模型.首先利用主题模型挖掘评论文本中隐含的主题分布,用主题分布刻画用户偏好和商品画像,在逻辑回归模型上训练主题与打分的关系,最终评分可以被视为是对用户偏好和商品画像的相似程度的量化表示.最后,本文在真实数据上进行了大量对比实验,结果证明该模型比对比系统性能优越且稳定.  相似文献   

6.
为了提高特征词权重和文本语义相似度计算的精确性,文章提出了一种基于加权语义网的改进文本相似度计算方法。该方法首先以特征词为节点,以特征词窗口共现原理创建边,以频率-逆文本频率(term frequency-inverse document frequency,TF-IDF)值作为特征词节点的初始权值,融合共现频率和概念语义距离自定义边权重计算方法,构建加权文本语义复杂网络。然后使用语义网络中特征词综合特征指数排名靠前的m个词组成特征向量,利用搬土距离(earth mover's distance,EMD)衡量两个文本间的语义相似度。最后基于公开数据集对文本进行聚类实验,实验结果表明,在基于F1度量值标准上文章提出的方法要优于传统的文本相似度计算方法。  相似文献   

7.
刘炜  李明  杨合立 《甘肃科技》2011,27(22):42-45
基于前人在TDT中对语义矢量的相似性计算研究,以及本体和语法结构在文本相似性研究方面的应用成果,提出了以词频分析作为辅助手段,将新闻中的关键要素归纳为时间、空间、参与事件的主客体、行为等几个语义类;借助WordNet与本体技术计算文档特征词的相似度,并且结合文本的语法结构特点,共同应用于文本的相似度计算,并以此作为新事件检测中相似度计算的基础,提高新事件检测的准确性。  相似文献   

8.
从海量无结构互联网信息中提取高质量的社会网络有着广阔的应用前景和较高的学术价值,本文以新浪微博网站作为信息源提取用户之间的共同兴趣网络,在知网文本相似度计算方法的基础上,结合用户特征词的词性分析,提出了一种结合词性的用户相似度计算方法,此方法可以计算用户之间的兴趣强度,进而构建共同兴趣网络。实验结果表明,该方法对用户类别判定的准确率有所提高,对兴趣网络的提取有较好的效果。  相似文献   

9.
在基于特征词遍历匹配的文本分类算法中,字符串匹配算法的选取及相似度阈值控制对文本分类结果起着决定性的作用。针对三种常用的字符串匹配算法做了分析及对比实验,选取了最适合政策文本分类的一种字符串匹配算法。并通过研究政策文本具有的特征提出了一种基于特征词加权的相似度阈值计算方法,经实验证明相似度阈值符合分类要求。  相似文献   

10.
由于新闻文本种类较多、内容繁杂,为更好地提取文本主题特征词,提出了一种新的特征提取算法NewTF-IDF.传统的TF-IDF算法仅仅以逆文档率对词频进行加权,忽略了词性、词频、词位置、词跨度等其他方面的因素对词语信息量的影响,忽略了词语在不同文档中的分布对关键词重要度的影响.NewTF-IDF算法对TF-IDF算法做了多组合特征因子和离散度两个方面的改进,使特征词的加权方式更加科学.实验证明,NewTF-IDF算法在特征词提取方面具有更好的性能.  相似文献   

11.
提出一种基于MapReduce框架的商品评论热点发现并行算法——PR-HD算法. PR-HD算法使用爬虫技术提取某电商平台下某热门手机的评论数据生成评论数据集,以TF-IDF算法来计算特征词的权重,通过特征词添加位置权重的方式来得到特征词的最终权值,建立向量空间模型(VSM)计算不同评论语句的相似度,使用Canopy算法和K-means算法相结合从而实现商品评论的热点发现.这使得产品开发人员可以从中获取更直接有效的建议和反馈.  相似文献   

12.
基于知网语义相似度计算的特征降维方法研究   总被引:9,自引:1,他引:8  
针对文本分类处理中的高维度问题,结合知网语义词典,提出了一种新的特征降维处理方法.通过计算特征词汇之间的语义相似度,将原有特征集分成若干特征词集;同一词集内的特征词语义彼此间相似;而不同词集的特征词彼此间相似度比较小.将同一特征词集内的词汇权重相加,从而突出同义词以及近义词对文本分类的贡献,并可以大大降低文本比较的特征维数.实验结果表明,利用该方法在文本分类中得到了较好的分类准确率和分类性能.  相似文献   

13.
文本分类作为处理和组织大量文本数据的关键技术,为用户准确、快速查找所需信息提供依据。通过TFIDF算法计算文本词汇的词频,并根据词频排序选择特征项,再用Simhash和余弦相似度算法计算文本之间的相似度,最后采用准确率和召回率为评价标准,根据评价结果分析两种算法的优劣。  相似文献   

14.
针对传统的潜在狄利克雷分析(LDA)模型在提取评论主题时存在着计算时间长、计算效率低的问题,提出基于MapReduce架构的并行LAD模型建立方法.在文本预处理的基础上,得到文档-主题分布和主题-特征词分布,分别计算主题相似度和特征词权重,结合k-均值聚类算法,实现评论主题提取的并行化.通过Hadoop并行计算平台进行实验,结果表明,该方法在处理大规模文本时能获得接近线性的加速比,对主题模型的建立效果也有提高.  相似文献   

15.
基于改进协同过滤算法的个性化新闻推荐技术   总被引:1,自引:0,他引:1  
针对传统的基于内容协同过滤算法只是依据用户历史访问矩阵向用户做出推荐,存在数据稀疏以及不能及时反映用户兴趣变化等问题,个性化新闻推荐技术在传统的协同过滤算法基础上提出了新闻文本内容相似度的计算方式和时间窗的概念,新闻内容相似度计算中还考虑了特征词的词性和在新闻中的位置的影响,时间窗用来建立适应用户兴趣随时间变化的模型;实验结果表明,改进后的算法有效地改善了新闻用户历史访问数据的稀疏问题,及时捕获用户兴趣,F-measure值相比传统的算法最大提高了11.5%,平均绝对误差值最高下降了8%,显著提高了推荐质量.  相似文献   

16.
以微博用户推荐算法中相似度计算为研究对象,根据微博用户关注信息的特点,分析了关注用户的流行度的不同程度,以及这种程度差异对相似度计算产生的影响,在此基础之上提出了一种加入流行度制衡因子的相似度计算方法.可通过流行度制衡因子,在计算用户相似度时,适度减少(增加)流行度偏高(偏低)的用户对计算结果的影响.实验结果表明:加入流行度制衡因子的用户相似度计算具有更好的推荐效果.  相似文献   

17.
新闻更新快、易受流行和热门item的影响,用户兴趣也在不断的变化,因此就新闻推荐来说更应该关注其推荐的时效性.目前存在的用户相似度计算公式没有考虑时间因素,文中改进了原有用户相似度计算方法,增加了时间衰减因子,共同喜欢新闻i的用户u和v,产生行为的时间越远,这两个用户在新闻i上的相似度就会越小.文中提出的算法应用于http://www. show-ease. com网站的新闻推荐.通过收集7月4日到7月21日对推荐新闻的点击量和未推荐新闻的点击量,得出推荐新闻的点击量比未推荐新闻的点击量提高了31%到52%.文中提出的用户相似度计算方法在实践中取得了较好的效果.  相似文献   

18.
游客在线评论反映了游客实地旅行之后关于旅游景点和服务的真实感受,本文构建了一个基于景点在线评论文本的游客关注度和情感分析方法。该方法首先从主流旅游网站的评论专区中获取景点的评论文本并进行预处理,然后基于《知网》词汇语义相似度,结合词频分析,通过构建"旅游形象属性-触发词"词表,分别计算评论信息中旅游形象属性的游客关注度。最后建立褒贬义情感词典,对处理后的评论文本情感分析。该方法能够直观显示景点在线评论信息中旅游形象的游客评论关注点和总体情感倾向,为潜在游客的景点选择提供参考依据。以厦门市旅游景点的评论文本为例,验证了该方法的可行性。  相似文献   

19.
针对地理标签和评论信息的情感倾向对于推荐系统性能的影响,本文基于地理标签和用户评论情感分析提出有关兴趣点的推荐策略,并建立了一种基于内容的推荐模型.本系统首先对用户兴趣点信息进行有效的补充,并实现了用户兴趣点相似度度量.对无标签评论数据进行情感分析及挖掘,获取其情感倾向度.同时本系统结合了时间滑动窗口,更准确地把握用户评论和兴趣点的结合度.最终得到用户个性化推荐排名.本文方法涵盖了本地用户和外地用户的个性化推荐策略.通过实验数据表明,本文模型有效提高了推荐的准确度.  相似文献   

20.
研究了如何将协同过滤推荐应用于IT项目外包平台,实现个性化任务推荐,提出了1种融合用户Profile文本相似度、任务选择相似度及任务紧要度的协同推荐方法. 该方法将用户对任务的选择行为转换为用户-任务类选择矩阵,并以此计算用户间的选择相似性;用户profile文本相似性用于平衡用户选择相似性并形成用户综合相似性,算法中任务紧要度用于度量任务的时限性与经济性,设置合适的阈值来构建待推荐任务集. 在真实数据集上的实验结果表明,提出的个性化推荐方法具有较高的推荐准确度,并在一定程度上缓解冷启动与数据稀疏性问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号