首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
APP市场上用户发表的评论包含着对APP软件研发团队的有用信息,尤其是软件功能请求以及具有特定应用的用户体验内容,可以应用到APP软件的版本更新设计中.为了研究海量用户评论在APP软件更新和重新设计中的参与作用,本文提出一种基于词向量表征的句向量相似性计算模型,它可以用于度量来自更新日志文本和用户评论文本中的句子的相似性.然后,本文提出了APP产品的“更新日志-用户评论”匹配算法将不同语义匹配结果划分到不同的数据集.基于真实的APP市场上采集的海量APP软件升级日志数据和用户评论数据的实验证明了本文提出方法的有效性.研究结果还发现:APP开发团队对于用户评论内容的采纳不到20%,而且采纳的内容主要集中在APP软件功能方面.用户评论中众多内容指向企业的营销活动问题,这部分内容由于研发团队在企业运营中的管理角色所限,很少能够顾及.  相似文献   

2.
基于主题标签的在线社区话题发现   总被引:1,自引:0,他引:1  
面对海量的互联网信息,如何快速有效地提取到用户关心的话题成为网络信息处理的一项基本任务。话题发现实质是无指导的聚类研究,本文引入主题标签概念,针对在线社区数据,提出了主题标签的话题发现算法。该算法以词项为粒度,基于词项的权重和上下文信息获取论坛帖子线索文档的核心词汇,作为文档的主题标签,在向量空间模型的基础上结合主题标签间的相似性进行相关话题的聚类。该方法的提出,一方面获得的主题词项不仅准确,而且具有较强的语义关联性,有效的避免了向量空间模型中容易丢失特征词间语义信息的缺陷;另一方面,与潜在语义模型相比,本文在向量空间模型基础上的话题发现具有更高的效率和更好的聚类质量。  相似文献   

3.
在电子商务迅速发展的背景下,在线评论所蕴含的商业价值日益凸显.从在线评论中提取用户关于产品的评价和情感的研究,已经开始从句子级或篇章级的粗粒度情感分析转向属性级的细粒度情感分析.但当前细粒度情感分析方法在情感要素识别任务中存在不能同时解决一词多义、上下文语义信息不全以及标签约束关系缺失等突出问题,且面向属性的情感强度量化方法未充分考虑语法信息.对此,本文提出一种基于RoBERTa-BiLSTM-CRF融合模型的在线评论细粒度情感分析方法,该方法可以有效解决上述问题,更加准确地识别评论中用户评价的产品或服务属性,并结合情感三元组和语法信息有效地量化用户在评论中反馈的情感强度.为了检验所提方法的效果,本文在酒店评论数据、美团外卖评论数据、CLUENER2020等多个领域的数据集上进行对比实验与消融实验.实验结果表明,与已有经典模型相比,本文所提基于RoBERTa-BiLSTM-CRF融合模型的情感要素识别方法在多个数据集上均获得了最佳F1值,且本文所提情感强度量化方法更加精细,能更好地契合人类情感的连续性.此外,消融实验进一步表明融合模型的每个结构都具有重要性.  相似文献   

4.
本文基于协同训练模型(co-training)提出了一种新的在线虚假评论识别方法CoDeRI以解决虚假评论识别中模型训练数据不足的问题.对同一评论信息,本文通过构建两个特征视图相互学习以识别虚假评论信息:视图一的特征来自于评论文本的词项(Term);视图二的特征来自于对评论进行深度语法树分析之后得到的概率上下文无关语法规则(PCFG,probabilistic context-free grammars).利用朴素贝叶斯(naïve Bayes)作为基分类器,本文提出了两种特定于CoDeRI方法的分类后样本选择策略:CoDeRI-C策略和CoDeRI-U策略.CoDeRI-C策略在对未标注信息进行标注之后,选取分类置信度最高的评论信息以扩大训练样本集;CoDeRI-U策略则随机均匀的选取标注之后的评论信息以扩大训练样本集.实验表明,CoDeRI算法在虚假评论信息识别上与现有方法相比能够取得较好的分类结果.并且,CoDeRI-U策略的虚假评论识别准确率优于CoDeRI-C策略.本文的研究为电子商务中的平台、商家和消费者如何识别在线虚假评论提供了一定的管理启示.  相似文献   

5.
随着社交媒体的发展,不断增加的在线产品评论正在极大地影响电子商务市场,使得评论挖掘成为商业界与学术界共同的热点话题。针对中文产品评论的特点,本文提出一种基于领域本体的建模方法,通过建立评论挖掘模型来对产品评论的基本评价单元——"特征观点对"进行识别。该建模过程以设计科学研究方法论为指导。首先在模型设计阶段,构建面向产品评论的领域本体;然后在模型实施阶段,提出基于本体的特征观点对识别方法;最后在模型评价阶段,通过实验对评论挖掘结果进行评价。实验结果表明,本文提出的方法与其他基于统计的方法以及基于语义的方法相比,在性能上有明显提高,对克服口语化严重和语法不规范等问题具有良好的效果。此外,通过特征观点对的识别与统计,使产品评论这种非结构化文本转化为机器可读的、能理解的结构化表达并得到具有一定商业应用价值的信息。  相似文献   

6.
对微博多分句的评论,ELMo-Text CNN、GPT等模型不能准确提取文本上下文联系,导致分类效果不理想.为了解决此问题,采用BERT-Text CNN模型,利用BERT独特自注意力机制的双向编码转换器结构获得具有句子全局特征的字向量,将字向量输入到Text CNN中,利用Text CNN捕获局部特征的能力,最终提取...  相似文献   

7.
随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model, VSM)进行文本表示,但是该方法面临着文本向量维度较高及文本语义相似度难以度量的问题。提出一种改进的文本相似度计算方法,从大量的特征空间中选择出具有代表性的元数据特征向量元素,以降低向量空间的维度;构建领域概念树并设计基于领域概念树的文本相似度算法,对领域概念中广泛存在的同义词进行处理,以提高文本之间语义相似度度量的性能。实验结果表明:通过降维和概念相似度计算可提高文本相似度计算的性能。  相似文献   

8.
特征选择是文本挖掘领域中重要的基础性工作,能够为后续文本挖掘任务的顺利实施提供良好的数据处理方法和技术支持,而特征词排序是特征选择的关键环节.结合文本统计信息和结构信息以及流形排序思想,提出了一种新的特征词排序方法.通过构造原始文本中潜在的能够反映文本语义和结构信息的条件共现度词网络作为特征词间的流形结构,并以特征词的词频统计信息作为特征词初始权重,结合流形排序思想以及图学习理论进行特征词间的相似性学习,进而实现对特征词重要性排序.分别在公共语料集和补充语料集上与其它多种特征词排序方法进行数值实验对比,实验结果验证了方法的有效性.该方法拓宽了流形排序思想和图学习理论在文本挖掘领域的应用,也给单篇文本特征词排序提供了新的方法和策略.  相似文献   

9.
从在线文本评论挖掘消费者情感信息,能够得到更加真实的消费者购买体验及其偏好。主题情感混合模型作为一类有效的无监督情感分类模型,正在成为这方面的重要文本挖掘工具,但该模型存在分类准确率和稳定性还不够高的问题,为克服这一不足,提出一种基于主题相似性的无监督在线评论情感分类模型。以潜在狄利克雷模型分析在线评论主题,结合情感词典计算主题情感极性;引入理想评论并构造理想评论代表集,通过计算评论和理想评论集的主题相似度,实现在线评论情感分类。实验结果表明,该模型能有效判别消费者在线评论情感倾向,稳定性较高,衡量分类结果的综合指标F_1值比现有主题情感混合模型提高3%~20%。同时,在计算机、酒店、图书及手机等不同领域评论数据集上的实验结果显示,该方法具有较好的领域可移植性。  相似文献   

10.
在线媒体拥有海量的非结构化数据,包含大量的突发话题和普通话题.传统的话题模型在不加入先验信息的情况下,无法有效区分普通话题和突发话题.本文的研究提出基于高效用模式和话题模型的突发话题发现(high utility bursty topic model, HU-BTM)模型.该模型使用高效用模式挖掘找出文本数据中的突发词组,使用基于普通Polya坛子模型的Gibbs抽样方法,将突发词组与突发词引入话题模型,实现突发话题的自动识别.实验结果表明与现有的主要突发话题发现方法比较,HU-BTM模型在准确率和召回率指标上优于对比算法.  相似文献   

11.
从在线文本评论挖掘消费者情感信息,能够得到更加真实的消费者购买体验及其偏好。主题情感混合模型作为一类有效的无监督情感分类模型,正在成为这方面的重要文本挖掘工具,但该模型存在分类准确率和稳定性还不够高的问题,为克服这一不足,提出一种基于主题相似性的无监督在线评论情感分类模型。以潜在狄利克雷模型分析在线评论主题,结合情感词典计算主题情感极性;引入理想评论并构造理想评论代表集,通过计算评论和理想评论集的主题相似度,实现在线评论情感分类。实验结果表明,该模型能有效判别消费者在线评论情感倾向,稳定性较高,衡量分类结果的综合指标F_1值比现有主题情感混合模型提高3%~20%。同时,在计算机、酒店、图书及手机等不同领域评论数据集上的实验结果显示,该方法具有较好的领域可移植性。  相似文献   

12.
现如今,商品在线评论的情感分析业已成为许多商家不可忽视的重要工作,它对于商家了解用户偏好有着重要意义,同时,它还能够为相关产品下一步的改进工作提供方向指导.然而,传统的分析方法已无法解决现在情感分析中特征提取及语义理解等方面存在的问题.针对此类问题,本文提出一种基于CNN-BiLSTM的在线评论情感分析方法,不仅可以像LSTM一样建立时序关系,而且可以像CNN一样刻画局部空间特征.医疗服务、物流快递、金融服务、旅游住宿和食品餐饮数据集的实验结果表明,该方法能有效判别消费者在线评论情感倾向,在文本的情感分类中效果较传统机器学习算法更准确,F1值可以达到94.67%.同时,实验证明该方法具有较好的领域可拓展性.  相似文献   

13.
针对领域本体构建过程中获取概念间语义关系的困难, 提出了一种新的本体关系学习方法——概念特征词法, 支持自动化地构建领域概念间的关系集合. 该方法首先基于语境将领域概念表示为特征词向量模型, 然后通过计算向量的相似度来确定两个概念之间是否存在语义关系. 依据领域专家定义的金标准, 对概念特征词法的学习结果做了详细的性能分析. 结果表明: 相较于已有方法, 本文方法的准确率和召回率更令人满意. 概念特征词法可广泛应用于本体构建、文本挖掘和语义检索等领域.  相似文献   

14.
近年来,大量的有关产品或服务的在线评论信息在许多网站涌现,如何基于在线评论进行决策分析是一个值得关注的研究问题。提出了一种基于情感分析和证据理论的多属性在线评论决策方法,在该方法中,首先针对决策者关注的备选方案及属性采集相应的在线评论;然后针对采集的多属性在线评论进行情感分析并得到在线评论针对各属性在不同情感强度等级上出现的频次;进一步,依据证据理论,将在线评论在不同情感强度等级上出现的频次转化为针对不同情感强度等级的信任度,并依据证据合成规则将备选方案各属性的信任度集结为综合信任度;在此基础上,通过计算所有备选方案的效用值,进而得到方案的排序结果用于决策者购买决策;最后,以基于汽车之家网站的在线评论信息进行汽车购买决策为例说明了该方法的可行性和有效性。  相似文献   

15.
为了有效地从在线评论数据中获取客户的需求偏好,提出了一种客户偏好趋势挖掘方法.该方法采用时间序列模型预测下一阶段产品属性重要性,利用决策树模型分析客户偏好的变化趋势,将产品属性分为关键属性和非关键属性.并进一步,根据Mann-Kendall趋势检验将非关键属性分为过时属性、增值属性和稳定属性.此外,以汽车产品为案例,验...  相似文献   

16.
李宛哲  李英 《系统工程》2021,(3):143-152
用户在线评论是影响消费者汽车产品选择决策的重要信息来源.已有的基于用户在线评论的产品排序研究中,较少考虑用户评价标准差异对排序结果的影响.基于文本型、数值型和极性评论数据,本文提出一种考虑个体评价标准差异的汽车产品排序方法:首先分析文本型评论中的用户情感,构建情感词典,得到初步情感得分;然后利用数值型和极性评论相关值为...  相似文献   

17.
在线评论所包含的产品特征观点在帮助用户做出购买决策时发挥着重要作用,然而,目前还没有挖掘客户评论中的产品特征观点作为主要数据来源的推荐系统,并且,监督型方法中提取特征观点对的算法较少关注中文句式结构,提取规则缺乏动态适应性.因此,提出一种基于特征观点对的产品推荐模型,首先,结合中文句式构成分析及特征观点的匹配关系分析,采用动态窗口提取特征观点对;在此基础上,结合特征树汇聚特征观点用于产品间比较,并为用户做出产品推荐;同时,提出情感可信度指标用于展示特征的典型评论.与采用静态窗口的基准方法相比,本模型的召回率和F值都有大幅提升,表明其可以为基于特征观点对的产品推荐提供可靠的数据来源,进而有效帮助用户做出购买决策.  相似文献   

18.
基于新产品投放市场初期的在线评论中的情感信息具有暗示产品某功能是否得到消费者青睐及青睐程度的信息,同时,这些评论会影响后面消费者态度及决策的角度,结合证据理论的融合机制,提出了一种基于情感分析与证据理论的短期新产品竞争力测度方法。该方法构建了新产品在线评价信息的特性情感词汇提取机制,以及特性词评价集合与潜在消费者对特性词评价集合的打分机制,并发展构造了Mass函数及证据融合规则。最后,以效用理论构建新产品在线竞争力评估基准,由此构成完整的短期新产品在线竞争力测度方法。实证研究结果表明,该方法具有较高的可行性。  相似文献   

19.
高广尚 《系统工程》2021,(1):148-158
本文探讨如何从用户购买数据中学习出高质量词嵌入,以让模型据此实现高效的人口属性预测任务.首先分析购买数据并对其进行编码,并在此基础上构建嵌入向量生成模型,之后用样本数据训练该模型,然后用神经网络程序实现该模型,最后通过实验验证该模型的可行性和高效性.提出的模型不仅能将具有大量模态的分类特征数据转换为低维的高质量词嵌入,...  相似文献   

20.
在技术供需文本匹配视角下,提出了一种基于语义相似聚类的技术需求识别模型.首先,采集网络中技术需求文本提取关键短语;然后,建立领域专利技术转让索引库,基于需求关键短语检索出高相关专利,构建专利技术供给背景库,并对背景库中专利标题与摘要进行分词;第三,提出基于词向量的供需文本语义匹配度算法,筛选有效技术需求并进行语义相似聚类;最后,考虑技术需求对应的需求量和专利技术转让量,对聚类结果进行二维分类.以新能源领域为例进行实证,识别出有效技术需求195个,基于语义相似聚成12类,结合需求量与专利转让量,将12类技术需求分为“高需求、高转让”、“高需求、低转让”、“低需求、高转让”、“低需求、低转让”四大类.该研究为网络技术需求挖掘及供需匹配提供一种新思路.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号