共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
基于Web的文本挖掘是文本挖掘的一个重要的组成部分,本文对文本挖掘的主要过程如文本预处理、特征表示、特征提取等进行了讨论。 相似文献
3.
本文讨论了Web挖掘的种类,其中的web文本挖掘是重要组成部分;并重点分析了文本特征提取、文本分类、文本聚类等Web文本挖掘中的关键技术。 相似文献
4.
5.
6.
张璐 《重庆工商大学学报(自然科学版)》2019,36(6):65-72
随着旅游网络平台不断的普及,研究和评价旅游目的地已逐渐成为游客选择参考的重要依据;针对重庆旅游业快速发展的背景,选取重庆市5个热门景点——磁器口、洪崖洞、长江索道、武隆天生三桥和金佛山2015—2018年在携程旅行网、马蜂窝、百度旅游、美团网上的游客点评数据,利用文本挖掘法,分析游客对景点整体形象以及情感态度感知的共性和差异,建立模糊综合评价法对重庆旅游进行综合分析;结果发现:游客对于重庆旅游景点持一般满意态度,在商业化、排队时间长还有管理方面有很多意见,未来还有很大提升的空间,并进一步为提高服务水平、避免过度开发提出相关建议。 相似文献
7.
8.
9.
一、开发背景 90年代以来,随着办公自动化和国际互联网(Internet)的迅速发展,人们日常所接触的信息量急剧增长,如何在大量的信息中择其所需已直接关系到人们的工作和生活效率。对于文字信息,通常一方面采用分类的方法,使经分类选择后的文字信息更具有针对性,从而避免无关信息的干扰;另一方 相似文献
10.
11.
1:Web上有大量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点,本文构建了基于Agent的Web文本挖掘模型,并详细阐述了该模型的结构和工作机理。 相似文献
12.
投诉识别系统在保证热点投诉正确分类、提高电信行业的服务质量中起到很重要的作用.由于电信行业的客户投诉有其特殊性,所有的投诉必须在很短的时间内分类完成,从而往往会发生导航分类错误的现象.提出了一套基于文本挖掘的模型,该模型能够智能地将热点投诉分类到正确的投诉导航上去.实验表明:该模型能够有效地进行投诉文本分类. 相似文献
13.
14.
15.
研究了一种基于统计的Web新闻文本自动摘要生成方法.首先,根据Web新闻文本的特点,对词汇和句子赋予不同的权重,然后根据权重大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅的摘要. 相似文献
16.
研究利用文本挖掘技术对已有的刑侦档案进行信息整合和文本挖掘,可以获取大量的有用知识,这些知识不论对刑侦研究,还是对于一线的刑侦工作都有很大的价值。文章对刑侦档案的信息整合和挖掘进行了初步探讨,给出面向刑侦档案文本挖掘的系统框架及文本精炼方法。 相似文献
17.
Web文本聚类是文本挖掘的重要组成部分。该文章分析了Web文本挖掘的方法,通过比较现有的几种聚类算法之后,着重研究了一个基于DBSCAN的聚类算法.以及它在文本挖掘中的具体实现过程。 相似文献
18.
根据短信可转化为文本的特性,将文本分类算法运用到短信处理技术之中。通过对短信文本进行预处理、特征选择及分类器等步骤,将短信文本按不同领域进行分类,最后分析意见所涉及的领域分类,有针对性地为政府决策提供可靠依据。 相似文献
19.
针对当前生成式文本摘要模型在解码时对摘要整体语义信息利用不充分的问题,提出一种基于语义对齐的神经网络文本摘要方法.该方法以带注意力、Pointer机制和Coverage机制的Sequence-to-Sequence模型为基础,在编码器与解码器之间加入语义对齐网络,实现文本到摘要的语义信息对齐;将获得的摘要整体语义信息与... 相似文献
20.
多文化交流平台(intercultural-collaboration-environment,ICE)是亚洲多所大学与研究机构参与的、开发多语种在线交流翻译平台的国际合作项目.针对目前该项目中底层翻译软件AnnoChat的翻译结果可理解度较差的问题,提出了利用文本挖掘等技术来改进AnnoChat翻译结果可理解程度的方法,给出了使用文本挖掘技术对用户谈话内容进行挖掘生成知识模式,并用挖掘得到的知识用于修正并精化本体库的一种模型.在该模型中,增加了用户个性化知识数据库以修正文本挖掘所得到的知识. 相似文献