首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文本挖掘技术研究   总被引:28,自引:0,他引:28  
文本挖掘是数据挖掘的重要内容之一,其应用十分广泛.对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技术进行总结和展望.  相似文献   

2.
张晖  张艳 《科技信息》2007,(30):87-87
基于Web的文本挖掘是文本挖掘的一个重要的组成部分,本文对文本挖掘的主要过程如文本预处理、特征表示、特征提取等进行了讨论。  相似文献   

3.
张筱丹 《科技信息》2009,(4):165-166
本文讨论了Web挖掘的种类,其中的web文本挖掘是重要组成部分;并重点分析了文本特征提取、文本分类、文本聚类等Web文本挖掘中的关键技术。  相似文献   

4.
文本挖掘技术的研究   总被引:3,自引:0,他引:3  
本文对文本挖掘的过程极其关键技术进行了系统的分析,并探讨了其应用趋势。  相似文献   

5.
本文首先介绍文本挖掘的定义及一般处理过程,重点探讨了文本分类与分类聚类等文本挖掘的关健技术。  相似文献   

6.
随着旅游网络平台不断的普及,研究和评价旅游目的地已逐渐成为游客选择参考的重要依据;针对重庆旅游业快速发展的背景,选取重庆市5个热门景点——磁器口、洪崖洞、长江索道、武隆天生三桥和金佛山2015—2018年在携程旅行网、马蜂窝、百度旅游、美团网上的游客点评数据,利用文本挖掘法,分析游客对景点整体形象以及情感态度感知的共性和差异,建立模糊综合评价法对重庆旅游进行综合分析;结果发现:游客对于重庆旅游景点持一般满意态度,在商业化、排队时间长还有管理方面有很多意见,未来还有很大提升的空间,并进一步为提高服务水平、避免过度开发提出相关建议。  相似文献   

7.
文本挖掘综述   总被引:1,自引:0,他引:1  
杨霞  黄陈英 《科技信息》2009,(33):82-82,99
文本挖掘是对一个非结构化文本信息进行分析从而获取用户关心或感兴趣,有潜在实用价值知识的过程。本文首先介绍了文本挖掘的定义和研究现状,之后文本挖掘一般处理过程,着力于文本分类和文本聚类的一般过程,最后展望了今后的研究目标。  相似文献   

8.
文本挖掘研究进展   总被引:12,自引:0,他引:12  
数据挖掘是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要.由于存储信息最多的自然形式就是文本,因此文本挖掘具有重要的意义.结合笔者研究工作,主要介绍了文本挖掘的研究内容,挖掘过程,挖掘算法及应用前景.  相似文献   

9.
唐武  陈佳 《广东科技》1998,(7):19-20
一、开发背景 90年代以来,随着办公自动化和国际互联网(Internet)的迅速发展,人们日常所接触的信息量急剧增长,如何在大量的信息中择其所需已直接关系到人们的工作和生活效率。对于文字信息,通常一方面采用分类的方法,使经分类选择后的文字信息更具有针对性,从而避免无关信息的干扰;另一方  相似文献   

10.
李翠霞  林楠 《科技信息》2007,(10):37-37,98
本文介绍了文本挖掘的过程和分类。通过对其挖掘过程的详细研究,分析了文本挖掘进一步发展所面临的困难和挑战。  相似文献   

11.
1:Web上有大量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点,本文构建了基于Agent的Web文本挖掘模型,并详细阐述了该模型的结构和工作机理。  相似文献   

12.
投诉识别系统在保证热点投诉正确分类、提高电信行业的服务质量中起到很重要的作用.由于电信行业的客户投诉有其特殊性,所有的投诉必须在很短的时间内分类完成,从而往往会发生导航分类错误的现象.提出了一套基于文本挖掘的模型,该模型能够智能地将热点投诉分类到正确的投诉导航上去.实验表明:该模型能够有效地进行投诉文本分类.  相似文献   

13.
目前在科研项目的评审、立项过程中,存在评审过程繁琐、项目与评审专家不匹配、会评成本高、主观因素多等问题,这些问题严重影响了项目评审、立项的科学性和高效性.本系统有效地解决了项目与评审专家的匹配不合理的问题.对项目进行了盲审处理,保证评审结果客观公正.  相似文献   

14.
15.
研究了一种基于统计的Web新闻文本自动摘要生成方法.首先,根据Web新闻文本的特点,对词汇和句子赋予不同的权重,然后根据权重大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅的摘要.  相似文献   

16.
研究利用文本挖掘技术对已有的刑侦档案进行信息整合和文本挖掘,可以获取大量的有用知识,这些知识不论对刑侦研究,还是对于一线的刑侦工作都有很大的价值。文章对刑侦档案的信息整合和挖掘进行了初步探讨,给出面向刑侦档案文本挖掘的系统框架及文本精炼方法。  相似文献   

17.
Web文本聚类是文本挖掘的重要组成部分。该文章分析了Web文本挖掘的方法,通过比较现有的几种聚类算法之后,着重研究了一个基于DBSCAN的聚类算法.以及它在文本挖掘中的具体实现过程。  相似文献   

18.
梁丹凝  周书民 《江西科学》2010,28(2):265-268
根据短信可转化为文本的特性,将文本分类算法运用到短信处理技术之中。通过对短信文本进行预处理、特征选择及分类器等步骤,将短信文本按不同领域进行分类,最后分析意见所涉及的领域分类,有针对性地为政府决策提供可靠依据。  相似文献   

19.
针对当前生成式文本摘要模型在解码时对摘要整体语义信息利用不充分的问题,提出一种基于语义对齐的神经网络文本摘要方法.该方法以带注意力、Pointer机制和Coverage机制的Sequence-to-Sequence模型为基础,在编码器与解码器之间加入语义对齐网络,实现文本到摘要的语义信息对齐;将获得的摘要整体语义信息与...  相似文献   

20.
多文化交流平台(intercultural-collaboration-environment,ICE)是亚洲多所大学与研究机构参与的、开发多语种在线交流翻译平台的国际合作项目.针对目前该项目中底层翻译软件AnnoChat的翻译结果可理解度较差的问题,提出了利用文本挖掘等技术来改进AnnoChat翻译结果可理解程度的方法,给出了使用文本挖掘技术对用户谈话内容进行挖掘生成知识模式,并用挖掘得到的知识用于修正并精化本体库的一种模型.在该模型中,增加了用户个性化知识数据库以修正文本挖掘所得到的知识.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号