首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文本挖掘技术综述   总被引:17,自引:0,他引:17  
文本挖掘,是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程.对其进行深入的研究势必将极大地提高人们从海量的文本数据中提取信息的能力,具有很高的商业价值.首先介绍了文本数据挖掘的研究情况,然后给出了文本挖掘的框架,对文本挖掘中信息的抽取技术以及文本挖掘中使用的相关技术、评估方法等都作了详细的介绍,最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景.  相似文献   

2.
文本挖掘技术研究   总被引:28,自引:0,他引:28  
文本挖掘是数据挖掘的重要内容之一,其应用十分广泛.对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技术进行总结和展望.  相似文献   

3.
文本挖掘综述   总被引:1,自引:0,他引:1  
杨霞  黄陈英 《科技信息》2009,(33):82-82,99
文本挖掘是对一个非结构化文本信息进行分析从而获取用户关心或感兴趣,有潜在实用价值知识的过程。本文首先介绍了文本挖掘的定义和研究现状,之后文本挖掘一般处理过程,着力于文本分类和文本聚类的一般过程,最后展望了今后的研究目标。  相似文献   

4.
文章总结了数据挖掘的基本方法、文本数据挖掘的关键技术,讨论了文本挖掘的定义和文本分类的一些形式,并对文本数据的数据挖掘算法以及发展趋势进行了研究。  相似文献   

5.
多文化交流平台(intercultural-collaboration-environment,ICE)是亚洲多所大学与研究机构参与的、开发多语种在线交流翻译平台的国际合作项目.针对目前该项目中底层翻译软件AnnoChat的翻译结果可理解度较差的问题,提出了利用文本挖掘等技术来改进AnnoChat翻译结果可理解程度的方法,给出了使用文本挖掘技术对用户谈话内容进行挖掘生成知识模式,并用挖掘得到的知识用于修正并精化本体库的一种模型.在该模型中,增加了用户个性化知识数据库以修正文本挖掘所得到的知识.  相似文献   

6.
文本挖掘技术的研究   总被引:3,自引:0,他引:3  
本文对文本挖掘的过程极其关键技术进行了系统的分析,并探讨了其应用趋势。  相似文献   

7.
文本挖掘研究进展   总被引:12,自引:0,他引:12  
数据挖掘是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要.由于存储信息最多的自然形式就是文本,因此文本挖掘具有重要的意义.结合笔者研究工作,主要介绍了文本挖掘的研究内容,挖掘过程,挖掘算法及应用前景.  相似文献   

8.
郭蕾 《中州大学学报》2009,26(5):127-128
从Web文本文档的结构分析入手,利用XML将Web文本中具有重要价值的标题、关键词、摘要等信息抽取出来形成一个XML格式的Web文本信息库,给出了Web文本信息库构建的方法,对DTD,XSL代码等进行了设计,以实例的形式探讨了网络信息库在Web文本挖掘中的具体应用。  相似文献   

9.
随着信息爆炸时代的到来,如何有效的从网络上获取有价值的信息成为当前研究的热点.Web文本挖掘技术就是解决上述问题的一种方法,它从大量半结构化、异构的Web文档集中发现潜在的、有价值的知识.本文着力于研究Web文本挖掘过程中的重要技术,并通过分析当前研究热点和各种算法,提出一种改进的投影聚类算法,实验证明其正确率比k-均值算法高.最后,本文设计了基于Web文本挖掘的证券投资系统,并将改进的聚类算法应用其中.  相似文献   

10.
本文首先介绍文本挖掘的定义及一般处理过程,重点探讨了文本分类与分类聚类等文本挖掘的关健技术。  相似文献   

11.
针对网络文本信息的安全性判别问题,采取改进的邻近分类算法挖掘文本.该改进邻近分类方法在传统方法定义分类特征的同时,起用共线性判别矩阵,对具有共线属性的特征合并处理.这种改进策略,不仅可以增加分类特征的准确性,也可以加快文本信息的分类进程.对Spambase语料库开展实验研究,从精度、召回率、联判度、误差4个维度对分类效果进行评价.结果显示:改进的邻近分类方法具有明显的优势,可以更加准确地区分安全文本和危险文本.  相似文献   

12.
张筱丹 《科技信息》2009,(4):165-166
本文讨论了Web挖掘的种类,其中的web文本挖掘是重要组成部分;并重点分析了文本特征提取、文本分类、文本聚类等Web文本挖掘中的关键技术。  相似文献   

13.
研究利用文本挖掘技术对已有的刑侦档案进行信息整合和文本挖掘,可以获取大量的有用知识,这些知识不论对刑侦研究,还是对于一线的刑侦工作都有很大的价值。文章对刑侦档案的信息整合和挖掘进行了初步探讨,给出面向刑侦档案文本挖掘的系统框架及文本精炼方法。  相似文献   

14.
文本挖掘中的姓名特征具有很强的文本表达能力,本文设计的姓名特征提取算法是利用词与词的上下文关系及中文姓名本身的统计信息对文本中的姓名特征进行提取,通过对样本的测试,表明该项技术能比较准确地提取文本中的姓名特征,基本达到了预期的目标.  相似文献   

15.
为了使网上购物的用户能更快捷地搜索到满意的商品,对Web文本挖掘的概念及关键技术进行了阐述和分析,并对其在网上购物的应用做了探索性工作.  相似文献   

16.
文本信息检索技术   总被引:4,自引:0,他引:4       下载免费PDF全文
论述3种常用的文体信息检索技术,即布尔检索,向量空间检索和概率检索,对它们的优缺点进行评价,并对文本信息检索技术进行了展望。  相似文献   

17.
张晖  张艳 《科技信息》2007,(30):87-87
基于Web的文本挖掘是文本挖掘的一个重要的组成部分,本文对文本挖掘的主要过程如文本预处理、特征表示、特征提取等进行了讨论。  相似文献   

18.
中文文本挖掘的特征导航机制   总被引:9,自引:0,他引:9  
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制,按概念层次和上下文环境展现用户所关心的内容  相似文献   

19.
Web数据挖掘是一门新兴的多学科交叉的研究领域,国内外的研究尚处于初级阶段,许多理论和应用问题还有待于进一步完善.虽然本文作了一些有益的尝试,但在新的Web数据挖掘方法、Web文档聚类和分类的方法、个性化/专用化、新的自动提取信息方法、理解语义Web以及Web多媒体数据挖掘等方面仍然需要做进一步的研究工作.  相似文献   

20.
袁园  王永平 《科技信息》2007,(27):65-65
Web数据挖掘作为数据挖掘技术和Internet应用研究相结合的研究领域,涉及机器学习、数理统计、数据库、神经网络、模式识别、粗糙集、模糊数学等人工智能相关技术,目前已经发展成为一个受到社会各界关注的研究热点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号