共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
陈波 《大众科学.科学研究与实践》2007,(17)
文章总结了数据挖掘的基本方法、文本数据挖掘的关键技术,讨论了文本挖掘的定义和文本分类的一些形式,并对文本数据的数据挖掘算法以及发展趋势进行了研究。 相似文献
5.
多文化交流平台(intercultural-collaboration-environment,ICE)是亚洲多所大学与研究机构参与的、开发多语种在线交流翻译平台的国际合作项目.针对目前该项目中底层翻译软件AnnoChat的翻译结果可理解度较差的问题,提出了利用文本挖掘等技术来改进AnnoChat翻译结果可理解程度的方法,给出了使用文本挖掘技术对用户谈话内容进行挖掘生成知识模式,并用挖掘得到的知识用于修正并精化本体库的一种模型.在该模型中,增加了用户个性化知识数据库以修正文本挖掘所得到的知识. 相似文献
6.
7.
8.
从Web文本文档的结构分析入手,利用XML将Web文本中具有重要价值的标题、关键词、摘要等信息抽取出来形成一个XML格式的Web文本信息库,给出了Web文本信息库构建的方法,对DTD,XSL代码等进行了设计,以实例的形式探讨了网络信息库在Web文本挖掘中的具体应用。 相似文献
9.
随着信息爆炸时代的到来,如何有效的从网络上获取有价值的信息成为当前研究的热点.Web文本挖掘技术就是解决上述问题的一种方法,它从大量半结构化、异构的Web文档集中发现潜在的、有价值的知识.本文着力于研究Web文本挖掘过程中的重要技术,并通过分析当前研究热点和各种算法,提出一种改进的投影聚类算法,实验证明其正确率比k-均值算法高.最后,本文设计了基于Web文本挖掘的证券投资系统,并将改进的聚类算法应用其中. 相似文献
10.
11.
韩文智 《华侨大学学报(自然科学版)》2016,(1):67-70
针对网络文本信息的安全性判别问题,采取改进的邻近分类算法挖掘文本.该改进邻近分类方法在传统方法定义分类特征的同时,起用共线性判别矩阵,对具有共线属性的特征合并处理.这种改进策略,不仅可以增加分类特征的准确性,也可以加快文本信息的分类进程.对Spambase语料库开展实验研究,从精度、召回率、联判度、误差4个维度对分类效果进行评价.结果显示:改进的邻近分类方法具有明显的优势,可以更加准确地区分安全文本和危险文本. 相似文献
12.
本文讨论了Web挖掘的种类,其中的web文本挖掘是重要组成部分;并重点分析了文本特征提取、文本分类、文本聚类等Web文本挖掘中的关键技术。 相似文献
13.
研究利用文本挖掘技术对已有的刑侦档案进行信息整合和文本挖掘,可以获取大量的有用知识,这些知识不论对刑侦研究,还是对于一线的刑侦工作都有很大的价值。文章对刑侦档案的信息整合和挖掘进行了初步探讨,给出面向刑侦档案文本挖掘的系统框架及文本精炼方法。 相似文献
14.
文本挖掘中的姓名特征具有很强的文本表达能力,本文设计的姓名特征提取算法是利用词与词的上下文关系及中文姓名本身的统计信息对文本中的姓名特征进行提取,通过对样本的测试,表明该项技术能比较准确地提取文本中的姓名特征,基本达到了预期的目标. 相似文献
15.
为了使网上购物的用户能更快捷地搜索到满意的商品,对Web文本挖掘的概念及关键技术进行了阐述和分析,并对其在网上购物的应用做了探索性工作. 相似文献
16.
17.
基于Web的文本挖掘是文本挖掘的一个重要的组成部分,本文对文本挖掘的主要过程如文本预处理、特征表示、特征提取等进行了讨论。 相似文献
18.
中文文本挖掘的特征导航机制 总被引:9,自引:0,他引:9
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制,按概念层次和上下文环境展现用户所关心的内容 相似文献
19.
薛鸿民 《甘肃联合大学学报(自然科学版)》2006,20(4):17-19
Web数据挖掘是一门新兴的多学科交叉的研究领域,国内外的研究尚处于初级阶段,许多理论和应用问题还有待于进一步完善.虽然本文作了一些有益的尝试,但在新的Web数据挖掘方法、Web文档聚类和分类的方法、个性化/专用化、新的自动提取信息方法、理解语义Web以及Web多媒体数据挖掘等方面仍然需要做进一步的研究工作. 相似文献
20.
Web数据挖掘作为数据挖掘技术和Internet应用研究相结合的研究领域,涉及机器学习、数理统计、数据库、神经网络、模式识别、粗糙集、模糊数学等人工智能相关技术,目前已经发展成为一个受到社会各界关注的研究热点。 相似文献