首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
Web信息挖掘现状及应用前景   总被引:2,自引:0,他引:2  
介绍了Web信息挖掘的环境与分类,论述了Web挖掘技术,展望了信息挖掘的应用前景。  相似文献   

2.
张柱和 《科技信息》2009,(19):51-52
当前网络发展迅速,各种网站比比皆是,它容纳了海量的信息,但是这么多的信息,却使人们产生了信息贫乏的感觉,这是因为Web上的信息覆盖面太广,而用户需要的却只是其中很少的一部分。Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的、有用模式和隐藏的信息。本文主要研究了Web数据挖掘的内容,包括Web挖掘的特点、Web挖掘的分类和Web挖掘流程等。  相似文献   

3.
随着Internet的发展,必然要求对Web信息进行深层次的分析。而有效运用Web数据挖掘技术可以从海量数据中快速、准确地获得有价值的网络信息,并提供个性化的服务。因此,本文通过分析Web数据挖掘的特点及分类,针对常用技术和主要应用方向进行探讨。以其充分发挥Web数据挖掘的作用.服务信息化社会。  相似文献   

4.
根据Web文档分类与人工神经网络理论,设计了一个Web分类挖掘系统。针对BP网络分类器的不足,提出了用径向基函数神经网络对Web页面中的文本信息进行分类的方法。实验初步证明,用径向基函数进行分类比BP算法构造的神经网络更具准确性,有效地提高了分类的正确率。  相似文献   

5.
提出了基于神经网络的文档聚类算法,将Web挖掘技术及用于科技文档资料检索,目的是利用数据挖掘技术快速、准确的从浩瀚的Web信息资源中抽取有趣的、潜在有用的模式及隐含信息,用于科技文档资料的检索,以满足科研人员及广大师生对科技资料的检索需求.系统开发采用B/S结构,以SQL Server为数据服务器端,利用ASP技术和ADO技术开发浏览器端应用程序.  相似文献   

6.
Web挖掘技术   总被引:7,自引:1,他引:7  
万维网的出现使计算机拥有海量的信息资源 ,而其中蕴含的知识却未能得到充分利用。为此 ,Web挖掘技术成为一项重要研究课题。文中对Web挖掘分类、与Web挖掘相关的各种技术以及Web挖掘应用加以阐述。最后提出了一个综合Web挖掘原型系统SWMS。  相似文献   

7.
将Web文本分类技术和Web使用记录挖掘技术应用于网站信息管理中,实现了网站对站内Web文本的快速自动分类以及对站内不同用户显示个性化布局的功能,显著提高了网站管理中处理大量信息的效率,增强了网站的个性化特征.  相似文献   

8.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势.  相似文献   

9.
如何在Web这个全球最大的数据集合中发现有用的信息成为了数据挖掘研究的热点。文章首先分析了Web数据挖掘所面临的问题,然后概述了Web数据挖掘以及它的几个分类,最后简单阐述了Web挖掘的应用前景以及在Web2.0到来之时,Web数据挖掘所面临的机遇与挑战。  相似文献   

10.
Web数据挖掘综述   总被引:3,自引:0,他引:3  
如何在Web这个全球最大的数据集合中发现有用的信息成为了数据挖掘研究的热点。文章首先分析了Web数据挖掘所面临的问题,然后概述了Web数据挖掘以及它的几个分类,最后简单阐述了Web挖掘的应用前景以及在Web2.0到来之时,Web数据挖掘所面临的机遇与挑战。  相似文献   

11.
基于基尼的模糊kNN分类器   总被引:2,自引:0,他引:2  
随着网络的发展,大量的文档涌现在网上,自动文本分类成为处理海量数据的关键技术。在众多的文本分类算法中,kNN算法被证明是最好的文本分类算法之一。对于大多数文本分类来说,文本预处理是文本分类的瓶颈,文本预处理的好坏直接影响着分类的性能。在此介绍了一种新的文本预处理算法——基于基尼的文本预处理算法。同时采用模糊集理论改进kNN的决策规则。这两者的结合使得模糊kNN比传统的kNN表现出更好的分类性能。实验结果证明这种改进是有效的,可行的。  相似文献   

12.
基于命名实体的Web新闻文本分类方法   总被引:1,自引:0,他引:1  
文章对Web新闻领域的文本自动分类问题进行了研究,提出一种基于新闻实体要素的分类方法;在应用空间向量模型的基础上,充分考虑命名实体对Web新闻文本分类的特殊作用,并进行了实验.实验结果表明,以新闻实体要素为特征的文本分类系统可得到较高的分类精度,该方法具有一定的实用价值.  相似文献   

13.
文本分类与文本信息特征概念的提取是当前智能信息服务研究的重点,为自动获取新的特征概念,提出了一种基于特征概念的自动提取系统,该系统包括分词、综合文本词权处理、类别归属和特征概念提取等部分,能有效地从概念上提取文本类特征,提高文本自动分类的准确性.  相似文献   

14.
文本自动分类是文本挖掘的基础,可广泛地应用于信息检索,web挖掘等领域.在分类前首先要将文本表示成计算机能处理的形式,提出了一种将隐含语义索引(LSI)与文本聚类相结合的中文文本自动分类的方法.在挖掘文本的语义信息,提高分类速度上均取得了较好的效果.通过实验验证了方法的有效性.  相似文献   

15.
设计了一种基于统计的多层次分类算法:在一个树状的层次分类体系中,对文档进行自动分类时,首先从根结点开始找到对应的大类,然后递归往下直到找到对应的最底层子类.每一层中使用支持向量机作为分类模型,并使用类别均衡的方法解决数据稀疏的问题,在经过大规模网页语料训练后取得了很好的分类效果.  相似文献   

16.
随着信息爆炸时代的到来,如何有效的从网络上获取有价值的信息成为当前研究的热点.Web文本挖掘技术就是解决上述问题的一种方法,它从大量半结构化、异构的Web文档集中发现潜在的、有价值的知识.本文着力于研究Web文本挖掘过程中的重要技术,并通过分析当前研究热点和各种算法,提出一种改进的投影聚类算法,实验证明其正确率比k-均值算法高.最后,本文设计了基于Web文本挖掘的证券投资系统,并将改进的聚类算法应用其中.  相似文献   

17.
Boosting算法在文本自动分类中的应用   总被引:7,自引:0,他引:7       下载免费PDF全文
随着网络信息的迅猛发展,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用Boosting算法经过试验证明是有效的,并且优于目前的大多数分类算法。  相似文献   

18.
肖健 《科技资讯》2013,(10):45-45,95
以网络实验信息管理系统为研究背景,应用VB.NET将数据库信息发布到Internet上,很好地实现了WEB数据库建立、绑定、查询、编辑等操作,功能齐全,便于扩展。  相似文献   

19.
Text categorization plays an important role in data mining. Feature selection is the most important process of text categorization. Focused on feature selection, we present an improved text frequency method for filtering of low frequency features to deal with the data preprocessing, propose an improved mutual information algorithm for feature selection, and develop an improved tf.idf method for characteristic weights evaluation. The proposed method is applied to the benchmark test set Reuters-21578 Top10 to examine its effectiveness. Numerical results show that the precision, the recall and the value of F1 of the proposed method are all superior to those of existing conventional methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号