首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 77 毫秒
1.
为了使网上购物的用户能更快捷地搜索到满意的商品,对Web文本挖掘的概念及关键技术进行了阐述和分析,并对其在网上购物的应用做了探索性工作.  相似文献   

2.
李静  付达杰 《科技资讯》2013,(34):1-1,3
本文作者结合自身多年实践经验,结合跟踪用户兴趣以及行为提出了一种显性方式与隐性方式紧密结合的方法,最终提出了建立用户兴趣模型的手段。并且进一步针对用户浏览Web页面以及浏览网页的这种行为予以详细分析,进而得出了用户兴趣模型,掌握了用户兴趣的获取方式,希望可以对读者产生一些积极影响。  相似文献   

3.
针对网络文本信息的安全性判别问题,采取改进的邻近分类算法挖掘文本.该改进邻近分类方法在传统方法定义分类特征的同时,起用共线性判别矩阵,对具有共线属性的特征合并处理.这种改进策略,不仅可以增加分类特征的准确性,也可以加快文本信息的分类进程.对Spambase语料库开展实验研究,从精度、召回率、联判度、误差4个维度对分类效果进行评价.结果显示:改进的邻近分类方法具有明显的优势,可以更加准确地区分安全文本和危险文本.  相似文献   

4.
WEB文本挖掘中用户兴趣模型的建立和更新   总被引:5,自引:0,他引:5  
面对因特网的海量信息,为实现web文本挖掘,可建立用户兴趣模型,使用户很方便地获取所需的有用信息,排除无用信息。在建立这一模型之初,要通过观察用户行为,分析web页面与用户兴趣的相关度,利用静态和动态相结合方法给出一个“兴趣指数”,在此基础上,运用Web文本挖掘技术,通过计算与文本的匹配程度,将满足约定条件的文本推荐给用户,从而利用相关反馈建立和更新用户兴趣模型。  相似文献   

5.
张筱丹 《科技信息》2009,(4):165-166
本文讨论了Web挖掘的种类,其中的web文本挖掘是重要组成部分;并重点分析了文本特征提取、文本分类、文本聚类等Web文本挖掘中的关键技术。  相似文献   

6.
郭蕾 《中州大学学报》2009,26(5):127-128
从Web文本文档的结构分析入手,利用XML将Web文本中具有重要价值的标题、关键词、摘要等信息抽取出来形成一个XML格式的Web文本信息库,给出了Web文本信息库构建的方法,对DTD,XSL代码等进行了设计,以实例的形式探讨了网络信息库在Web文本挖掘中的具体应用。  相似文献   

7.
张晖  张艳 《科技信息》2007,(30):87-87
基于Web的文本挖掘是文本挖掘的一个重要的组成部分,本文对文本挖掘的主要过程如文本预处理、特征表示、特征提取等进行了讨论。  相似文献   

8.
随着Internet的大规模普及,互联网成为人们获取新闻的主要来源.如何从动态的海量网络信息中自动发现突发事件的新闻流主题,并跟踪突发事件的相关信息,从技术上实现对新闻专题进行组织和生成,对新闻事件进行探测与跟踪,一直是技术上的一个难题.Web文本挖掘的概念及关键技术,对其在新闻主题检测与主题追踪中的应用进行了一些探索性的工作.  相似文献   

9.
文本挖掘技术研究   总被引:28,自引:0,他引:28  
文本挖掘是数据挖掘的重要内容之一,其应用十分广泛.对文本挖掘技术的基本概念和理论进行系统地归纳总结,首先给出了数据挖掘、文本挖掘和Web文本挖掘的基本概念及主要研究方向,然后分析了文本挖掘的过程和关键技术,最后对文本挖掘技术进行总结和展望.  相似文献   

10.
1:Web上有大量的数据信息,怎样对这些数据进行复杂的应用成了现今数据库技术的研究热点,本文构建了基于Agent的Web文本挖掘模型,并详细阐述了该模型的结构和工作机理。  相似文献   

11.
随着信息爆炸时代的到来,如何有效的从网络上获取有价值的信息成为当前研究的热点.Web文本挖掘技术就是解决上述问题的一种方法,它从大量半结构化、异构的Web文档集中发现潜在的、有价值的知识.本文着力于研究Web文本挖掘过程中的重要技术,并通过分析当前研究热点和各种算法,提出一种改进的投影聚类算法,实验证明其正确率比k-均值算法高.最后,本文设计了基于Web文本挖掘的证券投资系统,并将改进的聚类算法应用其中.  相似文献   

12.
文本挖掘中的姓名特征具有很强的文本表达能力,本文设计的姓名特征提取算法是利用词与词的上下文关系及中文姓名本身的统计信息对文本中的姓名特征进行提取,通过对样本的测试,表明该项技术能比较准确地提取文本中的姓名特征,基本达到了预期的目标.  相似文献   

13.
将Web文本分类技术和Web使用记录挖掘技术应用于网站信息管理中,实现了网站对站内Web文本的快速自动分类以及对站内不同用户显示个性化布局的功能,显著提高了网站管理中处理大量信息的效率,增强了网站的个性化特征.  相似文献   

14.
文本挖掘研究进展   总被引:12,自引:0,他引:12  
数据挖掘是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要.由于存储信息最多的自然形式就是文本,因此文本挖掘具有重要的意义.结合笔者研究工作,主要介绍了文本挖掘的研究内容,挖掘过程,挖掘算法及应用前景.  相似文献   

15.
Web日志挖掘技术及其在电子商务中的应用   总被引:3,自引:0,他引:3  
近年来,由于电子商务、电子图书馆、远程教育等的应用,对Web站点设计和功能提出了更高的要求, 要求Web站点具有智能性。介绍了目前世界上两种主要的Web曰志挖掘技术(基于Web事务和基于数据立方体),同时,提出了基于Web目志挖掘技术的应用,主要讨论了站点的在线推荐和用户自适应的Web站点设计问题,在此基础上简单介绍了一个Web日志挖掘系统原型AdaptiveWeb。它可创建用户自适应的Web站点,使其具有部分智能。  相似文献   

16.
Internet的迅速发展,使得WorldWideWeb已成为一个巨大的信息资源库,为Web挖掘研究提供了丰富的信息资源,同时也提出了新的挑战。该文首先概述了数据挖掘和Web挖掘的概念、挖掘流程及算法,然后介绍了电子商务及网上购物的概念及现状,并结合具体实例讨论分析了Web挖掘在网上购物中的应用。  相似文献   

17.
多文化交流平台(intercultural-collaboration-environment,ICE)是亚洲多所大学与研究机构参与的、开发多语种在线交流翻译平台的国际合作项目.针对目前该项目中底层翻译软件AnnoChat的翻译结果可理解度较差的问题,提出了利用文本挖掘等技术来改进AnnoChat翻译结果可理解程度的方法,给出了使用文本挖掘技术对用户谈话内容进行挖掘生成知识模式,并用挖掘得到的知识用于修正并精化本体库的一种模型.在该模型中,增加了用户个性化知识数据库以修正文本挖掘所得到的知识.  相似文献   

18.
首先从高校教师个人主页系统建设的重要性和必要性两个方面分析了基于Web文本挖掘的高校教师个人主页系统建设的迫切需求,然后从体系架构、功能模块、关键技术等方面论述了基于Web文本挖掘的高校教师个人主页系统的设计与实现。  相似文献   

19.
谭榕 《科技信息》2009,(27):306-306
本文介绍了数据挖掘和网络信息挖掘的概念,特别介绍了搜索引擎以及网络地址URL的使用技巧,最后推荐了一些Web网上的检索与查询资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号