首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 122 毫秒
1.
基于Web的个性化学习是在远程学习和个性化服务相结合的基础之上发展起来的.利用Web挖掘的方法,针对用户的兴趣变化,搭建了个性化学习系统.并且通过模拟实验,验证该系统的有效性.  相似文献   

2.
3.
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%.  相似文献   

4.
基于VSM的中文文本分类系统的设计与实现   总被引:25,自引:0,他引:25  
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重,并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到90%左右,而且标题权重的引入和新分类算法的实施有效地改善了分类性能。  相似文献   

5.
基于Web数据挖掘的文献个性化推荐系统的设计   总被引:1,自引:0,他引:1  
基于数据挖掘的Web个性化信息推荐服务日益成为一个重要的应用技术,通过使用FP-tree关联规则挖掘算法对用户文献阅读信息进行分析,发现用户的阅读习惯和阅读兴趣,进而为用户进行个性化的文献推荐,从而提高网站对用户的吸引力。  相似文献   

6.
探讨了Web挖掘的相关理论,包括Web文本信息的表示及特征提取,关联规则分析和信息分类,综合Web挖掘的关键技术,提出了一个基于Web挖掘技术的信息分类模型系统,使用户能够对已分类的资源进行浏览、检索,从而更方便、快捷地获取所需信息。  相似文献   

7.
基于web日志挖掘构建个性化推荐系统   总被引:1,自引:0,他引:1  
单文举 《科技信息》2009,(14):209-209
本文介绍Web日志挖掘和个性化推荐系统概念,对日志挖掘出访问网站的相似爱好的用户群体、页面之间的内在联系,以此改进网站性能和组织结构,提高用户查找信息的质量和效率。  相似文献   

8.
研究了一种基于改进贝叶斯算法的短信分类方法。对中文文本短信,采用文档频度(DF)的特征项提取方法,借助自建短信语料库对改进的贝叶斯分类器进行了实验测试。实验结果表明:改进的分类器可以提高正常短信的通过率,并可以根据新的训练集训练出个性化的分类器,适应短信变化,满足用户的个性化需求,还结合黑白名单过滤机制实现对短信的过滤...  相似文献   

9.
介绍Web数据挖掘概念、个性化推荐技术,着重设计了一个基于Web挖掘的个性化推荐系统,并给出了个性化推荐核心模块的实现过程。本系统根据Web挖掘过程,结合基于聚类划分的增量式关联规则挖掘算法的实现。  相似文献   

10.
基于向量空间模型(Vector Space Model,VSM)实现用户搜索结果的个性化排序,通过用户提供其感兴趣的文本集作为训练样本实现用户模型的初始化,并引入遗忘因子,结合机器学习的方法,通过用户后期的上网行为实现用户模型的动态更新,同时采用TF-IDF算法进行文本特征的提取,并针对文档模型与用户模型的统一提供了解决方案。  相似文献   

11.
基于Multi-Agent技术的个性化数据挖掘系统   总被引:2,自引:0,他引:2  
设计基于Multi Agent技术的个性化数据挖掘系统,介绍了该系统构造的基本思想和Agent的状态转变关系及其它们之间的通信协议;利用用户Agent和挖掘Agent得到个性化数据挖掘系统MAS,并给出了系统的算法.该类系统的特点是:用Agent模拟人,实现用户在系统中的智能代理.结果表明,它能够实现数据挖掘的个性化服务功能,提供对用户真正有价值的知识,有效地避免了用户的重复劳动和精力耗费;同时,避免了系统对无用数据的挖掘,提高了系统的运行效率.  相似文献   

12.
文本分类与文本信息特征概念的提取是当前智能信息服务研究的重点,为自动获取新的特征概念,提出了一种基于特征概念的自动提取系统,该系统包括分词、综合文本词权处理、类别归属和特征概念提取等部分,能有效地从概念上提取文本类特征,提高文本自动分类的准确性.  相似文献   

13.
通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法;最后,指出了当前文本分类过程中存在的问题,并对今后的发展进行了展望.  相似文献   

14.
提出了一种网络信息文本分类模型的建立方法,根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型,分别进行了基于最近邻决策和K-近邻决策的分类效果试验研究,结果显示,K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

15.
基于特征贡献度的特征选择方法在文本分类中应用   总被引:1,自引:0,他引:1  
在目前的文本分类问题中,特征选择方法被认为是提高分类精度和效率的一种有效方法.提出了一种基于特征贡献度FCD(feature contribution degree)的特征选择方法,本方法将某个特征对于类别之间区分能力的贡献度大小作为该特征被选取的条件,特征对于某一类别的FCD值为特征在该类中出现的文档数与在所有类别中出现的文档数的比值.对该方法进行了实验,并与一些常用的特征选择方法进行了比较,实验结果表明该方法具有更好的分类效果.  相似文献   

16.
传统的文本表示是在向量空间模型的基础上,采用特征选择方法降低文本的维数,这种方法认为文本中词语是相互独立的,没有考虑彼此之间的语义信息.文章提出一种新的基于语义特征选择的文本分类方法,在已有特征选择的基础上,利用词语之间的语义关联性,将那些与已选择的词语具有密切联系的词语加入词语特征空间.实验表明,该方法与已有的特征选...  相似文献   

17.
一种基于VSM文本分类系统的设计与实现   总被引:10,自引:0,他引:10  
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现 ,包括对该系统的结构、预处理、特征提取、训练算法 ,分类算法等关键技术的介绍 .通过引入结构层次权重系数来改进文本特征项权重 ,同时提出一种新的训练算法和文本相似度域值计算方法 .实验结果证明 :该分类系统能有效地提高文本分类效果 ,开放性测试的平均准确率在 80 %以上 ,且平均查全率达到了 86 % .  相似文献   

18.
文本挖掘技术的研究   总被引:3,自引:0,他引:3  
本文对文本挖掘的过程极其关键技术进行了系统的分析,并探讨了其应用趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号