首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
分析了分段对文本分类的影响,提出了与文本语义密切相关的最大语义标志原则(MSMR)和段落间的语义激励原则(SIR),在模糊K-最近邻分类算法的基础上,应用这2个原则设计并实现了一种基于上下文的文本片断模糊分类算法.该算法依据SIR判断文本片段分类的相互影响,降低了片段分类的错误率,当某一片断类隶属度大于某一阈值时,依据MSMR判定可知,同一文档的后续片断均属于同一类别,这样就不用计算所有片断的类隶属度.实验表明:与模糊K-最近邻分类算法相比,所提算法能有效提高系统的查准率、查全率和正确率,其中查全率可提高16%以上;在同一会话中,由于被明确分类后的后续片段不需要计算类隶属度,所以算法总计算时间明显少于模糊K-最近邻分类算法,具有较高的分类效率.  相似文献   

2.
3.
网页分类技术   总被引:17,自引:0,他引:17  
网页分类是使用机器学习的方法实现网页类别的自动标注.回顾了文本分类技术的研究状况,分析了网页的结构特征,难点在于结合网页的结构信息选择合理的表示方式和分类算法.使用纯文本分类技术处理网页是不合理的.基于概率模型的方法和关系学习方法计算量大,关系学习方法学习结果的可解释性好,支持向量机方法分类准确率高,但核函数的构造和大规模数据集的训练都是该算法的难题.应该采用多种指标对网页分类算法进行评价.  相似文献   

4.
讨论了网页分类过程中数据预处理的相关技术,提出一种网页预处理方法,将网页解析为DOM树结构,通过分析、整理,得到噪音信息的特征,并依据判定规则,找出噪音信息并删除处理。网页去噪后,提取页面中的文本信息和每个相关链接目标URL、源URL及锚文本并存入数据库。实验结果证明,该去噪方法可以有效去除网页噪音,利用所提取的超链接结构信息分类网页,可以有效提高分类精度。  相似文献   

5.
针对信息搜索与挖掘中存在的关键词多义性及用户对所要查询信息的分类存在一定的模糊性问题,提出了一种基于模糊分类网络的信息挖掘方法。该方法利用模糊分类网络固有的对模糊信息的非线性处理能力和自适应学习机制,通过对WEB页面大量分类文档信息的学习,建立了基于模糊分类网络的信息分类器和挖掘模型。构造的信息分类模型结构简单、学习收敛速度快且易于实现。文中给出了分类策略和实现算法,并以中国石油网油气管道专题信息分类为例验证了方法的有效性。  相似文献   

6.
运用文献计量学的方法,对近5年来发表的网络信息分类组织研究的论文进行了统计和分析,并对其研究的内容进行了分析,指出了现阶段网络信息分类组织研究中存在的问题。  相似文献   

7.
网络信息分类组织研究展望   总被引:1,自引:0,他引:1  
随着网络信息资源的开发利用,网络信息分类组织也成为了近几年信息组织领域的研究热点。本文分析了当前众多学者在网络信息分类组织的研究中存在的问题与不足,主要阐述了网络信息分类组织的发展趋势。  相似文献   

8.
针对中文网页分类问题,提出一种基于KM和CV的KNN改进算法——KNC算法.基于该方法的网页分类实验结果表明,KNC算法在保持分类质量的情况下,较大地提高了分类的速度.  相似文献   

9.
网络信息资源分类组织研究概述   总被引:4,自引:0,他引:4  
运用文献计量学的方法,对1998~2002年间发表的有关网络信息分类组织研究的论文进行了统计和分析,对研究的内容和存在的不足之处进行了总结。  相似文献   

10.
由于超链接语言结构本身所提供的信息,网页分类问题不同于一般的文本分类。本文分析了网页内部特征,并在1000篇网页规模语料库的基础上,通过试验对比了三种特征选择方法对高维特征向量空间进行降维的效果。文章还提出了一种新方法,根据特征项所处的位置赋予不同权重的方法,实验表明这种由文本结构导出的权重计算方法能够取得很好的分类效果。  相似文献   

11.
研究了中文网页体裁分类的特征项选取问题及权重计算方法,探讨不同特征空间对体裁类别的判别能力问题,给出了一种评价方法。据此,提出一种特征项的权值调整策略,实验结果验证了该方法的有效性。  相似文献   

12.
教学网页是学校和教师开展网络教学的主要载体与途径,学习理论是进行教学网页设计的理论基础。灵活运用学习理论进行教学网页设计是提高教学网页质量的根本途径和方法。本文从这个方面出发,探讨了格式塔学习理论在教学网页设计中的应用。  相似文献   

13.
案例教学法在网页设计教学中的应用研究   总被引:2,自引:0,他引:2  
刘勇 《南昌高专学报》2010,25(6):107-109
网页设计课程是一门操作性和综合性都很强的课程,在高职教育的网页设计教学中引入案例教学法,有利于提高学生的动手能力,有利于取得良好的教学效果。本文介绍了案例教学法的基本理论和特点,分析了网页设计课程进行案例教学的可行性,阐述了网页设计案例教学中案例选取与设计、案例教学方式、案例分析与讨论及案例教学效果评价等案例教学的组织与实施过程,并对案例教学法对教师的要求进行了分析。  相似文献   

14.
《网页设计》是现代教育技术专业的一门必修课。笔者根据自己从事网页设计的经验,从网页的内容、设计语言的选择、布局风格、数据库的应用、讨论区的创建以及网络安全等几个方面探讨了网页设计应注意的一些基本要素。  相似文献   

15.
高性能网页索引器JU_Indexer的实现   总被引:4,自引:1,他引:3  
高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间.  相似文献   

16.
网页色彩设计的情感因素   总被引:1,自引:0,他引:1  
在网页设计中,色彩是营造情感的一个重要因素。用户对不同的网页色彩及其色调具有不同的情感反应。设计者在做站点界面色彩设计时,既要突出以用户为中心的设计理念,同时要深入分析色彩给用户带来的情感上的不同反应,目的是通过色彩的设计营造一种轻松、愉悦的使用环境。  相似文献   

17.
提出一种基于向量空间模型的多层网页分类方法.该方法用主题词、修正主题词和主题概念从3个层次构建网页表示向量,从而在概念层次上更贴近网页的语义,且向量维数低于传统的特征向量.实验结果表明,该方法降低了分类时的计算量,提高了网页分类速度和分类精度.  相似文献   

18.
通过对网页设计要素的分析与论述,阐明了网页设计的布局原理.  相似文献   

19.
网页监控与恢复系统的设计与实现   总被引:1,自引:0,他引:1  
介绍一种三层结构的网页监控与恢复系统,对其功能、原理及软件编程实现方法做了详细阐述.系统采用三重代理专线结构,提供多种数字特征提取算法,对信息网站的有效文件从内容、读写权限、目录文件突增等多个角度全部同时监控报警,并能实时安全发布网页文件,为网站安全管理提供了很重要和直接的手段.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号