首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
随着Internet技术的不断发展,Web信息不断的变化和增长.为有效查找用户所需要的信息,需将传统的信息检索向Web信息检索方向发展.如果预先对网页文本进行分类,则面对用户的检索需求就可以在相应的类别中进行查找,这样大大提高了检索的效率.文章通过对网页进行预处理,中文分词,特征提取,再使用KNN分类算法对网页进行智能分类,并采用了PSO算法快速寻找K近邻.实验结果表明:该方法不仅减少了网页分类时间,准确率、召回率和F1标准也明显提高,有效地提高了网页智能分类的效率.  相似文献   

2.
研究并提出了基于Hyperlink聚类的分类算法,它不需要分析Web文档内容,只根据Web图来聚类,算法性能比传统文本分类方法有很大提高,大大增强了网页分类的能力和效率,适合于海量网页分类,实验表明基于Hyperlink聚类的分类算法,应用于Web文档信息分类,比传统的文本分类方法更加有效。  相似文献   

3.
网页分类需要使用标记网页对分类算法进行训练,然而,对网页进行标记的过程既费时又费力.随着web的快速发展,获得未标记网页已经变得相对容易.为了有效地利用未标记网页来提高网页分类的性能,提出了一种基于集成学习的网页分类算法,迭代运行支持向量机、中心分类器和朴素贝叶斯分类器,并对各分类器的预测进行集成,不断地从未标记集中对网页进行标记后用于训练.实验结果表明.提出的算法有效地提高了网页分类的性能.  相似文献   

4.
基于Web的新闻文本分类技术的研究   总被引:1,自引:0,他引:1  
从Web新闻网页中挖掘出有用的知识是当前研究的热点问题,将Web新闻网页进行解析,在此基础上进行Web新闻文本分类处理,可在一定程度上解决此问题.针对Web新闻网页的结构特点,提出了基于Web的新闻文本分类系统的实现框架.实验结果表明,基于KNN算法的分类系统具有较好的分类效果.  相似文献   

5.
魏海平 《科学技术与工程》2012,12(12):3002-3004
随着Internet技术的飞速发展,网页上存在着各种各样、类目繁多的信息,因此网页分类技术就显得越来越有意义。本文使用向量空间模型(VSM)来表示网页文本,提出了一种改进X2的文本特征选择方法,最后通过支持向量机方法进行分类。实验结果表明,相对于传统的X2文本分类统计方法,改进后的特征选择方法的分类效果要好于传统的X2统计方法。  相似文献   

6.
基于分块的网页主题信息自动提取算法   总被引:3,自引:0,他引:3  
对互联网上大量存在的基于模板的网页,根据其半结构化的特点,提出了一种网页分块和主题信息自动提取算法.该算法利用网页标记对网页进行分块,改进了传统的文本特征选择方法,把网页块表示成特征向量,并根据有序标记集识别主题内容块.用该算法改进了网页分类的预处理过程,提高了分类的速度和准确性.实验表明,对网页进行主题信息提取后再进行分类,可以提高分类系统的查全率和查准率.  相似文献   

7.
为方便中文文本分类过程算法研究,阐述中文文本分类的基础技术,提出基于构件的中文文本分类技术研究辅助平台.该平台对大多数分类中使用的算法在中文文本分类中的应用效果进行了研究.实验结果表明: 该平台可以通过计算分类器分类准确率的宏平均值比较分类算法与特征选择算法的性能,可以评估语料库的可用性,能够用于研究中文分词、特征选择、分类算法等中文文本分类技术问题.  相似文献   

8.
探讨了中文网页倾向性分类的原理和实现方法,利用文本自动分类技术结合Web页面中的结构信息,提出了LSI-KNN-Naive Bayes的褒贬分类模型.并在部分网页数据集上,对上述理论进行了实验验证,取得了较好的成效.  相似文献   

9.
通过构建向量空间模型可以获得表征网页数据的词-文本权重矩阵,然而直接基于此高维矩阵进行分类学习效率较低,为此提出一种结合改进非负矩阵分解的模糊网页文本分类算法.首先,通过迭代的归一化压缩非负矩阵分解将高维的原数据映射到低维语义空间,以降低问题的复杂性.然后,将模糊逻辑引入分类模型,通过特征词与类别的模糊隶属度来生成文本的类别模糊集,以解决确定性矩阵难以判定语义模糊词所属类别的问题.实验结果表明,与其他方法相比,所提出的分类算法具有较高的分类准确度和较好的时间性能.  相似文献   

10.
分类是一个映射的过程,它将未标明类别的对象映射到已有的类别中.分类算法是数据挖掘研究中十分关键的问题.通过对常用Web分类方法研究现状的分析,发现这些方法在解决多类别网页文本分类问题方面存在一定的局限.  相似文献   

11.
文章结合实际工程开发经验,讨论了在网站建设中进行前台页面设计时应注意的若干问题。  相似文献   

12.
基于语义分层迭代法的网页挖掘技术   总被引:1,自引:0,他引:1  
提出了一种基于页面语义的分层迭代划分方法,并将其运用于网页挖掘,通过把网站页面迭代划分为不同数目节点的多层,选取符合要求的层来进行数据挖掘处理,便于快速定位到该层中的某个节点,该节点就是需要的主要内容。  相似文献   

13.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势.  相似文献   

14.
We combine the web usage mining and fuzzy clustering and give the concept of web fuzzy clustering, and then put forward the web fuzzy clustering processing model which is discussed in detail. Web fuzzy clustering can be used in the web users clustering and web pages clustering. In the end, a case study is given and the result has proved the feasibility of using web fuzzy clustering in web pages clustering.  相似文献   

15.
针对现有语义Web服务组合方法未考虑到互联网环境的动态性及Web服务的随机性问题,提出采用流演算理论对语义Web服务组合进行研究.首先将Web服务的输入、输出、前提和效应映射为基于流演算的动作形式化描述; 然后定义将OWL-S中的原子过程和复合过程向流演算转换的规则; 再根据提供的Web服务组合目标,利用形式化地推理来得出Web服务的组合序列,从而能动态地形成正确有效的Web服务组合方案.最后,通过一个会议安排实例验证上述理论,结果表明该方法是可行的.  相似文献   

16.
网络已日趋普及到我们的日常生活、学习中。因此,网络安全是保障人们正常使用网络的必需手段;而网络安全审计是网络安全体系的一个重要部分。本文着重分析了网络安全审计是如何在网络安全中起作用的。  相似文献   

17.
王新昊 《科技资讯》2007,(14):219-221
本文首先介绍了Web技术的发展,随后总结了现有的Web开发框架,然后分析了Web快速开发框架的需求和产品,最后提出了3SWeb快速框架。  相似文献   

18.
个性化推荐系统中,设计用户的兴趣模型是一个关键问题.通过分析web环境下用户的特点和浏览行为,提出了一种新的基于向量空间模型的混合模型,并根据用户对页面的访问次数,浏览速度和驻留时间来更新模型.模型便于实现,且更新及时,简单.  相似文献   

19.
针对实验教学的现状和存在的问题,提出了一种将硬件实验资源网络化的解决方案。包括通过采用RADIUS认证协议来实现远程网络实验的认证和计费以及对实验的远程实时监控和数据采集等方面的研究。对该系统的总体框架和主要功能及实现做了简要介绍,对类似的研究和应用具有一定的借鉴意义。  相似文献   

20.
浅析Web服务器应对攻击的安全防范对策   总被引:1,自引:0,他引:1  
徐立国 《科技资讯》2010,(24):11-11
随着网络技术的飞速发展,web服务器的安全越来越受到人们的重视,本文针对部分攻击web服务器的现象,提出了相应的web服务器应对攻击的安全防范对策。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号