首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
收集大量网站的包含30个特征属性的数据,用k-means属性聚类方法将特征属性划分为不同类别,利用不同类别中的属性数据训练基础分类器,通过集成各基础分类器的结果对未知网站进行预测.采用简单投票和贝叶斯投票对结果进行组合预测,结果表明,k-means属性聚类方法大大增加了基础分类器的差异性,提高了分类检测的精度,其中基于贝叶斯投票策略的集成模型具有很高的检测精度.  相似文献   

2.
随着网络信息技术的飞速发展,网站内容管理成为各行业、各领域基础建设的重点。为了降低网站的日常维护成本,及时更新网站内容,将经典的分类算法C4.5决策树引入网站栏目的管理中,在发布新文章的时候,抽取关键词作为分类属性,实现对文章的分类,使其自动归入相应的网站栏目。  相似文献   

3.
基于多维组合的水利科学数据分类体系及其编码结构   总被引:1,自引:0,他引:1  
为满足水利科学数据管理和共享的需要,在分析我国水利信息分类与编码研究现状以及现有分类体系面临的主要问题的基础上,依据水利科学数据所具有的特性,提出了多维组合的水利科学数据分类体系结构,构建了由科学属性、获取方法、数据载体和时空定位组成的多维水利科学数据分类体系,并对其进行了规范化的编码设计,形成了3段18位的多维码编码结构.目前,该分类与编码体系已在水利科学数据共享网中得到实际应用.  相似文献   

4.
朴素贝叶斯在处理分类问题上简单高效,通常它假设属性间是条件独立的,且各属性变量对类变量的影响程度是相同的,但在实际应用中这些都难以被满足,从而使得其分类性能降低.因此,提出基于属性约简的加权朴素贝叶斯分类算法,该算法首先根据各属性不同取值的分类能力及属性间的对称不确定性大小,去除了无关属性和冗余属性,使得筛选后的属性之间具有较低的关联度和较强的分类能力;然后再结合属性与类变量及属性间的相关性对各属性进行加权;最后对待判样本进行分类.经实验结果表明,该算法有效地提升了朴素贝叶斯的分类性能.  相似文献   

5.
基于Bayesian网络的电子商务网站质量管理模型   总被引:4,自引:0,他引:4  
电子商务网站的质量对电子商务的成功有直接的影响。该文建立了一个动态的、客观的电子商务网站质量管理模型,讨论了电子商务网站质量的主要因素、属性以及子属性,形成了指标体系;应用B ayes ian网络原理,建立了基于B ayes ian网络的网站质量管理模型。该模型基于用户感知的质量,以总质量作为中心结点,可以直接测量的质量子属性为网络根结点。利用该模型的前向推理和后向推理,既可以对电子商务网站质量进行评估,又可以进行网站的质量管理。  相似文献   

6.
随着对钓鱼网站分析刻画的不断完善,使得钓鱼网站检测特征呈现高维化特点。属性维度的增加以及数据量的增长,会造成检测计算复杂度呈几何倍数扩大,导致检测时间复杂度高、占用资源大和检测效率低。针对多属性的钓鱼网站检测,设计了一种基于属性降维的钓鱼网站检测方法。该方法使用信息增益方法对原始数据进行特征选择,筛除可能存在的冗余和噪声数据信息;根据不同属性间的互信息计算属性相关性矩阵,利用属性相关性矩阵作为权值参与加权主成分分析;根据得到的降维后新特征数据通过监督学习算法构建钓鱼网站检测模型。实验表明,该方法可以有效降低原始数据中冗余和噪声属性的干扰,能够有效检测出复杂网络环境中的钓鱼网站,同时具有较高的稳定性。  相似文献   

7.
针对ID3算法偏向于选择取值较多的属性作为测试属性的缺点,引入OneR算法选择属性的相关子集进行分类,降低无关属性和重复属性对分类的影响。实验结果表明,与ID3算法相比优化后的方案提高了ID3算法的分类准确率,降低了分类时间,同时克服了ID3算法的取值偏置问题,优化了分类结果。  相似文献   

8.
提出了一种基于弱监督学习的主页人物属性抽取方法,首先根据领域模式从个人主页中提取出人物属性的前导词,接着通过前导词获取人物属性作为初始的属性种子,在这些属性种子中提取属性的模式,并结合分类和bootstrapping方法不断迭代抽取出无前导词的人物属性。在整个抽取过程中,只需要少量的人工标注。在英文机构网站上的人物属性抽取对比实验结果表明,该方法较属性分类抽取方法在准确率上提高了7.8%,召回率上提高了7.5%。  相似文献   

9.
Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作为包装对象,以分块算法和块语义特征分析为基础,根据抽取规则对网站具有分类语义的导航信息块进行处理.实验结果表明:抽取的Web网站分类层次的准确率较高,实用性较强.  相似文献   

10.
WWW网站分类体系包装器WCSW   总被引:1,自引:0,他引:1  
Web网站按自身的导航体系组织信息,其导航体系中含有分类语义特征.为实现有效的Web信息抽取,针对Web网站的分类体系,提出了基于HTML页面分块算法的Web网站分类体系包装器WCSW(website classification system wrapper),WCSW将整个网站作为包装对象,以分块算法和块语义特征分析为基础,根据抽取规则对网站具有分类语义的导航信息块进行处理.实验结果表明:抽取的Web网站分类层次的准确率较高,实用性较强.  相似文献   

11.
随着心理学研究的快速发展,人们对了解心理学知识的要求越来越多。介绍了查找心理学信息的有关网站,如心理学专业网站、心理学个人网站、港台心理学网站以及国外相关网站等。  相似文献   

12.
中国内地档案网站调查研究   总被引:3,自引:0,他引:3  
2004年1月至3月调查了中国大陆档案网站336个,随机完整下载其中226个档案网站并对其详细统计,获得大量数据,在肯定我国档案网站建设成就的同时,也对档案网站中存在的问题进行了客观分析。  相似文献   

13.
Web日志挖掘技术及其在电子商务中的应用   总被引:3,自引:0,他引:3  
近年来,由于电子商务、电子图书馆、远程教育等的应用,对Web站点设计和功能提出了更高的要求, 要求Web站点具有智能性。介绍了目前世界上两种主要的Web曰志挖掘技术(基于Web事务和基于数据立方体),同时,提出了基于Web目志挖掘技术的应用,主要讨论了站点的在线推荐和用户自适应的Web站点设计问题,在此基础上简单介绍了一个Web日志挖掘系统原型AdaptiveWeb。它可创建用户自适应的Web站点,使其具有部分智能。  相似文献   

14.
介绍了互联网上丰富的教育学信息资源,包括数据库、专业网站、搜索引擎、电子报刊、研究机构网站、高等院校图书馆网站及免费论文网站等,探讨了从互联网上检索有关教育学资源的途径、方法、策略和技巧。  相似文献   

15.
图书馆Web网站可用性评价   总被引:2,自引:0,他引:2  
以5个国内图书馆网站为例,阐述了对图书馆Web网站可用性评价的意义和内容,建立了图书馆网站可用性的评价指标体系。  相似文献   

16.
针对目前我国农业网站运行状况与服务质量状况,将网站链接分析与数据挖掘方法相结合,通过对30个农业网站样本的分析评价,提出了我国农业网站建设及其运行状况监测的改进对策。  相似文献   

17.
对威客网站运作模式的分析   总被引:5,自引:1,他引:4  
在认识威客和了解威客出现背景的基础上,简要介绍了威客模式网站,分析了威客的商业模式,并结合典型的威客网站了解威客商业模式,指出威客网站运作中存在的一些问题,提出了一些应对策略.  相似文献   

18.
随着电子商务行业在中国的不断发展,众多的电子商务企业(网站)在国内的影响力日益增大,对我国经济生活的各个领域产生了深远影响。目前我国大型电子商务网站中,已经比较好地解决了信息流和资金流的问题,但还没有建立配套的物流,已经成为我国大型电子商务网站发展的瓶颈问题。就我国大型电子商务企业(网站)建立配套物流的必要性和可行性进行了分析,并对大型电子商务网站物流建立中的相关问题作了探讨。  相似文献   

19.
广东省科技期刊网络化趋势调查   总被引:3,自引:0,他引:3  
对广东省174种科技期刊进行期刊网络化趋势调查.结果表明:174种科技期刊中。有网站且能正常运行的期刊139种,占80%.其中39种期刊有独立的网络域名,仅占28%,另100种为非独立域名,包括依靠主办单位网站或与其他网站合作实现期刊上网的44种.网站提供的基本信息前2位是目录和稿约。提供全文电子版及采编系统(远程或在线审稿、在线投稿、稿件查询)的较少.独立的网络域名的ALEXA排名中.11种查不到排名.可见广东省科技期刊上网的水平参差不齐,其网络利用率还是处于较低的水平.  相似文献   

20.
基于序列数据挖掘的中文网页特征选择方法   总被引:1,自引:0,他引:1  
提出了一种基于序列数据挖掘的中文网页候选特征的选择方法,并用于中文网页分类模型. 该方法运用改进的PAT树结构挖掘频繁出现在同一类中文网页中的字符串,通过净频率计算,挖掘出中文网页中频繁出现的有意义的词、短语、英文单词等,并结合CHI算法得到文本特征. 实验表明,该算法不仅能挖掘出传统方法所选择出的绝大部分特征,还能挖掘出一些有意义的、切词系统词库中没有的、能反映分类特点的人名,地名,新词、常用语、外文单词等.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号