首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为使支持向量机(SVM)更加适用于在线文本分类应用,利用SVM在小训练样本集条件下仍有高泛化能力的特性,结合文本特征向量在特征空间中具有聚类性的特点,提出一种用语义中心集代替原训练样本集作为训练样本和支持向量的SVM语义SVM.文中给出了语义中心集的生成步骤、语义SVM的在线学习算法框架,以及基于SMO算法的在线学习算法的实现.实验结果表明,相对于标准SVM,语义SVM及其在线学习算法不仅在线学习速度和分类速度有数量级提高,而且在分类准确率方面具有一定优势.  相似文献   

2.
随着internet的快速发展,垃圾邮件泛滥成灾.面对垃圾邮件日益严重的现状,提出了贝叶斯邮件过滤模型并讨论了贝叶斯分类方法在垃圾邮件过滤中的应用.针对难以获得大量有类别标签的邮件训练集问题,利用贝叶斯具有增量学习特征,分析并提出了基于小规模训练集的贝叶斯增量邮件过滤方法,通过最小化当前邮件分类器的分类损失,来选择有利于提高分类器性能的邮件加入训练集.实验结果表明,该方法是切实可行的并具有良好的效果.  相似文献   

3.
针对基于GPU和MPI并行的支持向量机(SVM)算法不适合于云计算环境,设计了一种基于多级SVM的并行支持向量机模型,实现了云计算环境下的序列最小优化(SMO)的并行算法。该算法通过MapReduce系统将大规模训练数据集划分为若干小训练集,再由这些小训练集开发多级的SVM,最后收集每一个SVM最优超平面附近的样本数据来训练另一个新的SVM。实验结果表明,该算法在时间消耗与分类正确率等综合方面比单机算法和传统并行算法获得更好的效果。  相似文献   

4.
一种基于SVM的中文电子邮件过滤方法   总被引:1,自引:1,他引:1  
提出了一种基于SVM的中文邮件过滤方法,通过构造最优的支持向量机(Support Vector Machine,SVM)过滤模型,有效地提高了垃圾邮件的过滤精度,实验结果超过了网易免费邮所公布的过滤指标.  相似文献   

5.
针对垃圾信息过滤的问题,提出了一种基于支持向量机(SVM)算法的垃圾信息过滤方法. 利用文本分类和信息检索领域所常用的性能评价指标,建立了垃圾信息过滤的评价体系,针对仿真实验获得的实验数据,利用所建立的垃圾信息过滤评价体系对实验数据评价结果,选取了适合的核函数及其参数,构建了SVM分类器,同时也通过仿真实验和评价体系对SVM分类器和传统贝叶斯分类器进行了测试和评估. 结果表明,基于SVM算法的分类器提高了信息过滤的准确性,同时也验证了SVM算法在垃圾信息过滤中的有效性.   相似文献   

6.
基于随机森林的文本分类模型研究   总被引:1,自引:1,他引:1  
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造. 当森林中决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将其同C4.5, KNN, SM0, SVM 4种典型的文本分类器进行了比较,结果显示它的分类性能胜于C4.5,同KNN, SMO和SVM方法相当.  相似文献   

7.
垃圾邮件问题日益严重,受到研究人员的广泛关注.通过利用基于词频的权值计算,同时改进传统文本相似度计算概率模型,改进SVM算法实现邮件过滤系统.实验表明在邮件过滤的查全率、查准率等几个性能评价指标上,比传统的Rocchio方法有明显改善.  相似文献   

8.
基于生物序列模式提取技术的邮件过滤算法   总被引:3,自引:0,他引:3  
为了解决垃圾邮件过滤问题,考虑到中文垃圾邮件的特点和过滤系统的效率要求,应用生物信息化技术中模式提取算法TEIRESIAS的原理,设计了基于生物序列模式提取技术的垃圾邮件过滤算法BioMatrix,并实现了基于此算法的中英文邮件过滤系统.过滤系统由数量控制过滤提供垃圾邮件训练集,通过提取其中的特征模式对邮件进行分类,可以识别出约94.2%的垃圾邮件,误过滤率约0.04%.与Bayes过滤算法对比的实验结果表明,将生物序列模式提取技术应用于邮件过滤具有较好的研究和实用价值.  相似文献   

9.
垃圾邮件过滤是网络信息处理中的重要问题,基于机器学习方法的垃圾邮件过滤技术是目前的研究热点。现有研究一般将过滤问题视为二值分类问题进行解决,存在着模型优化目标和性能评价指标1-AUC不一致的问题,导致模型优化结果产生偏差,过滤性能受到很大影响。该文通过直接优化评价指标1-AUC来提升过滤器性能,将垃圾邮件过滤问题转化成排序问题进行建模,提出了在线排序逻辑回归学习算法,解决了在线学习中的邮件得分偏移问题;综合应用TONE算法和重采样技术,提出参数权重更新算法,解决模型学习中在线调整模型参数时的处理速度问题,满足垃圾邮件实时过滤的要求。在垃圾邮件过滤公开评测数据集上的实验结果表明,基于在线排序逻辑回归模型的过滤结果全面优于在线逻辑回归模型的过滤结果。  相似文献   

10.
骆丽娟 《科技信息》2007,(28):324-328
基于内容的垃圾邮件过滤方法是垃圾邮件过滤方法的一个重要分支,由于其高准确率,朴素贝叶斯算法更在基于内容的过滤方法中占了一席之地。本文介绍了贝叶斯算法的基本原理及其在邮件过滤中的应用,并写出了其监督训练过程和邮件过滤具体过程,做出了全部过程的进程图。提出了笔者自己的一点想法,建立用户个人邮件训练集可能会更一步增加垃圾邮件过滤的正确度与召回率。  相似文献   

11.
秦伟 《韶关学院学报》2007,28(8):120-121
《梁山伯与祝英台》与《罗密欧与朱丽叶》两部作品的内容都取材于民间故事,都属于标题性音乐作品,作品曲式结构基本相同。不同之处是对造成悲剧原因的展示有着明显区别,主、副部主题的表现和运用截然相反,音乐的主基调有较大差异,作品的整体风格迥异。  相似文献   

12.
徐辉 《科技信息》2011,(5):231-231,266
健康与运动是密不可分的,运动分为有氧和无氧,有氧运动较无氧运动更易普及和被大众接受,从人体长期参加有氧运动对人的身体健康和心理健康的角度来阐述有氧运动对人体的良好影响。  相似文献   

13.
Dads and disomy and disease   总被引:7,自引:0,他引:7  
M Little  V Van Heyningen  N Hastie 《Nature》1991,351(6328):609-610
  相似文献   

14.
欲望是作家创作的内驱力,道教对中国古代文人的欲望有什么影响,这是研究中国古代文学和文学理论不能不思考的问题。本文从道教的功利性,文人纷纷走近道教,文学观念中的道教因素等方面,对道教与魏晋南北朝文人的功利欲望作些专门探讨。这无疑会拓展人们研究的新视界。  相似文献   

15.
我国的沙暴、尘暴及其防治   总被引:1,自引:0,他引:1  
我国是沙尘暴易发的国家 ,进入90年代以来 ,沙尘暴有频率增加、强度加大、范围扩展、危害程度加剧的趋势。据统计 ,我国发生强沙尘暴的次数 ,50年代为5次 ,60年代为8次 ,70年代为13次 ,80年代为14次[1] ,90年代为23次[2] ,呈明显上升趋势。沙尘暴的强度及造成的损失 ,以90年代最为突出 ,发生于1993年5月5日(5.5沙尘暴)和1998年4月16日(4.16沙尘暴)的特大强沙尘暴 ,是我国近100年来所罕见 ,损失极其惨重。5、5沙尘暴锋面前移速度14~17米/秒 ,最大19.5米/秒 ,瞬时最大风…  相似文献   

16.
 我国是沙尘暴易发的国家, 进入90年代以来, 沙尘暴有频率增加、强度加大、范围扩展、危害程度加剧的趋势。据统计, 我国发生强沙尘暴的次数, 50年代为5次, 60年代为8次, 70年代为13次, 80年代为14次[1], 90年代为23次[2], 呈明显上升趋势。沙尘暴的强度及造成的损失, 以90年代最为突出, 发生于1993年5月5日(5.5沙尘暴)和1998年4月16日(4.16沙尘暴)的特大强沙尘暴, 是我国近100年来所罕见, 损失极其惨重。  相似文献   

17.
文献信息情报工作在科技工作及立项决策中的作用   总被引:1,自引:0,他引:1  
本文揭示了在当今信息市场形势下 ,文献信息情报工作在科技工作和经济立项决策中的作用 ,同时也指出 :图书馆文献信息工作者们能在强手如云的信息市场中占领一块阵地也应成为图书馆界的共识  相似文献   

18.
当前,因高校管理引发的法律纠纷呈上升趋势,究其原因是师生的法治观念在增强,另一方面说明高校在师生管理等方面也存在诸多不适应。要改变这些不适应,就要进行依法治校,更新管理理念。做到规章制度合法、管理行为合法。努力加强法制教育工作和师德校风建设,切实保障师生的合法权益。  相似文献   

19.
网络的发展为我们带来全新便捷的互动平台和交流方式,博客是当今传播文化的重要载体,因个体性、公共性、开放性、成本投入少等特点吸引着"90后"大学生广泛关注。在新形势的要求下,高校辅导员应主动占领网络博客思想政治教育新阵地,加强辅导员博客建设,根据大学生的心理特点,利用博客提升网络思想政治教育工作的吸引力和感染力,创新高校思想政治教育。  相似文献   

20.
辽金诗文作品中存在着大量的由佛经禅典移植而来的话语。这一现象从特定侧面体现了佛禅对中国古代文学的渗透溶浸。其表现主要反映在借用佛禅意像、使用佛禅故实和引用佛禅语汇三方面。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号