首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 814 毫秒
1.
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程.阐述了一个文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、词义扩展、学习和识别过程、分类算法等进行了详细介绍。引入smooth技术改进词语权重,介绍向量空间模型.结果表明查全率和准确率均达到80%左右,而且smooth的引入有效地改善了分类性能.  相似文献   

2.
当今社会文献的生产和增长的速度越来越快,社会文献的类型也变得丰富复杂。社会文献的时效性强导致了传播速度加快,文献的内容也出现了交叉、重复等错误,这些问题使人们在查阅和利用上变得更加不方便。针对上述问题,设计基于关联规则的图书馆中文文本自动分类方法。从这些图书馆产生的问题入手,计算图书馆中文文本,设计数据预处理按预定规则收集处理信息和提取关键词检索文本信息的方法,利用计算机解决问题,方便了图书馆的自动分类和识别。  相似文献   

3.
基于VSM的中文文本分类系统的设计与实现   总被引:25,自引:0,他引:25  
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重,并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到90%左右,而且标题权重的引入和新分类算法的实施有效地改善了分类性能。  相似文献   

4.
一种基于朴素贝叶斯分类的特征选择方法   总被引:11,自引:0,他引:11  
由于朴素贝叶斯文本分类中的独立假设前提,使得在特征选择步骤能否准确有效地选出能代表文本的特征显得尤为重要,而特征选择标准中的MI标准与TFIDF标准其优缺正好互补,因此在用朴素贝叶斯文本分类方法中的多项式模型实现了一个web页面分类系统-WEBCAT的基础上,提出将MI标准与TFIDF标准结合进行特征选择.实验显示:用改进的方法可以更准确地选出能代表文本的特征,文本分类结果也比单独使用TFIDF标准或单独使用MI标准进行特征选择的分类结果更加精确.  相似文献   

5.
针对不良文本的过滤问题,提出一种基于主题分类的文本过滤方法,通过对文本信息进行向量化,引人文本特征抽取技术,筛选出针对文本内容的最优的特征项集合,利用SVM分类技术,来判断文本的态度和立场,达到内容审查过滤的目的.并利用DSP在硬件上加以实现,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率,且过滤时间大幅减少.  相似文献   

6.
为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记. 该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表示,通过计算文本主题从属于各分类目录的期望从而实现文本自动标记. 为验证TML算法的效果,在标准文本分类数据集上使用文本分类器进行有监督文本分类实验. 为对比数据集和分类器对分类效果的影响,在3个数据集(WebKB、Reuters-21578、20-NewsGroup)上分别使用3种不同的分类器(Rocchio、KNN、SVM)进行实验. 实验结果表明:TML算法有效地提高了文本分类效率及文本标记效率.  相似文献   

7.
近年来在甘、青、川地区发现了大量民间苯教文献,在这些名目庞杂的文献中,“夏当”■仪轨文献始终是出现率较高的主题之一,但在已出版文献中,未按科仪知识类型或未系统的对仪轨文本进行整理与分类。甘肃省卓尼县车巴沟地区发现的“夏当”仪轨文献即“贡则夏易”■,不同于其它地区发现的文本,具有一定的系统性和结构性。文章试图从文本及其仪轨的相互演绎研究“夏当”文献范畴及仪轨程式的进路,通过对“贡则夏易”文本内容的梳理、仪式过程的观察和仪式主持人“阿尼”■的访谈相结合的方法,对当地“夏当”仪轨文献的内容、结构和特点进行分析。认为此文本可以为研读其它民间苯教文献提供辅助和校补作用外,其中的稀有文本还可为研究斯巴苯教提供新的资料,对全面认知鸟类仪式作用开拓视野。  相似文献   

8.
随着万维网的快速普及和发展,Web上出现了大量短文本,如科技文献摘要、微博和电子邮件等.短文本内容短小,相互联系,已标注数据获得困难,导致传统分类方法很难取得较高的分类精度.为了解决短文本分类问题,提出了一种基于半监督学习的迭代分类算法(SS-ICA).它使用较少的已标记数据,利用短文本间的关系进行迭代分类.通过与常用分类方法进行对比表明,在标注数据较少的情况下SS-ICA比其他分类器有更高的分类精度.  相似文献   

9.
文本分类是根据文本内容自动确定文本类型的过程。介绍现有特征抽取和分类算法,提出用模糊聚类算法FCM确定文本类标签,Boosting算法构造分类器的方法,使文本分类具有更好的分类精度和时效性,以及对未知类标签语料库中文本的自适应性。  相似文献   

10.
垃圾邮件过滤技术主要有三个大类,它们分别运用不同的方法和途径来判定垃圾邮件:基于IP地址;基于规则;基于邮件内容.基于内容的垃圾邮件过滤是一种常用的反垃圾邮件技术,它以邮件在内容方面的特点来鉴别邮件,在技术上利用文本分类的方法来实现.文章设计了基于内容的,采用贝叶斯方法进行文本分类的垃圾邮件处理系统.  相似文献   

11.
不同含水量对煤吸附甲烷的影响   总被引:2,自引:0,他引:2  
运用Langmuir单分子层吸附理论,分析了煤对甲烷吸附能力受其含水量的影响利用WY - 98B型瓦斯常数测定仪,分别对2种煤样在不同含水量时吸附甲烷气体的等温吸附曲线、Langmuir压力、吸附常数a,b进行了定性与定量分析,得出了煤对甲烷吸附量随压力的变化关系式及Langmuir吸附常数a,b随煤样内水含量变化的关系式研究结果表明:含水煤样依然满足Langmuir单分子层吸附理论,吸附常数a,b与煤样中含水量的变化之间存在着一定相关性  相似文献   

12.
本文主要讨论空间环面上的测地线问题,提出了环面的定义以及定理,并运用这些定义以及定理研究环面上的测地线,并且进一步讨论空间环面上的测地线的数值解法。  相似文献   

13.
老年性痴呆病发病机理的研究近况   总被引:1,自引:0,他引:1  
为适应当今老龄化社会对老年性痴呆病的防治需要,从载脂蛋白E(ApoE)、tau蛋白、β-淀粉样肽及其前体蛋白、遗传因素、代谢因素几个方面对老年性痴呆(Alzheimer’s Disease,AD)的病因、病机作了描述.使人们在微观和宏观领域对AD有更清晰完全的认识。  相似文献   

14.
杏鲍菇为大宗食用菌,为提高杏鲍菇利用率,开发杏鲍菇休闲食品,研究前处理工艺对真空油炸杏鲍菇品质的影响。采用控制变量法,主要考察了切片方式、切片厚度和漂烫处理对杏鲍菇脆片品质的影响。结果表明,切片方式影响显著,脆片的脆度和含油量都与切片厚度呈现正相关关系,其中2mm为较佳厚度,与L值呈现负相关关系;漂烫可灭杏鲍菇脆片中多酚氧化酶和过氧化物酶的活性,从而抑制褐变,较佳漂烫处理方式为95℃、90s。  相似文献   

15.
通过不同的处理方法改善增强纤维与基体树脂间的界面性能,探讨了预处理对复合材料性能的影响.结果表明:经过A-151处理和碱处理后,复合材料的拉伸性能分别提高到92.6Mpa和78.0Mpa,在45℃、5%Na0H 溶液中加热0.5h后,复合材料的冲击性能最大.  相似文献   

16.
列车上应用生态厕所的初步研究   总被引:3,自引:0,他引:3  
提出了在列车上应用生态厕所的学术思想并进行了初步设计,分析表明该设计方案切实可行,既可以解决线性环境污染,又能将粪便污物转化为大量的优质有机肥.  相似文献   

17.
数据库的内容在环球网(WorldWideWeb,简称WWW)上出版,是目前网络信息建设中十分有意义和迫切的任务.笔者分析了在WWW上出版数据库的几种方法,重声、讨论了使用CGI程序实现WWW上出版数据库的方法.  相似文献   

18.
在介绍传统的直接数字频率合成(DDS)技术和坐标旋转数字计算机(CORDIC)算法原理的基础上,就如何选择CORDIC算法的参数进行分析,并给出了推导过程。设计了一种基于高速并行流水线结构CORDIC算法的正弦信号发生器,在QuartusⅡ和Modelsim平台上综合和仿真表明,时钟频率可达205 MHz,误差在10-5数量级。给出了FPGA设计的具体过程,软件仿真结果和硬件应用结果。  相似文献   

19.
为了研究温度对软岩渗透系数的影响以满足工程设计的需要,通过对软岩恒定应力下水温和岩体温度、温度梯度对岩体渗透性能的影响试验,研究了温度单一因素对软岩渗透性能的影响规律,同时通过软岩的单一因素影响模型推导出了多因素影响模型并进行了试验验证;通过软岩的恒定温度下应力对软岩的渗透系数的影响,分析了温度应力对软岩渗透性能的影响.  相似文献   

20.
土壤对镉(Cd)生物有效性影响的研究   总被引:1,自引:0,他引:1  
赵宁  寇渊博 《河南科学》2009,27(9):1089-1092
论述了土壤对Cd生物有效性的影响,具体说明了土壤pH、不同土壤种类、污水灌溉、土壤养分状况4个方面指标对Cd生物有效性的影响,并展望了研究方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号