首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
将文本分类理论应用于哈萨克语中,给出了哈萨克语文本预处理过程.介绍一种改进的KNN算法,并结合自己构建的哈萨克语料集实现基于改进KNN算法的哈萨克语的文本分类.仿真实验数据表明,该方法在哈萨克语的文本分类上获得了较好的效果.  相似文献   

2.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、NaiveBayes、最大熵)进行评价,其中,NaiveBayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法。选用χ2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测。实验结果表明,最大熵和NaiveBayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些。  相似文献   

3.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法.选用χ2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测.实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些.  相似文献   

4.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法.选用χ2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测.实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些.  相似文献   

5.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法。选用X2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测。实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些。  相似文献   

6.
一种新颖的基于马氏距离的文本分类方法的研究   总被引:1,自引:0,他引:1  
KNN(k最近邻算法)是文本挖掘领域最成熟最简单的分类方法之一.该方法对文本分类中的距离参数的选取敏感,错误的选择将导致分类精度降低,影响最终分类效果,该缺陷限制了KNN分类器在文本数据挖掘中的应用.因此,本文将马氏距离引入到文本分类领域,并将其与KNN算法相结合,提出了一种基于马氏距离的新的文本分类方法(Mahala...  相似文献   

7.
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。  相似文献   

8.
在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。  相似文献   

9.
为了实现哈萨克语文本分类,根据哈萨克语语法规则,给出了哈萨克语文本词干的提取方法;结合DFR特征选择方法和VSM文本表示模型实现哈萨克语文本的预处理,提出了一种SVM和修正KNN协同的文本分类算法,分别在自行构建的语料集和整理的《新疆日报》哈萨克语数据集上进行大量文本分类仿真实验.结果表明,该方法在哈萨克语文本分类上具有良好的分类性能,并比SVM,KNN的测试性能优越.  相似文献   

10.
针对文本向量空间中特征项间的关联性及冗余性,提出了一种KNN算法运用于文本向量空间降维的方法,应用向量聚合理论和特征选择以降低特征空间维数,使得降维后的特征项更具有类别代表性.实验证明,KNN算法运用于文本降维方法中,有效地降低了向量空间的维数,提高了文本分类的精度.  相似文献   

11.
图集的统一协调,对图集质量有很大影响。本文是作者在编制北京市农业区划地图集的实践基础上,根据地图信息传输论的观点,对农业区划地图集的统一协调的内容及方法进行了探讨。试图总结编制这类图集的统一协调模式,以供读者编图时参考。  相似文献   

12.
许多科学家包括诺贝尔奖获得者李政道教授都预言,真空是未来物理学的一个重要研究对象.十七世纪的伽利略时代人们曾讨论过"真空"是否存在的问题.当时的学术界分成两派,一派以帕斯卡为代表,认为真空存在,另一派以笛卡尔为代表,认为真空不存在,最后实验证明"真空存在派"正确.现代研究表明,真空并非一无所有,这样就产生了一个新的问题"排除了真空物质后的空间",即"真空的真空"是否存在.本文探讨了与"真真空"有关的问题,提出了一些观测实验方法,这些方法可以帮助我们最终解答"真真空"的存在性问题.  相似文献   

13.
研究了国家法的抽象正义观与民间法的情理正义观,认为西方国家法的抽象正义观与东方民间法的情理正义观存在实质的不同,原因在于思维方式、超验与经验传统、政治结构的差别。在现代法治理念下,传统民间法所代表的正义观将向混合正义观转型,西方法治所代表的国家法抽象正义观是其骨架。  相似文献   

14.
在人与自然界的关系的演进过程中,形成了与不同文明时期相适应的人-自观念。从"天人合一"到"人定胜天"再到"和谐共生",这是人-自观念演进的肯定、否定、否定之否定的辩证发展过程,也是一个合乎规律的过程,它们都是时代的产物,都包含着不同程度的合理的因素,我们必须对它们进行具体的辩证的分析。  相似文献   

15.
对于行政许可违法的法律责任问题,人们往往是从行政许可实施违法的角度进行研究,而对于设定违法及其责任追究的探讨却相对薄弱。然而。行政许可设定一旦违法,其对相对人和社会公共利益的损害将会更大,因此,对许可设定的违法及其责任问题进行研究,以避免违法行政行为的发生,促进政府依法行政,不仅必要而且是非常有意义的。  相似文献   

16.
曲面“侧”是一个重要而难以理解的概念,本文对曲面“侧”概念的讲授方法进行了探讨,给出了曲面“侧”概念的“参照物”理解法,通过实践证明,效果良好。  相似文献   

17.
老年人生活空间移动性影响要素研究进展   总被引:1,自引:0,他引:1  
 老年人生活空间移动性是老年人在日常生活中能动生活状态的重要表征。在梳理老年人生活空间移动性相关概念、测度方法基础上,分析了物质环境要素和非物质环境要素对老年人生活空间移动性的影响;提炼出有效支持老年人生活空间移动性的中观环境规划、微观环境设计和政策文化扶助层面的策略;指出了老年人生活空间移动性的研究建议和发展方向。  相似文献   

18.
给出了一维非自治时滞系统点态退化的一个例子,拓宽了该领域的研究。  相似文献   

19.
现行力学教材和普通物理教材大都把动量守恒定律和动量矩守恒定律视为质点组动量定理和动量矩定理的推论,忽视了守恒星的本质意义,是不正确的.本文绘出正确表述.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号