首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对中文文本图像的特点, 提出了一种改进的压缩算法MC-JBIG2 。该算法首先对中文字符进行多级特征提取, 然后将提取到的特征数据用于一个级联聚类算法中以替代传统 JBIG2 中的模式匹配过程。实验表明, MC-JBIG2 改进了传统 JBIG2 算法对中文文本图像压缩的不足, 能够保证在内容无损的情况下提高对中文文本图像的压缩率, 同时该算法对英文本图像的压缩也有一定的改进。  相似文献   

2.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、NaiveBayes、最大熵)进行评价,其中,NaiveBayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法。选用χ2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测。实验结果表明,最大熵和NaiveBayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些。  相似文献   

3.
中文人称代词消解研究   总被引:1,自引:0,他引:1  
代词消解是文本信息处理中的一个重要任务,为了提高中文人称代词消解的准确性,文章在大规模语料的基础上,分析了中文网页突发事件语料中人称代词的特点,提出了最大熵模型算法和决策树算法两种算法,并对比了这两种算法的中文人称代词的消解效果.  相似文献   

4.
命名实体识别是对文本进行理解的前提工作,命名实体识别的质量会直接影响到后续的一系列工作,本文采用最大熵模型进行中文命名实体识别。实验结果表明,该算法具有较好的性能和实用性。  相似文献   

5.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法.选用χ2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测.实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些.  相似文献   

6.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法.选用χ2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测.实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些.  相似文献   

7.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法。选用X2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测。实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些。  相似文献   

8.
使用k近邻、支持向量机和最大熵模型进行中文文本分类的研究,对目前应用较多的k近邻、支持向量机和最大熵模型,分别进行了基于特征词布尔值和基于特征词词频的中文文本分类实验。实验结果显示,在相同的条件下最大熵方法的分类性能最好,支持向量机次之,k近邻稍差。同时发现,在分类过程中引入了词语频率信息时,分类器的性能略有变化,对于最大熵分类准确率下降1%~2%,对于k近邻有所上升,对于支持向量机则相当。除去文本的特殊性影响,这表明不同程度的词语的信息对不同的机器学习算法有不同的影响。  相似文献   

9.
为了获取压缩中文文本的高压缩比,变长编码集合扩展的中文文本压缩算法依据中文语言文字的特点,以不等长高概率汉字串为单位,定义固定字典集,同时寻求高压缩率的匹配方式进行编码,算的编码转换过程适应了自然语言中的部分马尔可夫过程,相对于不同文本长度及文体风格压缩比分布均衡,此算法能够获得较高的压缩比。  相似文献   

10.
基于FOA-SVM的中文文本分类方法研究   总被引:2,自引:0,他引:2  
中文文本分类方法直接影响分类性能,支持向量机(SVM)在处理文本分类这种高维问题上有明显的优势.SVM的分类精度取决于核函数的核参数和惩罚参数,本文提出了一种用果蝇优化算法(FOA)获取SVM参数的FOA-SVM方法.将FOA-SVM用于中文文本分类,实验结果表明,FOA-SVM能得到较高的分类准确率,在文本分类上表现较强的鲁棒性.  相似文献   

11.
熵理论研究的进展和意义   总被引:1,自引:0,他引:1  
  相似文献   

12.
本文通过对企业情报信息概念的确立,阐述了企业情报信息的流向和内容,以及在产生企业情报信息时的随机性和在市场经济中企业情报信息竞争性特有的形式和含义,提出了如何将在企业生产经营活动中产生的无序的情报信息有序化,和在获取企业情报信息激烈的竞争中及时掌握有用的企业情报信息。进而讨论了建立企业情报信息系统,全方位地搜集企业内,外部的情报信息,使企业情报信息为企业决策提供依据,在市场经济中发挥它的功效。  相似文献   

13.
本文研究弹塑性圆棒的颈缩,材料被认为是可压缩的。运用有限变形理论。获得了分岔荷载。  相似文献   

14.
本文从浆液输送时阻力与动力的匹配,泥浆灌注后在采空区中的分布以及浆材对泥浆分布的影响等方面对黄泥灌浆效率不高、防火效果不好进行了分析。得出要提高灌浆的效率必须有合理的动力与阻力匹配,要提高灌浆的效果,就必须在保证浆材质量的前提下,以合理的灌浆方式和合理的灌浆量来保证灌浆质量,从而达到灌浆应具有的效果。图3,表1,参1。  相似文献   

15.
本文通过对元素周期系中,各元素的结构分析,很方便地找到了对元素的不规则性的解释。  相似文献   

16.
本文阐述了在三座标机上测量蜗轮齿形误差的方法。本文首先根据齿轮啮合理论建立蜗轮理论齿形方程式,编出计算程序算出蜗轮理论齿形,然后分析计算了测头干涉误差,最后编出了测量程序并在三座标机上进行了实测。  相似文献   

17.
向心球轴承的内外圆与轴颈和轴承座孔配合后,在配合面上将产生接触压力,因而引起内外圈滚道产生径向位移,使轴承的游隙产生变化。本文提出了轴承在与轴颈和轴承座孔配合后游隙的计算方法,并分析了游隙的变化对向心球轴承承载能力的影响。  相似文献   

18.
根据体操技术动作的内在规律,编制相似技术动作教学程序,把要学习和掌握的动作技能置于教师的控制下,使教学过程的顺序性、经济性、实效性均达到最佳程度.  相似文献   

19.
讨论了对照非旋转原点天球参考和地球参考系的转换方法,并和经典方法进行了比较。两种转换方法在数值上基本是一致的,但新的转换方法显示出较好的优越性,它在概念上和实用上更简单,同时指出用甚长基线干涉观测确定地球定向参数的归算中,使用新的转换方法将更合适。  相似文献   

20.
本文介绍编译码器电路的应用,同时给出了一个在数据采集系统中的应用实例  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号