首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
讨论和分析了自动分词的现状,并针对分词问题,提出了一种基于规则的中文文本分词自动校对方法。该方法通过对机器分词语料和人工校对语料的对比,自动获取中文文本的分词校对规则,并应用规则对机器分词结果进行自动校对,提高分词语料的质量。  相似文献   

2.
应用现有的分词连写规则书写汉语普通话盲文,会因人因时而得到不同的分词结果。为减少这种分词的不确定性,提出了应用“层次分析法”优化分词规则的方案。首先论述了普通话盲文的“结构分层”理论,继而给出了优化分词连写规则的总体原则、思路和优势,在详细介绍层次分析法基础理论后给出了应用层次分析法分词的原则,并列举有代表性的11个实例进行分析。改进的分词策略,不仅简化了分词规则、在很大程度上减少了盲文分词的不确定性,简单易用。  相似文献   

3.
汉语分词技术研究现状与应用展望   总被引:8,自引:0,他引:8  
汉语自动分词是计算机中文信息处理系统的基础和难题,本文对近年来的汉语自动分词的研究方法与成果进行了分析综述。探讨了分词中存在的一些关键问题,同时介绍了分词技术在科研以及商用系统中的应用。并展望了未来分词技术在应用方向的发展.  相似文献   

4.
基于词形的最佳路径分词算法   总被引:4,自引:0,他引:4  
在基于词形统计模型分词算法的基础上,通过以存词表结构的有效组织及改进词的匹配算法和切分算法,并以最佳路径法实现了一种快速的基于词形的分词算法,在保证了较高准确率的同时,大大提高了分词速度。  相似文献   

5.
基于最大概率分词算法的中文分词方法研究   总被引:1,自引:0,他引:1  
丁洁 《科技信息》2010,(21):I0075-I0075
本文提出了一种基于最大概率分词算法的中文分词方法,以实例贯穿全文系统描述了最大概率分词算法的基本思想与实现,根据针对大规模真实语料库的对比测试,分词运行效率有较大提高,该方法是行之有效的,并且提出了该算法的改进方向。  相似文献   

6.
应用“层次分析法”优化汉语盲文分词连写规则   总被引:1,自引:0,他引:1  
应用现有的分词连写规则书写汉语普通话盲文,会因人因时而得到不同的分词结果.为减少这种分词的不确定性,提出了应用“层次分析法”优化分词规则的方案.首先论述了普通话盲文的“结构分层”理论,继而给出了优化分词连写规则的总体原则、思路和优势,在详细介绍层次分析法基础理论后给出了应用层次分析法分词的原则,并列举有代表性的11个实例进行分析.改进的分词策略,不仅简化了分词规则、在很大程度上减少了盲文分词的不确定性,简单易用.  相似文献   

7.
要想在上百亿的网页中找到有意义结果,最重要的是把最相关的结果显示出来,而且要排在最前面,这也称为相关度排序.中文分词的准确与否,常常直接影响到对搜索结果的相关度排序.对PHP编写模拟分词函数进行了研究和分析.给出了PHP MYSQL环境下实现传统分词的实现过程.并在此基础上引入了字典的概念,因其在分词之前已提前调入内存,从而大大提高了分词的效率和准确性.在PHP MYSQL环境下为中文的分词过程实现提供了良好的平台基础,丰富的PHP函数为实现精确的分词提供了语言和语法的支持,MYSQL轻型数据库为字典提供快速的存取.  相似文献   

8.
基于统计的无词典分词方法   总被引:17,自引:0,他引:17       下载免费PDF全文
通过分析词的结合模式,提出无词典分词模型,并对该模型进行实验测试。测试结果表明,无词典分词模型能够满足快速分词的要求。  相似文献   

9.
中文语料库分词不一致的分类处理研究   总被引:5,自引:0,他引:5  
大规模语料库中分词结果不一致现象影响着语料库分词质量.在对150万汉字熟语料进行了统计分析的基础上,我们定义了语料库中分词结果不一致的主要结构类型;采用规则的方法检验校对字串的分词不一致,在对150万汉字语料库的封闭测试中,正确率为86.94%.  相似文献   

10.
中文分词技术   总被引:3,自引:0,他引:3  
在现代化的社会,为了更好的利用计算机来处理以自然语言为载体的信息,让计算机能读懂人类的语言,只有计算机读懂了人类的语言,人和计算机的交流才成为可能,对于中文来讲,词是语言的最小单位,所以,汉语的文本分词是解决该问题的第一步,本文重要介绍了中文分词的必要性,以及中文分词的方法和存在的问题。  相似文献   

11.
提出一种求解线性和非线性方程组的通用算法——蒙特卡罗算法.实际例子的计算结果表明,该算法比其他数值方法更为有效、简捷和通用,并能达到预期的精度.  相似文献   

12.
提出一种产生正态随机数的计算机新算法。这种新算法是在现有的乘同余法和混 合同余法等常用算法的基础上改进而来。统计检验表明:用原常用算法产生的随机数, 例如先用乘同余法或混合同余法产生均匀分布随机数,再用抽样变换法构成正态随机 数,其分布特性令人满意,但独立性质量不高;而用新算法产生的随机数,既能保持 原来分布特性较好的特点,又在独立性上有较大的改进。  相似文献   

13.
为数据集选择合适的聚类算法是获得高质量聚类结果的前提和保障.提出了基于有效性指标的聚类算法选择方法,通过对不同聚类算法的聚类结果的质量评价为数据集选择最适合的聚类算法.该方法的优点是在对数据集的情况了解甚少的情况下,也能有效地保障聚类质量.实验结果表明本文方法十分有效,为实验数据集正确选择出最适合的聚类算法,并获得了高质量的聚类结果.  相似文献   

14.
为提高锂离子荷电状态(state of charge,SOC)及健康状态(state of health,SOH)的精度,提出改进双自适应扩展卡尔曼滤波(dual adaptive extended Kalman filter,DAEKF)算法。基于二阶RC模型,建立空间状态方程;选取电池容量作为SOH的表征量,在双扩展卡尔曼滤波算法基础上引入改进的Sage-Husa自适应算法,实现系统协方差矩阵的实时更新;为降低系统计算量,进一步加入多时间尺度理论进行优化。实验结果表明,提出的算法能较准确地估计锂电池的SOC与SOH,SOC的平均误差为0.58%,SOH最大估计误差为0.8%,该算法正确有效。  相似文献   

15.
为提高空闲预测的准确性,提出基于灰色模型的空闲预测算法.该算法对预测样本的数量和分布特征没有苛刻要求,仅使用少量样本数据就能够进行预测.预测过程可以动态调整预测参数,实现自适应预测,提高预测的准确性.实验结果表明,使用该算法进行预测得到的预测值接近真实值,准确性高于指数平均预测算法.  相似文献   

16.
提出一种改进的粒子群算法(EDAPSO).这种改进算法结合分布估计算法的探索能力和粒子群算法的开发能力.首先利用EDAPSO算法解决无约束的问题,并且比较EDAPSO算法与其他三种经典的粒子群算法的结果.无约束问题的实验结果表明:EDAPSO算法可以找到更好的解,并且稳定性更高.然后EDAPSO算法被用来解决含有13个单元的电力系统的负荷经济分配问题.实验结果表明:EDAPSO算法所获得的解比近期文献所报道的解好.  相似文献   

17.
提出了一种在多路信号数字化解调时将对大频差的直接估计转换成对一个已知序列的周期估计的算法,该算法可以将实际解调中存在的用现有算法较难解决的大频差问题用一个较为简单的算法估计出来并进行校正。其特点是算法简单,计算量较小,特别适用于多路QPSK信号的数字化解调;仿真结果表明该算法是可行的。  相似文献   

18.
通过对实数向量型阴性选择算法的分析,提出了检测器空间覆盖率的概念,用它作为估计检测器数量的一项理论依据,将这个估计值引入到实数向量型阴性选择算法中,控制检测器的生成,同时对检测器采取了新的变异操作。实验表明,这一改进在保证算法检出率的同时,又可降低误报率。  相似文献   

19.
遗传算法是一种颇具生命力的算法,用遗传算法的思想来求解一函数取得最大值时的解,并给出了用遗传算法解此问题的详细过程。最后,对实验的结果进行了分析,并给出改进该算法性能的一些建议。  相似文献   

20.
在Hilbert空间中引进和研究了一类带η-单调算子的非线性似变分包含组(SNVLI),得到了SNVLI解的存在定理,给出了一个新的迭代算法,讨论了由迭代算法确定的序列关于SNVLI解的收敛性.本文的工作推广和改进了很多已知的结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号