首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 71 毫秒
1.
运用最大熵方法导出最可几分布和所有可能的系综分布;通过比较知,最大熵方法比最可几统计法和系统统计法更简单,更严格,用途也更广泛。  相似文献   

2.
提出一种基于最大熵模型的中文疾病命名短语识别方法,在模型特征选择上,将领域本体信息作为模型的一种特征.由此实现的疾病命名短语识别分类器具备有监督学习和利用领域知识的能力.实验结果表明,对于疾病命名短语识别的准确率达到89.7%, 召回率87.6%, F-评价值88.64%.  相似文献   

3.
提出一种基于最大熵模型的中文疾病命名短语识别方法,在模型特征选择上,将领域本体信息作为模型的一种特征.由此实现的疾病命名短语识别分类器具备有监督学习和利用领域知识的能力.实验结果表明,对于疾病命名短语识别的准确率达到89.7%,召回率87.6%,F-评价值88.64%.  相似文献   

4.
基于深层特征抽取的日文词义消歧系统   总被引:1,自引:0,他引:1  
词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%~3%,动词消歧精度获得5%的改善.  相似文献   

5.
MIS智能接口利用自然语言表达查询意图并给出查询结果,可方便人机交互,提高系统的实用性.从MIS智能接口的角度剖析了受限自然语言查询语句的组成,探讨了统计排歧方法在MIS智能接口中的应用.最后,给出了一个基于受限汉语的分词系统实例,实验表明它具有较高的消歧正确率.  相似文献   

6.
一种基于条件熵的特征选择算法   总被引:1,自引:0,他引:1  
特征选择是一种处理维数约简的有效方法。以条件熵为特征子集评价条件,采用随机搜索和启发式搜索相结合的搜索策略,设计了一种新的特征选择方法。该方法不仅能够求得经典启发式特征选择方法的选到特征子集,还可以得到一些与其不同的满足条件特征子集,同时在多数情况下可以减少时间消耗。实验研究表明了提出的算法的有效性。  相似文献   

7.
在最大熵剑桥算法中,提出了一种正方体约束条件代替通常的球体约束,讨论了两种条件在一定条件下的相互嵌套性,说明了正方体约束较之球体约束具有明显的优越性  相似文献   

8.
实体排歧一直是信息抽取任务中的难点问题.传统的方法常常借助语言知识库来进行排歧,如WordNet等.但是这类方法存在着一个问题,就是很难对人名以及最新的词汇进行排歧.因此,本文利用当前流行的维基百科知识库中的排歧页对同名实体进行排歧处理,提出基于维基百科的实体排歧方法.实验显示该方法能够有效的对人名进行排歧处理并且效果显著.  相似文献   

9.
针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分类精度,并将该改进IG特征选择算法用于最大熵模型(ME)对文本进行分类.实验结果表明:该文所提方法在进行文本分类时F1值高于传统IG算法.该文方法的ME分类精度高于K最近邻KNN(K-Nearest Neighbor)算法,说明本文方法是可行的、有效的.  相似文献   

10.
机器翻译中词义的常识排歧   总被引:3,自引:1,他引:2  
提出了一种机器翻译中多义词词义排歧的新方法.首先对翻译过程中多义词的词义选择是否符合常识给出了一条形式化的标准,然后将人们在翻译过程中排歧时所进行的逻辑推理归结为一种机械的集合运算,使之易于机器操作.在此基础上建立了义项多元组的概念,利用此多元组引入词义的语境相关限制信息,以改进现有电子词典,使之更加利于排歧.并从方向上指明了这种词典知识获取的途径.  相似文献   

11.
互信息过滤式特征选择算法往往仅局限于互信息这一度量标准.为规避采取单一的互信息标准的局限性,在互信息的基础上引入基于距离度量的算法RReliefF,从而得出更好的过滤式准则.将RReliefF用于分类任务,度量特征与标签的相关性;应用最大互信息系数(maximal information coefficient,MIC)度量特征与特征之间的冗余性、特征与标签的相关性;最后,应用熵权法为MIC和RReliefF进行客观赋权,提出了基于熵权法的过滤式特征选择算法(filtering feature selection algorithm based on entropy weight method, FFSBEWM).在13个数据集上进行对比实验,结果表明,FFSBEWM所选择的特征子集的平均分类准确率和最高分类准确率均优于其他对比算法.  相似文献   

12.
有限长观测数据的最大熵谱分析与算法   总被引:4,自引:0,他引:4  
利用长度有限的观测数据估计随机过程的功率谱,是随机信号理论的主要应用之一,常规的谱分析方法,往往无法兼顾分辨力和平滑性两方面的需要,而用最大熵谱分析方法则可得到分辨力很高的,平滑的谱估计,在观测数据较少时,这种方法更能显示出其较之于常规谱分析方法的优越性,本文简要介绍了最大熵谱分析方法的基本概念及算法,通过计算机模拟的结果和常规的谱分析方法进行了比较和分析,从中得出了一些较有实用价值的结论。  相似文献   

13.
针对虹膜图像自身的特点,先利用最大熵的方法把虹膜图像分成3个灰度等级,使虹膜最大限度的呈现出内外边界,然后在此基础上运用Daugman提出的虹膜定位算法能更有效地定位虹膜.实验表明,该算法具有更好的定位效果.  相似文献   

14.
首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征, 即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐的词后验概率, 分析其对错误检测性能的影响; 然后, 将其分别与语言学特征如词性、词及由LG句法分析器抽取的句法特征等进行组合, 利用最大熵分类器预测翻译错误, 并在汉英NIST数据集上进行实验验证和比较。实验结果表明, 不同的单词后验概率对分类错误率的影响是显著的, 并且在词后验概率基础上加入语言学特征的组合特征可以显著降低分类错误率, 提高译文错误预测性能。  相似文献   

15.
提出了一种改进的DaR、CDaR风险度量模型.该估计直接从样本信息出发,不需要对损失函数的概率密度函数作任何假定,从而克服了现有风险度量方法的不足,并通过实例进行分析,表明这一模型和方法是有效的.  相似文献   

16.
针对融合医学图像在过渡区微小细节及边缘信息不够清晰,边缘容易失真等问题,提出了一种基于模糊变换耦合最大熵值的多模态医学图像融合算法.首先,将待融合图像划分为大小相同的非重叠图像块,引入模糊变换对得到的图像块进行处理得到模糊子块,并利用邻域最大熵融合规则对模糊子块进行融合,获取新的融合子块;然后,将新的融合子块进行逆模糊变换,利用选择最大值融合规则,将逆变换得到的子块进一步融合生成最终融合医学图像.实验结果表明:与当前医学图像融合算法对比,本文算法在主观评价与客观评价指标边缘强度、信息熵、互信息、峰值信噪比上具有更大的优势,其融合图像边缘更加清晰,细节丰富,克服了边缘模糊与伪轮廓,更能够有效完成医学图像融合,实现了多模态医学图像信息互补.  相似文献   

17.
基于最大熵的灰度阈值选取方法   总被引:13,自引:2,他引:13  
图像分割是图像处理中的一个重要问题。在最大类间方差法和一致性准则法的基础上,运用最大熵原理来选择灰度阈值对图像进行分割。实验结果表明,本算法确定的阈值具有更佳的分割效果。  相似文献   

18.
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号