首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
根据维吾尔语黏着型的特点,以及形态化单词和频率进行统计分析之后的结果,为解决因单词形态而导致的数据稀疏问题和兼类词标注的问题,提出了维吾尔文的融合词干、词缀等形态特征的基于最大熵的词性标注模型。在通用的词性标注模型的基础上,构造了相应的词性标注特征模版,并设计了它的特征函数。实验结果分析表明,最大熵模型可以较好地处理维吾尔文词性标注的问题,其中词缀特征对提高兼类词和未登录词的词性标注有着十分显著的效果,与其他只用词形的词性标注系统相比准确率比以前提高了2.64%,达到了96.85%。  相似文献   

2.
基于最大熵模型,结合汉语自身的特点,设计了一个基于词和字特征的汉语词性自动标注系统,取得了较好的标注效果。  相似文献   

3.
受众多心理和教育测量研究者喜爱的认知诊断模型-DINA模型假定属性之间是相互独立、连接、非补偿的关系,但是在实际的应用过程中,属性之间未必能满足这样的关系,这限制了DINA在实际中的应用。本文研究属性之间存在不同的关系(层级关系或补偿关系)对于DINA模型参数估计的影响,研究结果表明,当属性之间存在层级关系或补偿作用时,都会对DINA模型下的参数估计精度造成较大的影响,当属性之间存在层级关系时,参数的估计精度受到两个因素的影响最大,一是属性层级结构,另一个是被试人数;当属性之间存在补偿关系时,参数的估计精度主要是受到被试人数和属性个数的影响。在属性之间存在这两种关系的情况下,采用DINA模型进行认知诊断都会影响诊断测验的效度。  相似文献   

4.
不确定性多属性决策中确定属性熵权的一种方法   总被引:9,自引:0,他引:9  
针对属性值以区间数形式给出的不确定性多属性决策中确定属性权重的问题,提出了一种区间数熵权的确定方法·依据多属性决策中传统熵权确定方法的思路,首先,通过构建两个最优化模型,求得区间熵;然后根据传统熵权确定公式及区间数运算法则得到以区间数形式表示的属性熵权·该方法具有概念清晰、实用的特点,得出的属性熵权能够较好地反映各属性信息的差异程度·最后通过一个算例说明了该方法的实用性和有效性·  相似文献   

5.
为了进一步提高中文语料库中语料的词性标注效率,在分析最大熵模型(MEM)和隐马尔科夫模型(HMM)所涉及理论、算法及其在中文词性标注技术中的应用的基础上,进行了基于MEM和HMM的中文词性标注实验.实验结果显示,基于MEM和HMM的中文词性标注算法都获得了一致性很好且覆盖率较高的标注效果,中文词性标注的准确率、召回率和F1这3个指标均达到92%以上;MEM的标注效果总体上比HMM的稍佳.  相似文献   

6.
为了进一步提高中文语料库中语料的词性标注效率,在分析最大熵模型(MEM)和隐马尔科夫模型(HMM)所涉及理论、算法及其在中文词性标注技术中的应用的基础上,进行了基于MEM和HMM的中文词性标注实验.实验结果显示,基于MEM和HMM的中文词性标注算法都获得了一致性很好且覆盖率较高的标注效果,中文词性标注的准确率、召回率和F1这3个指标均达到92%以上;MEM的标注效果总体上比HMM的稍佳.  相似文献   

7.
研究了基于联合熵和粗糙集理论的关联规则挖掘算法,改进了基于粗糙集的属性离散化方法—连续属性联合熵差离散化算法;以联合信息熵作为属性约简的标准,提出了基于联合熵的知识约简算法;并给出了以支持度、兴趣度和准确度为阈值的有效关联规则算法.  相似文献   

8.
粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具。在数据挖掘技术中KNN算法是一个实现简单和分类准确性较高的方法,但是,当用于样本容量较大以及特征属性较多的类似医疗图像挖掘这样的领域时,其效率受到了很大的影响,找到一个删除最大冗余属性的方法成了解决这个问题的关键。将粗糙集理论与KNN算法结合起来,用粗糙集方法进行属性约简,有效地解决了KNN算法分类的这个缺点。  相似文献   

9.
属性识别理论模型在土壤重金属污染评价中的应用   总被引:1,自引:0,他引:1  
利用熵权法建立了基于熵权的属性识别模型.采用土壤环境质量标准GB15618-1995,用此模型对南京市六合区的水稻田土壤重金属污染进行评价.实例应用表明属性识别理论应用于土染重金属污染综合评价是可行的,评价结果比较合理.  相似文献   

10.
认知诊断(CD)是认知心理学与心理和教育测量学相结合的前沿研究领域.在属性间约束关系的Q矩阵理论中,其认知模型仅考虑了属性集与属性间的层级关系,忽略了属性间可能存在非层级关系的蕴含关系.该文探讨基于属性蕴含的Q矩阵生成,以及属性蕴含关系的挖掘.研究成果扩充了现有Q矩阵理论,完善认知诊断的理论、方法和应用.  相似文献   

11.
根据微博文本中句子的依存关系和情感词在依存关系中的位置来提取特征,将特征应用于最大熵模型来预测句子的情感倾向(褒义、贬义或中性)。并在此基础上,将词、词性和词在句法结构中的成分作为特征,训练条件随机场统计模型以此预测评价对象。实验结果表明,将句法依存关系作为特征应用到中文微博观点句识别中能够取得不错的效果,明显提高了中文微博观点句的识别率。  相似文献   

12.
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。  相似文献   

13.
全文检索是一种有效的信息检索技术,改进最大熵模型的应用研究在自然语言处理领域中受到关注。笔者利用语料库中词性标注和词频标注的上下文信息,建立基于互信息的最大熵方法的检索系统,研究的重点在于提出一种中文分词算法,并从实际问题出发,采用面向对象和模型驱动的设计方法,将该算法应用于实际的全文检索系统的设计中。  相似文献   

14.
基于最大熵模型的交集型切分歧义消解   总被引:6,自引:0,他引:6  
利用最大熵模型研究中文自动分词中交集型切分歧义的消解.模型输出的类别为两种:前两个字结合成词和后两个字结合成词.模型采用的特征为:待切分歧义字段的上下文各一个词、待切分歧义字段和歧义字段两种切分可能的词概率大小关系.通过正向最大匹配(FMM)和逆向最大匹配(BMM)相结合的分词方法,发现训练文本中的交集型歧义字段并进行标注,用于最大熵模型的训练.实验用1998年1月<人民日报>中出现的交集型歧义字段进行训练和测试,封闭测试正确率98.64%,开放测试正确率95.01%,后者比常用的词概率法提高了3.76%.  相似文献   

15.
虚拟阵列DOA(Direction Of Arrival)估计算法由于计算量低和资源利用率高得到了快速发展,然而虚拟阵列语音信号DOA估计算法还少有报道.本文为了提高语音信号DOA估计的准确度,对虚拟阵列语音信号DOA估计算法进行了改进.算法首先对接收信号进行能量及熵结合的语音分帧检测;其次基于功率谱方差最小和谱熵最大两个原则分别对检测后的信号进行选帧,并对选出的帧做DOA估计;最后将两者的DOA估计结果进行加权平均.本文对方差选帧的DOA估计结果、谱熵选帧的DOA估计结果和两者加权平均后的DOA估计结果进行了比较.实验结果和分析表明结合方差选帧及谱熵选帧的DOA估计算法在用于虚拟阵列语音信号DOA估计时有更高的准确率.  相似文献   

16.
互联网大数据的飞速发展对知识库的自动构建提出了迫切需求,互联网定义挖掘是知识发现研究的基础.文章基于N-gram语言模型提出了一种改进的N-gram Plus语言模型,综合了词语、词性、语法依赖关系和定义的语言学模式等多种特征.通过定义挖掘框架生成互联网语料库,在定义抽取研究中引入N-gram Plus特征集和句子最大定义隶属度,将句子转换为多特征向量,比较使用几种分类器进行学习和分类.该方法在实验中取得了较好的F2-measure成绩.  相似文献   

17.
数学形态学广泛应用于图像处理和模式识别领域.针对形态学单结构元在边缘检测中边缘信息丢失的问题,提出了基于形态学多结构元多尺度熵权边缘检测方法.首先利用形态学高低帽运算对原始图像进行增强处理,由形态学运算调整结构元素尺度,采用抗噪型算子进行边缘检测,依据边缘图像的信息熵确定权值进行融合,改进了数学形态学边缘检测算法.实验结果表明,与传统边缘检测算法相比,该算法在保持图像边缘清晰的同时,有很强的去除噪声能力.  相似文献   

18.
基于高斯混合密度函数估计的语音分离   总被引:3,自引:0,他引:3  
基于最大熵法(Maximum Entropy,ME)、最小互信息量法(Minimum Mutual Information,MMI)和最大似然法(MaximumLIkelihood,ML)最解决盲信号分离问题的常用算法,分析了ME、MMI以及ML算法之间关系。基于高斯混合模式(Gaussian Mixture Model,GMM)概率密度函数估计,提出了一种采用反馈结构的扩展最大熵语音分离算法,与  相似文献   

19.
最大熵分布在波高长期统计中的应用   总被引:1,自引:0,他引:1  
基于最大熵原理,推导出最大熵分布概率密度函数,同时介绍了目前在有效波高长期统计分布中运用较多的参数化模式,并将这2种方法应用于有效波高的长期统计分布中.为了检验2种方法的准确性,选用我国东海海域浮筒长期实测风、波浪数据,进行有效波高的概率密度函数拟合,将计算结果与实测数据绘成直方图并进行了比较.结果表明,最大熵分布概率密度函数中的参量γ值能够表征实际海况的复杂程度,且其在不同风速下与实测数据均吻合良好;而由参数化模式推导出的有效波高概率密度函数,在风速较小时与实测数据的吻合程度比风速较大时好,在风速较大时会出现偏离.  相似文献   

20.
词性标注是词法分析的基础.HMM是一个数学模型,具有算法成熟、效率高、易于训练的优点;负反馈是一个控制模型,在规则中引入负反馈,可以增强规则的客观性.本文探讨了两个模型,然后将它们应用于词性标注中.实验结果表明两者的结合是有效的和成功的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号