首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
提出了一种基于统计与规则相结合的藏文人名自动识别方法.该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述.根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题.实验结果表明,该方法具有较高的准确率和召回率.  相似文献   

2.
提出一种基于词间关联度度量的维吾尔文本自动切分方法。该方法从大规模生语料库中自动获取维吾尔文单词Bi-gram及上下文语境信息, 在充分考虑维吾尔文单词间结合规则的前提下, 将相邻单词间的互信息、t-测试差及双词邻接对熵的线性融合作为组合统计量(dmd), 度量文本中相邻单词之间的关联程度。以dmd度量的弱关联的词间位置作为切分点进行自动切分, 得到语义及结构完整的词串, 而不仅仅是以空格隔开的单词。在大规模文本语料上进行的测试表明, 该方法的切分准确率达到88.21%。  相似文献   

3.
现有的文本自动摘要技术大多是运用向量空间模型将文本作为一个整体进行处理,忽略了段落及段落之间的关联程度,导致提取的摘要不能够全面反映所包含的主题,针对这一问题,文章提出了基于互信息的文本自动摘要方法。该方法利用互信息对文本中词语、句子及段落之间的关联程度进行计算,依据关联程度将整个文本划分成包含不同主题的较小单元,并针对每一单元运用优化的句子权重计算方法进行主题句提取,然后利用主题句生成文本摘要。实验验证了方法的有效性,在自动摘要提取方面取得了良好效果。  相似文献   

4.
基于条件互信息下聚类的朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
 采用条件互信息来度量任意2个条件属性之间的关联程度,采用互信息度量各条件属性与类属性间的关联程度,以此作为将各条件属性进行聚类的准则,提出一种新的将条件属性进行聚类的分组技术.同时,结合朴素贝叶斯分类算法,构造了改进的朴素贝叶斯分类模型.通过仿真实验表明该文提出的算法具有较好的分类性能.  相似文献   

5.
提出了利用改进的广义互信息测量 2个随机变量之间非线性统计依赖性的方法 ,在此基础上获得了利用关联积分计算 2个具遍历性的观测时间序列之间统计依赖性的公式 ,并与利用互信息和广义互信息测量 2个观测时间序列之间统计依赖性的方法进行了比较 ,通过例子说明了这种改进方法的优点  相似文献   

6.
为度量信息被信道噪声干扰后的可恢复程度, 提出基于互信息的信息保真度概念, 并揭示保真度与互信息以及信息恢复方法误差概率之间的内在联系。 理论分析表明, 信道最大信息保真度能反映最优传输消息分布, 在此基础上把最优传输消息分布的求取转化为信息保真度极值问题, 并研究基于最大化信息保真度的最优信息传输。 以二元无记忆信道为例, 对其进行理论和数值分析, 并验证了最大保真度与信道容量以及最优传输消息分布之间的关系。 结果表明, 对较为复杂的信道模型, 基于信息保真度的最优化计算比信道容量的计算更为简洁。  相似文献   

7.
互信息作为图像配准的相似性测度函数,同等程度地包含了待配准图像重叠区域中感兴趣信息和冗余信息。本文将图像中感兴趣区域的互信息引入到图像相似性测度函数中,给出一种互信息和感兴趣区域互信息相结合的新的图像配准相似性测度函数,再基于该测度函数实现对遥感图像的配准。实验结果表明本文算法在提高配准精度上的有效性。  相似文献   

8.
针对目前基于互信息图像配准方法中存在的不足,提出结合图像二维信息(如轮廓和边缘)与互信息的图像配准算法.它首先利用小波多尺度积提取两幅图像的特征点及其角度信息,再根据得到的特征点和角度信息,定义了特征点对互信息匹配准则,得到相应的匹配点对.最后进行了仿真实验,并将结果与由相关度、对齐度准则得到的结果进行比较,所提出的算法匹配误差最小.结果表明该算法具有匹配精确、鲁棒性好和效率高等优点.  相似文献   

9.
在临床上,使用多种成像技术并适当地将其加以融合,可为临床诊断和手术治疗提供更加全面准确的信息.而图像配准是融合技术中需要先期解决的问题,也是融合的关键部分.本文提出了一种基于DSP的医学图像配准问题的研究与实现的方案.该方案首先采用TI公司的高性能多媒体数字信号处理器DM642获取实时医学图像,再用配准算法验证其获取的实时医学图像配准的可行性.并采取了基于轮廓提取和最大互信息的方法进行图像配准,克服了互信息单一的利用图像灰度信息的局限性,将边缘检测与互信息相结合,较准确地完成图像配准任务.  相似文献   

10.
针对雷达波形多准则优化目标函数难以建立的问题,降低目标响应的不确定性,提高雷达检测性能,提出了一种基于深层神经网络的雷达波形设计方法。首先,根据雷达回波数据形式进行深层神经网络(DNNs)结构设计;然后,将基于信噪比(SNR)和互信息(MI)准则产生的信号随机混合并与其所对应的环境信息组成训练集,对DNNs训练;最后将另一部分基于互信息准则产生的信号与其对应的环境信息作为测试集,利用DNNs生成信号并进行测试。实验结果表明,使用该方法产生的信号作为雷达发射波形与仅基于MI准则产生的信号作为雷达发射波形相比,雷达回波与目标的互信息量最大提高了21.37nat,雷达接收信号的信干噪比最大提高了1.35dB。与线性调频信号相比,相应的互信息量最大提高了950.76nat,相应的信干噪比最大提高了18.23dB。  相似文献   

11.
基于互信息的宋史语料库词表的提取   总被引:2,自引:0,他引:2  
基于统计语言模型,对《续资治通鉴长编》进行了统计分析.根据互信息特征抽取候选字串,通过人机交互确定其是否构成词,然后动态修正相关字串的互信息值,逐步建立宋史语料库词表.实验中据互信息阈值抽取候选字串6 500个,根据汉语大词典确定是词的有3 694个,占56.8%.结果表明互信息法是建立古汉语语料库词表的有效辅助手段.  相似文献   

12.
根据动名搭配的结构特点,对基于互信息的搭配知识获取方法进行了改进,使之成功地应用于动名搭配识别.对200万熟语料的实验结果表明,改进的方法比互信息方法的F值有了较大提高.  相似文献   

13.
互信息过滤式特征选择算法往往仅局限于互信息这一度量标准.为规避采取单一的互信息标准的局限性,在互信息的基础上引入基于距离度量的算法RReliefF,从而得出更好的过滤式准则.将RReliefF用于分类任务,度量特征与标签的相关性;应用最大互信息系数(maximal information coefficient,MIC)度量特征与特征之间的冗余性、特征与标签的相关性;最后,应用熵权法为MIC和RReliefF进行客观赋权,提出了基于熵权法的过滤式特征选择算法(filtering feature selection algorithm based on entropy weight method, FFSBEWM).在13个数据集上进行对比实验,结果表明,FFSBEWM所选择的特征子集的平均分类准确率和最高分类准确率均优于其他对比算法.  相似文献   

14.
基于互信息的差异共表达致病基因挖掘方法   总被引:1,自引:0,他引:1  
为了挖掘基因表达数据中的差异共表达致病基因模块,提出了基于互信息和最大团相结合的方法.互信息用于度量基因表达谱之间的相互关系,计算任意2条基因表达谱在2种不同样本中的互信息值,得到2个互信息矩阵M1和M2,选定2个阈值T1和T2(T1T2)将矩阵M1和M2二值化,并通过M1和M2中元素的逻辑"与"运算得到图的邻接矩阵,从邻接矩阵挖掘出的最大团则为差异共表达致病基因模块.将该方法应用于Colon数据,选定T1=2.2,T2=1.0,得到6个相互重叠的最大团,实验结果表明,该方法能有效挖掘出差异共表达致病基因模块.  相似文献   

15.
基于支持向量机的中文文本中地名识别   总被引:2,自引:0,他引:2  
提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69% 和93.82%,F-值为90.12%.  相似文献   

16.
双向梯度归一化互信息医学图像配准方法   总被引:1,自引:0,他引:1  
传统互信息配准方法未利用图像的空间信息,为此,提出一种将互信息与梯度相似性相结合的双向医学图像配准方法.首先以图像A为参考,求图像A和待配准图像B的每组对应点的梯度相似性,并在计算相似性之前引入高斯算子以降低噪声影响,将梯度相似性因子与归一化互信息的乘积作为图像配准的正向测度;反过来,再以图像B为参考计算逆向的梯度归一化互信息.由此得到双向梯度归一化互信息.实验结果表明,该方法比传统归一化互信息和梯度归一化互信息方法有更高的鲁棒性和精度.  相似文献   

17.
针对信息安全风险评估训练数据少、求解最优值困难等问题,提出了基于互信息和K-means聚类的信息安全风险评估方法.用模糊评价法量化风险指标,通过互信息计算风险因素与风险等级之间的依赖性,找出风险度在每个等级的最优点作为K-means初始中心点,用K-means算法对数据分类.该方法实现简单且克服了 K-means对初始...  相似文献   

18.
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。  相似文献   

19.
ITS共用信息平台体系框架和运行机制研究   总被引:16,自引:1,他引:16  
介绍了ITS共用信息平台的地位和作用,解释了ITS共用信息平台的基础理论,首次给出了共用信息平台的明确定义,提出了适合我国民表的共用信息平台的体系框架,并以广州市ITS共用信息平台示范工程技术方案设计为例,明确了共用信息平台的功能,并对平台的运行机制进行了研究,提出了适合我国现阶段发展特性的运行机制,对推进共用信息平台的建设,乃至整个ITS建设进程有深远的指导意义和现实意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号