首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
一种基于改进互信息的文本分类方法   总被引:1,自引:0,他引:1  
用改进的互信息公式进行特征选择,通过三种文本分类方法验证了改进的公式具有较高的准确率、召回率和F1值,从而证明改进的互信息公式的有效性.  相似文献   

2.
互信息在复杂网络中的应用为解决链路预测问题提供了一个新的思路.传统的互信息方法(MI)不仅考虑了节点的邻居信息,还加入了共同邻居之间的结构信息,这种方法比传统的基于共同邻居的方法预测精度更高;但是该方法没有对共同邻居进行有效的区分,即没有考虑到共同邻居之间的差异性.为此进行了相应的改进,提出了改进的互信息方法(MMI),实验结果表明,MMI方法可以在一定程度上提高链路预测的精度.  相似文献   

3.
基于改进互信息的特征提取的文本分类系统   总被引:2,自引:0,他引:2  
文章提出并实现了一种改进互信息的特征提取和支持朴素贝叶斯的文本分类系统,改进的互信息算法加强了负值单词的互信息值,弥补了原来互信息预处理算法的不足,从而提高了分类精度.实验结果表明本算法和系统具有较高的分类准确率。  相似文献   

4.
陆鲸 《科技信息》2011,(26):380-380
本研究以CLEC语料库为基础,采用错误分析的主要观点,对大学生英语作文中的动名搭配错误进行分析,旨在揭示大学英语学习者动名搭配习得上的难点和问题,对错误进行归类,探究外语学习的过程,寻找错误的原因,为大学英语教学提供借鉴。  相似文献   

5.
一种基于粒子滤波的双模态语音提取方法   总被引:1,自引:0,他引:1  
说话入的唇动信息有助于加强对语音的感知.根据说话人语音的双模态特性,将振动信息引入语音提取问题,提出了一种基于粒子滤波的贝叶斯融合架构的双模态语音提取方法.该方法融合说话人的语音和唇动信息,根据信息论中的最大互信息准则与盲源分离中的高阶统计量准则.将音视频互信息与语音峭度的乘积作为代价函数,利用粒子滤波估计混合矩阵.解决时变瞬时混合情况下的语音提取问题.仿真结果表明.该方法在低信噪比情况下仍然能够实现语音信号的有效提取.  相似文献   

6.
最大熵方法中特征选择算法的改进与纠错排歧   总被引:2,自引:0,他引:2  
对应用最大熵原理建立语言模型的特征选取方法作了改进.用特征模板从训练样本中获得候选特征集,应用频次与平均互信息相结合的方法从候选特征集中选取特征.在选择有效特征时,对候选特征集中出现频次大于某一限值的特征或平均互信息很大的特征直接加入有效特征集,且不是每选一个特征都调用参数的求解过程,从而加快了特征选择的速度.将改进的算法应用于文本纠错建议的排歧,实验证明,所改进的特征选择算法有效.  相似文献   

7.
文本分类中的特征选取算法   总被引:3,自引:0,他引:3  
分析了常用的几种特征选取方法,提出了改进互信息算法。实验结果显示改进的互信息算法是可行的。  相似文献   

8.
提出了利用改进的广义互信息测量 2个随机变量之间非线性统计依赖性的方法 ,在此基础上获得了利用关联积分计算 2个具遍历性的观测时间序列之间统计依赖性的公式 ,并与利用互信息和广义互信息测量 2个观测时间序列之间统计依赖性的方法进行了比较 ,通过例子说明了这种改进方法的优点  相似文献   

9.
为了提高深度度量学习模型训练中的图像检索性能,在度量学习模型SoftTriple的基础上,对损失函数和网络结构进行改进.网络结构改进是在SoftTriple网络结构的基础上引入BNNeck模块;在损失函数设计中,首先添加难例挖掘函数对损失函数进行改进,然后通过使用高阶矩来表征整体特征分布的思路提出了新的损失函数.实验表明在度量学习数据集上的召回率和标准化互信息与改进前相比均有提高.与SoftTriple相比,添加难例挖掘函数实验最高将召回率提高了1.8%,标准化互信息值提高了2.2%;整体特征分布实验最高将召回率提高了0.9%,标准化互信息值提高了0.8%.  相似文献   

10.
以往的词汇搭配抽取统计评价方法具有大致相同的效果,它们各有优劣,可以实现优势互补.该文提出多策略融合的搭配抽取方法. 首先,将互信息法用于衡量二元独立性,淘汰候选的无关二元组. 其次,对比χ2检验法与t检验法,发现使用χ2检验法能够更合理地反映搭配组合的同现性和期待性;然后,使用对数似然比检验法,解决其他方法无法克服的稀疏数据问题. 此外,加入构词法的启发式规则,最终形成一个多策略融合的方法.实验结果表明该方法的准确率较高,在实际应用中取得良好效果.  相似文献   

11.
词汇搭配信息是英语词汇教学和英语学习的重要内容之一。英汉词典作为英语教学和学习的重要工具,应针对英语学习者或词典使用者在英语词汇搭配上的需求提供必要的词汇搭配信息。本文就非英语专业本科生对普通学习型词典中词汇搭配信息的需求做了调查和分析。目的在于了解英语学习者的需求,为英汉词典编纂人员提供有价值的信息,为英汉词汇教学提供新的思路和借鉴。  相似文献   

12.
Mutual information is an important information measure for feature subset. In this paper, a hashing mechanism is proposed to calculate the mutual information on the feature subset. Redundancy-synergy coefficient, a novel redundancy and synergy measure of features to express the class feature, is defined by mutual information. The information maximization rule was applied to derive the heuristic feature subset selection method based on mutual information and redundancy-synergy coefficient. Our experiment results showed the good performance of the new feature selection method.  相似文献   

13.
针对基于互信息量的阈值分割算法没有考虑像素的空间结构信息以及分割后图像与原图像之间关系的问题,提出了一种基于最大区域互信息量的图像分割算法.以区域互信息量作为目标函数,综合考虑图像各像素的邻域数据以及图像内在空间信息,利用粒子群算法找出图像分割的最佳阈值,克服了基于最大互信息量分割方法的不足.  相似文献   

14.
词汇教学既是英语教学中非常重要的环节,又是非常困难的环节,词汇学习的技巧应以学生为中心和以教师为中心两个角度,采取学生互相学习、新旧单词结合、词汇搭配、自我学习等方式来进行词汇教学。  相似文献   

15.
针对目前基于互信息图像配准方法中存在的不足,提出结合图像二维信息(如轮廓和边缘)与互信息的图像配准算法.它首先利用小波多尺度积提取两幅图像的特征点及其角度信息,再根据得到的特征点和角度信息,定义了特征点对互信息匹配准则,得到相应的匹配点对.最后进行了仿真实验,并将结果与由相关度、对齐度准则得到的结果进行比较,所提出的算法匹配误差最小.结果表明该算法具有匹配精确、鲁棒性好和效率高等优点.  相似文献   

16.
针对信息安全风险评估训练数据少、求解最优值困难等问题,提出了基于互信息和K-means聚类的信息安全风险评估方法.用模糊评价法量化风险指标,通过互信息计算风险因素与风险等级之间的依赖性,找出风险度在每个等级的最优点作为K-means初始中心点,用K-means算法对数据分类.该方法实现简单且克服了 K-means对初始...  相似文献   

17.
提出一种第一特征选择的信息论方法.该方法考虑了第一特征和其他特征组合共同包含的类别信息.即使在非线性分类问题中也表现出良好的第一特征选择性能.  相似文献   

18.
基于互信息的宋史语料库词表的提取   总被引:2,自引:0,他引:2  
基于统计语言模型,对《续资治通鉴长编》进行了统计分析.根据互信息特征抽取候选字串,通过人机交互确定其是否构成词,然后动态修正相关字串的互信息值,逐步建立宋史语料库词表.实验中据互信息阈值抽取候选字串6 500个,根据汉语大词典确定是词的有3 694个,占56.8%.结果表明互信息法是建立古汉语语料库词表的有效辅助手段.  相似文献   

19.
针对欧式期权定价的时间分数阶Black-Scholes模型,设计一种重心Lagrange插值配点法格式.首先,采用Laplace变换近似Caputo型分数阶导数,将分数阶方程转化为整数阶方程;然后,在时-空方向上均采用重心Lagrange插值配点法进行离散,构造重心Lagrange插值配点法格式.结果表明:时间分数阶Black-Scholes方程的重心Lagrange插值配点法具有高精度和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号