首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 484 毫秒
1.
提出了利用改进的广义互信息测量 2个随机变量之间非线性统计依赖性的方法 ,在此基础上获得了利用关联积分计算 2个具遍历性的观测时间序列之间统计依赖性的公式 ,并与利用互信息和广义互信息测量 2个观测时间序列之间统计依赖性的方法进行了比较 ,通过例子说明了这种改进方法的优点  相似文献   

2.
提出了一种由遗传算法和改进互信息公式相结合的特征选择方法.将遗传算法中的特征评价函数换为改进互信息公式来对特征进行选择,结合了过滤式和封装式这2种特征选择方法的优点.实验部分采用另外2种特征选择算法与本文所提方法分别进行特征选择,将这3种方法所得到的特征子集用于概率神经网络、BP神经网络分类器上,通过比较对应的分类精度,检验各种特征选择方法的效果. 实验结果显示,所提出的特征选择方法能更为有效的实现特征选择,所取得的特征子集具有更好的泛化特性.  相似文献   

3.
基于改进互信息的特征提取的文本分类系统   总被引:2,自引:0,他引:2  
文章提出并实现了一种改进互信息的特征提取和支持朴素贝叶斯的文本分类系统,改进的互信息算法加强了负值单词的互信息值,弥补了原来互信息预处理算法的不足,从而提高了分类精度.实验结果表明本算法和系统具有较高的分类准确率。  相似文献   

4.
文本分类中的特征选取算法   总被引:3,自引:0,他引:3  
分析了常用的几种特征选取方法,提出了改进互信息算法。实验结果显示改进的互信息算法是可行的。  相似文献   

5.
分析了传统的互信息特征选择算法的不足,针对可能赋予低频特征词过高权重的问题,利用词频、集中度这两个强信息特征指标对算法进行改进,提出了一种基于词频和文本类别的互信息改进算法(Improved Mutual Infonnation Algodthm based on Word Frequency and Text Category,简称改进的MIFC)。实验结果表明,改进的MIFC算法提取的特征空间比传统的互信息算法有更高的精确度。  相似文献   

6.
一种改进的互信息特征选取预处理算法   总被引:4,自引:1,他引:3  
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度。  相似文献   

7.
根据动名搭配的结构特点,对基于互信息的搭配知识获取方法进行了改进,使之成功地应用于动名搭配识别.对200万熟语料的实验结果表明,改进的方法比互信息方法的F值有了较大提高.  相似文献   

8.
针对舆情监测中现存的热点词提取方法精度不高、速度不快的问题,文章采用互信息作为热点词突发性的度量手段,并使用类间离散度作为调节因子来构建热点词的突发性度量公式.在此基础上,构造了改进后的动态突发性向量空间模型,并用于网络中突发性热点话题的发现与追踪.实例验证结果表明,文章提出的改进方法能够获得很好的准确度P、召回率R和F度量.  相似文献   

9.
针对舆情监测中现存的热点词提取方法精度不高、速度不快的问题,文章采用互信息作为热点词突发性的度量手段,并使用类间离散度作为调节因子来构建热点词的突发性度量公式.在此基础上,构造了改进后的动态突发性向量空间模型,并用于网络中突发性热点话题的发现与追踪.实例验证结果表明,文章提出的改进方法能够获得很好的准确度P、召回率R和F度量.  相似文献   

10.
提出一种改进的最大互信息(MMI)准则函数并把它应用于隐马尔可夫模型(HMM)的参数估计,重新推导了HMM的迭代公式. 该准则函数相对于原来准则函数定义更为合理,能有效利用训练样本集中的鉴别信息,使得训练数据得到充分利用,提高了HMM的性能. 把这种改进的HMM算法应用于面部表情识别,利用改进的光流算法提取面部表情特征向量序列,并利用改进HMM算法和BP神经网络构建了面部表情混合分类器. 实验结果表明了该方法能有效提高面部表情识别率,有效解决HMM参数估计问题.  相似文献   

11.
镜头边界检测是基于内容视频检索的基础环节。由于视频类型与内容众多,目前镜头边界检测中存在阈值选取困难、查全率和查准率不高等问题。针对以上问题提出一种改进的基于互信息量的镜头边界检测算法,在字幕检测定位算法有效定位字幕区域的基础上,通过比较非字幕、非四角区域HSV空间直方图求取的相邻帧间互信息量的差异程度,实现镜头边界检测。实验表明,与当前应用最广泛且比较有效的双阈值算法相比,突变镜头检测综合性能平均提高12.4%,渐变镜头检测综合性能平均提高8.2%,通过自适应阈值的选取,有效解决了阈值依赖人工经验选取的问题;与当前已提出的基于互信息量的镜头边界检测算法相比,该算法降低了计算复杂度、几乎能检测所有的淡入淡出镜头边界,并使得镜头边界检测具有较高的查全率与查准率。  相似文献   

12.
针对离散制造业质量管理系统中维度高,且存在较多一致性数据的情形,设计了一种基于信息论中的信息熵,即互信息的改进聚类算法。通过实验分析,采用改进的聚类算法可有效提高聚类的正确率,并且通过演化聚类理论和方法的应用可对离散制造业质量管理提供有效的决策参考信息。  相似文献   

13.
时变Stokes方程的求解在物理学、离散动力学系统和科学计算等领域具有广泛的应用,但是时变Stokes方程是一个随时间变化的偏微分方程组,在实际中求解非常困难.针对时变Stokes方程在预处理基础上构造了一个新的双预优迭代方法,然后给出了迭代格式、收敛域以及一些相关的结论.通过改进迭代法中参数的选取和对方程组本身进行预处理等方式,提高了迭代方法的收敛速度.最后用数值算例验证了双预优迭代方法的可行性和有效性.  相似文献   

14.
针对高维数据包含的不相关和冗余特征影响检测方法性能的问题,提出了集成filter和wrapper方法的混合特征选择新方法.采用基于信息增益的filter方法,删除不相关特征;采用基于改进的自适应遗传算法和评价函数的wrapper方法,获取最优特征子集.在入侵检测中的应用表明,该方法能降低特征选择的时间,检测率和虚警率均优于其它方法.  相似文献   

15.
最大熵方法中特征选择算法的改进与纠错排歧   总被引:2,自引:0,他引:2  
对应用最大熵原理建立语言模型的特征选取方法作了改进.用特征模板从训练样本中获得候选特征集,应用频次与平均互信息相结合的方法从候选特征集中选取特征.在选择有效特征时,对候选特征集中出现频次大于某一限值的特征或平均互信息很大的特征直接加入有效特征集,且不是每选一个特征都调用参数的求解过程,从而加快了特征选择的速度.将改进的算法应用于文本纠错建议的排歧,实验证明,所改进的特征选择算法有效.  相似文献   

16.
一种基于Java的PDF文件的生成方法   总被引:1,自引:0,他引:1  
PDF是Adobe公司开发的一种可以跨平台的文件格式.为在企业的信息系统中也能生成跨平台、高保真和较安全的PDF文件格式的数据报表,提出了一种用Java语言来实现PDF文件的生成方法.文中简要介绍了PDF文件的特点,详细阐述了在Java环境下生成PDF文件的主要步骤,并通过与几种PDF文件生成工具的实现效果的比较,证明了此PDF文件生成方法的有效性.  相似文献   

17.
在本研究中,实验人员就上述两种因素对于一例医疗诊断问题的影响进行了调查,997名不同专业背景的本科学生对于妇女是否患有乳腺癌进行了概率推断.研究所用的诊断题目采用了一种概率格式(probabilistic format)和三种频率格式(frequency format).调查结果显示,具有理科背景的学生综合表现优于文科背景的学生;相比于概率格式,两种频率格式(树状图和表格频率)改善了所有学生的表现,而标准频率格式只提高了理科学生的表现.此次研究为今后概率推断的教育工作提供了更广阔的思路.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号