首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
针对传统信息增益(IG)特征选择算法忽略词频分布的缺陷,该文提出一种新的IG特征选择算法.该算法通过引入均衡比和类内词频位置参数,解决了传统IG算法忽略词频分布对分类的弱化问题,修正传统类内词频位置参数,提高特征选择算法的文本分类精度,并将该改进IG特征选择算法用于最大熵模型(ME)对文本进行分类.实验结果表明:该文所提方法在进行文本分类时F1值高于传统IG算法.该文方法的ME分类精度高于K最近邻KNN(K-Nearest Neighbor)算法,说明本文方法是可行的、有效的.  相似文献   

2.
结合优化文档频和变精度粗糙集的特征选择方法   总被引:1,自引:0,他引:1  
在文本分类中,特征空间的维数通常高达几万,甚至远远超出训练样本的个数,这是一种十分普遍的现象.为了提高文本挖掘算法的运行速度,降低占用的内存空间,过滤掉不相关或相关程度低的特征,必须使用特征选择算法.首先给出了一个基于最小词频的文档频方法,然后把变精度粗糙集引入进来并提出了一个基于信息熵的属性约简算法,最后把该属性约简算法同基于最小词频的文档频方法结合起来,提出了一个综合的特征选择算法.该综合算法首先利用基于最小词频的文档频方法进行特征选择,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法比最好的3种经典特征选择方法"互信息"和"统计量"以及文档频都要好.  相似文献   

3.
研究了属性权重信息完全未知、属性值以梯形模糊数形式给出的多属性决策问题,给出了梯形模糊数决策矩阵的规范化公式.把有序加权平均(OWA)算子推广到所给定的数据信息均为梯形模糊数形式的不确定环境中,提出了一种梯形模糊有序加权平均(TFOWA)算子,给出了其在应用过程中的具体步骤,并提出了一种相应的集结决策信息的方法.TFOWA算子的特点是充分利用梯形模糊数的不确定性,因而更能反映客观事物的复杂性及人类思维的模糊性,从而使得决策更符合实际情况.最后通过算例说明了方法的可行性和有效性.  相似文献   

4.
相似性文献检测技术在数字图书馆、知识产权保护等应用中有着较强的实际意义和应用价值.汉语中存在着许多歧义现象,导致汉语相似性文献检测的难度远大于英文文献.结合汉语的特点,提出了一种改进的基于词频统计的汉语相似性文献检测方法.首先,利用关键词和统计信息进行切词与消歧.其次,在语义分析的基础上抽取特征词并计算权重.最后,通过构造加权词频向量空间完成相似性检测.对本科生毕业论文的小规模实验表明:该方法能有效消除切分歧义,降低运算规模,提高检测精度与速度.  相似文献   

5.
传统的TF-IDF算法主要依赖词频,往往忽略词语语义和一些具有重要意义的副词。针对这一问题,提出了一种基于语义分析的改进TF-IDF算法。该方法融入了词语语义来计算词频,改进了反义词语之间的相似度。实验结果表明,该方法在计算句子相似度中能根据语义方向对句中各词语词频进行统计,同时判断整个句子语义方向,与传统算法比较,语句相似度的准确性提高了5. 7%。  相似文献   

6.
针对群决策中基于区间数决策矩阵形式偏好信息的专家群体判断一致性问题,提出了一种分析方法.首先,给出了有关区间数的定义及其决策矩阵规范化方法;然后,通过定义有关两个区间数的距离和一致性判定函数,给出了专家群体判断各个元素、各个方案、各个指标的一致性分析方法,同时,也给出了基于区间数决策矩阵的专家群体判断一致性的判别方法及专家群体判断不一致的调整方法.最后,通过一个算例说明了该方法的有效性.  相似文献   

7.
首先,给出非负矩阵分解的数学形式,分析欧式距离和相对熵(KL)散度两种分解误差评价函数.然后,针对3种特殊形式的非负矩阵进行分解方法的改进,优化函数和迭代过程分别适用于正交非负矩阵、凸非负矩阵、投影非负矩阵的分解.结果表明:提出的改进方法简化了非负矩阵分解的过程.  相似文献   

8.
针对特征选择这一文本分类的核心问题,首先提出一个基于最小词频的文档频方法,然后引进粗糙集和Tabu搜索,分析了把Tabu搜索用于属性约简所存在的问题并给出了解决办法,并以此为基础详细设计了一个基于优化的Tabu搜索的属性约简方法,最后把上述两种方法结合起来提出了一个综合性特征选择方法.该方法利用基于最小词频的文档频方法提取初始特征,利用所给属性约简方法进行优选以消除冗余,从而获得较具代表性的特征子集.实验结果表明该综合方法优于IG,CHI和MI方法.  相似文献   

9.
雷刚 《河南科学》2011,29(3):264-268
结合矩阵分裂理论及比较定理,给出一种改进矩阵分裂形式的预条件含参数SOR迭代方法,证明这种方法不仅能加速SOR迭代法的收敛性,而且优于一般的预条件方法,并找出参数的最优选取.最后通过数值例子加以说明.  相似文献   

10.
基于贝叶斯粗糙集的文本特征选择方法   总被引:3,自引:1,他引:2  
特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频,然后简单分析了经典粗糙集和变精度粗糙集的不足,紧接着把贝叶斯粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频结合起来,提出了一个综合的特征选择方法.该综合方法首先利用基于最小词频的文档频提取初始特征,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法是有效的.  相似文献   

11.
采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估.该算法不仅能够自适应获得k值,而且有效防止了初始点的随机选择对聚类结果的影响.评测结果表明该算法对经济类和科技类文章的准确率和召回率都明显高于新闻类和文学类文章,利用机器文摘进行分类的准确率明显高于使用原文本进行分类.该算法所得到的文摘,在各项指标上都优于传统方法生成的文摘.  相似文献   

12.
提出了一类新的复合核的二次时频分布,并和几种主要的二次时频分布作了比较研究,实验结果说明的分布具有高的时频分辨力和强的抑制交叉干扰能力。  相似文献   

13.
在冰淇淋基本配方的基础上加入菊花金银花提取液,分别制得菊花冰淇淋、金银花冰淇淋、复合菊花、金银花冰淇淋,具有清凉解暑的功能,是一种新型保健冰淇淋。其复合冰淇淋配方(%)为:全脂奶粉7,白砂糖13,麦淇淋10,糯米粉3,明胶0.3,CMCO.2,分子蒸馏单甘酯0.1,蔗糖酯0.05,菊花提取液15,金银花提取液5。  相似文献   

14.
本文以具有代表性的McCabe,Prather和Z-W三种方法为例,计算和分析了循环语句中for-do结构的程序复杂度,并纠正了关于Z-W表达式方法中不严格的计算公式.  相似文献   

15.
将有裂纹鸡蛋和无裂纹鸡蛋进行敲击激励后,采用柔性压电薄膜传感器获取时域信号和频域特征:无损蛋的频域特征曲线有明显的主频率值,峰值突出;有裂纹蛋频域特征曲线上没有明显的主频率值,峰值多而紊乱.在归一化功率谱中,分别按间隔频率、依次取最高幅值和幅值高低提取的频率等方法来提取前10个或取前20个特征值,采用间隔频率提取归一化幅值,用神经网络来判别裂纹蛋与完好蛋效果较差;用幅值高低提取归一化幅值作为特征值来神经网络判别的效果较佳;采用功率幅值高低提取频率作为特征值来判别的效果最佳.采用20个特征值后的判别效果分别不如采用10个特征值的判别效果.遗传优化神经网络的测试集判断正确率高于标准BP网络.  相似文献   

16.
对影响铷原子频标长期稳定度的光频移、碰撞频移和微波功率频移进行了分析。在此基础上提出了改进措施,保证铷原子频标不仅具有好的短期稳定度,而且具有良好的长期稳定度,使铷原子频标的性能大大改善。  相似文献   

17.
针对负载作用下质量特性测试平台弹性变形引起干扰力矩的问题,研究浮起平台负载作用下产生干扰力矩的规律。根据弹性力学薄板弯曲理论,推导出在负载作用下有限元单元质心位移公式及结构整体质心弹性位移公式,给出浮起平台的干扰力矩公式,计算质量特性测试平台在测量过程中质心的弹性位移和由此产生的干扰力矩。研究结果表明:平台变形引起的干扰力矩为偏航角ψ的函数,幅值为平台自身重力和质心位移的乘积。分析结果为测试平台的结构设计和测试精度的提高提供了依据。  相似文献   

18.
在研究非采样Contourlet变换和归一化理论的基础上,提出了一种新的数字图像水印算法。先将原始图像经过非下采样Contourlet变换处理,提取出图像的低频区域,然后依据人眼的视觉特性以及嵌入水印前、后系数的相关性,将水印信息嵌入对低频区域进行归一化重要区域中。无须借助于原始图像,就能进行水印提取,实现真正的盲检测。实验结果表明,本文算法对平移变换的抵抗力最强,对旋转和缩放也有很好的抵抗力,而且经过JPEG压缩之后,数字水印也不会失真。   相似文献   

19.
周峰  徐代升 《江西科学》2011,29(2):148-152,186
从光的衍射理论出发,论述了借助计算机和可视化程序设计语言仿真实现夫琅禾费衍射现象的衍射积分法和傅立叶变换法.运用上述2种方法仿真实现不同形式多缝(光栅)夫琅禾费衍射现象,其结果有助于理解多缝夫琅禾费衍射现象的特性和光栅的分光机理,为更好的设计和利用衍射光栅提供了有益参考.  相似文献   

20.
利用拉普拉斯变换和标度变换,求解了3维变形莫尔斯势条件下的薛定谔方程的近似解析解。通过将标度变换后的3维变形莫尔斯势作级数展开,忽略高阶微小量;合理选择相关参数,使得无解析解的情形转化为近似解析解存在。拉普拉斯变换中合理应用终值定理与卷积定理以及广义拉盖尔函数的正交性条件;获得了量子系统能谱的显式表示和归一化的本征波函数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号