首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
基于贝叶斯粗糙集的文本特征选择方法   总被引:3,自引:1,他引:2  
特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频,然后简单分析了经典粗糙集和变精度粗糙集的不足,紧接着把贝叶斯粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频结合起来,提出了一个综合的特征选择方法.该综合方法首先利用基于最小词频的文档频提取初始特征,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法是有效的.  相似文献   

2.
针对特征选择这一文本分类的核心问题,首先提出一个基于最小词频的文档频方法,然后引进粗糙集和Tabu搜索,分析了把Tabu搜索用于属性约简所存在的问题并给出了解决办法,并以此为基础详细设计了一个基于优化的Tabu搜索的属性约简方法,最后把上述两种方法结合起来提出了一个综合性特征选择方法.该方法利用基于最小词频的文档频方法提取初始特征,利用所给属性约简方法进行优选以消除冗余,从而获得较具代表性的特征子集.实验结果表明该综合方法优于IG,CHI和MI方法.  相似文献   

3.
特征选择是文本分类中一个重要的课题.首先给出了一个新型文档频,然后把属性依赖度引入ID3并提出了一个基于优化ID3的属性约简算法,紧接着以此为基础,提出了一个新的特征选择方法.该特征选择方法使用改进的文档频初选特征并用所提属性约简算法消除冗余.仿真结果证明该特征选择方法是有效的.  相似文献   

4.
在中文文本分类中,由于中文词条总数较高,限制了中文文本分类算法的选择空间.特征选择是文本分类的一个核心研究课题.提出了一个优化的文档频(optimal document frequency,ODF),再结合粗糙集提出了一个新的基于辨识集的属性约简算法,最后把该属性约简算法同优化的ODF结合起来,提出了一个综合的特征选择方法.该综合选择方法首先使用优化的ODF进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后再利用所提出的属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明该方法有较好的准确率和召回率.  相似文献   

5.
在中文文本分类中,由于中文词条总数较高,限制了中文文本分类算法的选择空间。特征选择是文本分类的一个核心研究课题。提出了一个优化的文档频(optimal document frequency,ODF),再结合粗糙集提出了一个新的基于辨识集的属性约简算法,最后把该属性约简算法同优化的ODF结合起来,提出了一个综合的特征选择方法。该综合选择方法首先使用优化的ODF进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后再利用所提出的属性约简算法消除冗余,从而获得较具代表性的特征子集。实验结果表明该方法有较好的准确率和召回率。  相似文献   

6.
基于优化文档频和信息量的特征选择方法   总被引:1,自引:0,他引:1  
针对文本分类中几种典型的特征选择方法存在的不足,提出基于优化文档频和信息量的特征选择方法.该方法首先使用优化的文档频方法进行特征选择以降低文本向量的稀疏性,然后利用所提属性的约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明:该方法同3种经典特征选择方法相比,"互信息"和"统计量"以及"信息增益"都要好.  相似文献   

7.
符红霞  黄成兵 《科学技术与工程》2012,12(34):9234-9237,9242
特征选择是文本分类的关键步骤之一,所选特征子集的优劣直接影响文本分类的结果。首先分析了词频和文档频并在此基础上对文档频进行优化。然后又以此为基础提出了特征分辨率并先用它初选文本特征。紧接着又把粗糙集引入进来并给出了一个基于等价类相关矩阵的属性约简算法,以此来进一步消除冗余特征。仿真结果表明上述方法无论是在精确度和召回率方面,还是时间性能及平均分类精度方面,都具有一定的优势。  相似文献   

8.
基于类别相关性和交叉熵的特征选择方法   总被引:1,自引:0,他引:1  
文本分类首先要解决的一个问题就是特征选择.简单分析了几种经典的特征选择方法,总结了它们的不足,提出了一个类别相关性方法,把交叉熵引入粗糙集并提出了一个基于交叉熵的属性约简算法,把该属性约简算法同类别相关性方法结合起来,提出了一个综合的特征选择方法.该方法首先利用类别相关性方法进行特征初选以过滤掉一些词条来降低特征空间的稀疏性,然后利用属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,此特征选择方法效果良好.  相似文献   

9.
由于缺乏类信息,使得无监督文本特征选择问题一直未较好地加以解决。为此,对该问题进行了研究并提出了一个基于论域划分的无监督文本特征选择。该方法主要是把论域划分的思想引入到无监督文本特征选择之中,其首先使用一种新型无监督文档进行文本特征初选以过滤低频的噪声词,然后再使用所给的基于论域划分的属性约简进行文本特征优选。实验结果表明这个方法能够克服文本聚类时缺乏类的先验知识的不足,可以较好地解决无监督文本特征选择问题。  相似文献   

10.
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。  相似文献   

11.
为了对考试分析中频数分布统计算法的选择提供参考,分析了3类考试分析算法的特点与应用条件,即分组算法(传统、正态特征和斯特杰斯)、改进划分点算法(划分聚类)和频数统计算法(简单、模糊频数统计)的分析,并针对考试分析任务的需要提出对划分聚类、模糊频数统计法的改进算法;通过在实际考试样本和模拟样本上组合运用分组算法和频数统计算法,提出从分组质量、分组有效性、算法执行时间、算法适应性4个维度对算法的9种组合进行实验评估.结果表明斯特杰斯(Sturges)法分组效果较好,划分聚类法分组质量较高,模糊频数统计能在一定程度上改善频数统计的效果.  相似文献   

12.
小波变换与线性调频信号脉内调制特征分析   总被引:1,自引:1,他引:0  
张晓松 《科学技术与工程》2012,12(36):9840-9844,9855
提出了通过特征尺度的小波系数模极大值分析线性调频信号(linear frequency modulated signal,LFM)脉内调制特征的算法,分析了怎样选取特征尺度以及探究了怎样通过特征尺度的小波系数模极大值辨识出LFM的载频变化规律;并且研究了利用改进的小波脊线法提取了LFM的瞬时频率;最后对低信噪比下的LFM利用此改进算法进行了仿真。仿真结果表明,瞬时频率估计的精度得到了提高,尤其是信号起始段频率估计的相对误差低于0.05%,有效的克服了以往的小波脊线算法对低信噪比下的信号起始段频率估计的精度不高的缺陷。  相似文献   

13.
为了能准确地诊断复杂结构损伤是否产生以及产生的位置和程度,提出了一种小波包分解、多传感器特征融合和神经网络模式分类相结合的结构损伤诊断方法。首先,用正交小波包对多个传感器采集的振动信号进行小波包分解,并计算每个频带上的相对能量;然后把这些传感器信号的小波包相对能量融合,构成神经网络分类器的输入特征向量,从而实现损伤的诊断和评价。研究结果表明:正交小波包分解的频带能量分布能够较好地反映结构的损伤特征;特征融合能够使不同传感器的信息相互补充,减小了损伤检测信息的不确定性,使诊断信息具有更高的精度和可靠性,提高了诊断准确率。  相似文献   

14.
随着普通话水平考试的普及,普通话水平测试系统的自动化变得日益迫切。为了建立自动的普通话水平测试系统,如何快速准确的对普通话测试命题说话内容进行缺时检测是一个关键问题。将语音信号分成若干窗口,采用EMD分解算法将窗口信号分解为若干IMF。在每一窗口上利用Hilbert-Huang变换获取每个IMF分量的瞬时幅值和频率。利用瞬时幅值和频率构造每个IMF分量的能频值。将所有IMF分量的能频值组成该段的能频值特征向量,利用该能频值特征向量来区分信号中的静音段和语音段。最后通过计算相邻静音段的最大时长判断是否缺时,并采用一种规则消除因强噪声信号而引起的某一段能频值过大的影响。实验表明,笔者所设计的算法对普通话水平考试中的缺时检测有良好的效果。  相似文献   

15.
通过研究文本特征选取中权重的计算问题,提出了一种利用特征词的熵函数加权的权值的计算方法,不但考察了特征词的文档频数,而且考察了它们在文档中出现的次数,使选出的特征子集更具有较好的代表性.实验表明,改进后的算法对聚类结果有了一定的改进.  相似文献   

16.
为了利用跳频信号的空域信息辅助同步跳频信号的网台分选,提出了一种基于STFD酉ESPRIT的跳频信号DOA估计算法。首先用WVDSPWVD组合时频分析方法对接收数据进行时频变换,然后提取出跳频信号的有效跳(hop),并对其建立空时频矩阵(STFD),最后利用酉ESPRIT算法进行跳频信号DOA估计。该方法通过酉变换将ESPRIT算法的协方差矩阵从复数域转化到实数域,降低了计算量,而且酉ESPRIT算法利用了数据的共轭信息使数据长度等价增加了一倍,提高了估计精度。仿真结果表明文中算法在信噪比大于2dB时,DOA估计性能优于ESPRIT算法。  相似文献   

17.
为解决癫痫脑电信号分类类别以及分类精度不足的问题,使用频率切片小波变换对脑电数据进行信号重构,得到5 个频段的节律信号,再利用非线性指标近似熵和线性指标波动指数共同作为癫痫信号的特征值,充分提取信号的特征信息。随后使用梯度提升树算法对得到的特征数据集进行多分类。实验表明,该算法对癫痫脑电信号的三分类识别率为98. 4%。较传统Adaboost 算法,该方法采取了GBDT( Gradient Boosting Decision Tree) 作为分类算法,成功利用更多的数据集,并且使得分类精度更高。  相似文献   

18.
汪兰兰  蔡昌新 《科学技术与工程》2022,22(26):11524-11532
针对目前常见的语音特征提取方法应用于真实环境中,所提取的语音特征包含有噪声干扰的问题,进而导致情感识别时出现的分类模糊化情况,为此提出一种新的语音特征提取方法,即线性预测基音频率特征提取方法。它主要是基于线性预测系数来构建模型,利用构建的模型消除声道响应信息以及抑制噪声干扰。由于此方法对于分类模糊化问题没有得到较好改善,利用模型相同的LPCMCC(LPC Mel cepstral coefficients,LPC美尔倒频谱系数)来对线性预测基音频率进行改进,并设计基于线性预测基音频率、其改进特征、LPCMCC与SVM(support vector machines,支持向量机)的语音情感识别对比实验。对比实验表明,此改进特征提取方法应用在情感识别领域的平均精度最高为84%,比线性预测基音频率和LPCMCC要高出22%、14%。为了测试此改进特征在真实环境中的分类效果,在此改进特征的基础上设计了一种基于MATLAB GUI技术的语音情感识别系统。实验结果表明这种新的改进特征能有效改善情感识别时出现的分类模糊化情况,基于此改进特征的语音情感系统能广泛地识别出噪声干扰下的说话人情感。  相似文献   

19.
耦合钻井液钻柱声波传播特性研究   总被引:2,自引:2,他引:0  
钻井过程中非常规钻井液的应用,使得随钻数据无法通过传统的钻井液脉冲方式传输,迫切需要更高数据传输速率和受工作环境影响更小的井下随钻无线传输技术。基于钻柱信道的井下信息声波传输技术是较为理想的随钻数据无线传输方式,为给声波传输系统的设计提供理论依据,针对钻柱信道中的声波传播特性进行了研究。研究结果表明:钻柱信道具有通带和阻带相间的梳状滤波器特征,频带分布具有一定的周期性和对称性特征。钻柱结构决定了其信道通阻带的分布情况,随着钻杆根数的增加通带内小谱峰的个数增加,信道传输能力下降,结构尺寸不一致会使通带变窄,声波传输性能下降。  相似文献   

20.
为获得目标信号的更多特征,提高识别概率,引入了短时傅里叶变换的方法对毫米波探测信号进行时频分析;结合坦克目标毫米波信号频谱的特点给出了窗函数的选择方法;分析了坦克装甲车辆与其主要干扰的毫米波信号频谱图的差别,在此基础上给出了毫米波信号在时频域的特征选取方法. 分析结果表明:采用短时傅里叶变换的时频分析方法得到的坦克毫米波信号的频域特征与其主要干扰存在较大差异,据此可以进行坦克目标的识别.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号