首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
抽取了3种典型的单词后验概率特征(基于固定位置的词后验概率、基于目标位置窗的词后验概率、基于词对齐的词后验概率)和3种语言学特征(词、词性、句法分析器抽取的句法特征),并在此基础上抽取了一个来自源端的单词特征,然后基于中英NIST数据集,采用最大熵分类器来验证不同单词后验概率特征(WPP)独立使用及与其它特征组合后使用时对错误检测性能的影响。实验结果表明,采用不同方法计算得到的单词后验概率特征对分类错误率的影响是显著的,并且在单词后验概率和语言学特征组合基础上加入源端单词特征,可以显著降低分类错误率(CER),提高译文错误检测能力。  相似文献   

2.
支持向量机方法中加权后验概率建模方法   总被引:4,自引:0,他引:4  
为解决传统支持向量机方法不提供概率输出的问题,在支持向量机多类分类问题输出概率建模中,提出了加权后验概率建模方法。该方法在对多个两类支持向量机分类器的输出概率进行组合时,充分考虑了各个两类支持向量机分类器的差异。依据Bayesian理论,采用后验概率作为各个两类支持向量机分类器的权系数。实验结果表明,与投票法及Pairwise Coupling方法相比,加权后验概率方法具有较低的分类错误率,不仅具有较好的分类性能,而且得到的后验概率具有较好的概率分布形态。该方法有效地解决了实际多类分类问题中支持向量机的概率建模问题。  相似文献   

3.
维吾尔语是一种黏着语,单词不太适合作为维吾尔语大词汇连续语音识别系统识别单元。针对维吾尔语大词汇连续语音识别系统中的识别单元选择问题,设计更适合维吾尔语的子词识别单元,提出维吾尔语单词和子词相结合的组合识别单元构建方法,并对单词、子词和组合识别单元的语言模型和语音识别性能进行评价。实验结果表明,所提出的识别单元在单元数量、语言模型复杂度等方面表现出更加优越的性能,并且使识别系统的单词错误率比基于单词的系统相对减少22%。  相似文献   

4.
将满文单词识别系统的识别信息和满文的词组信息有机地结合起来,建立满文词组和待定词集统计信息库,利用贝叶斯准则,综合满文待定词的后验概率和词组的先验概率信息,建立合理有效便于实现的数据结构,对满文单词识别系统输出存在的拒识词和错识词进行检测和纠正,从而有效地提高满文识别系统的识别率·实验表明:后处理性能除取决于语言模型外,还取决于后概率的精确估计·另外,在单词识别系统识别率高的情况下,后处理的纠错能力会增强·  相似文献   

5.
为了提高分布式拒绝服务攻击(DDoS)流量过滤的性能,同时保证过滤的正确率,提出一种基于Poisson流随机分解模型的分类方法。该方法根据报文特征对流量进行分解后,基于2类流量的流速比随机判定报文的类别。设计了一个基于令牌桶阵列(TBA)的实现方案,不需要实时估计攻击流的参数,有效提高了过滤的性能。理论推导表明:Poisson流随机分解模型的理论错误率上限为最大后验概率判决法错误率上限的2倍,TBA在过滤突发性强的攻击报文时错误率会进一步下降。实验结果表明:TBA的过滤效果和NB(naive Bayes)方法相当,过滤突发性攻击流时错误率低于NB方法。  相似文献   

6.
基于隐马尔可夫模型与并行模型组合的特征补偿算法   总被引:1,自引:0,他引:1  
提出了一种基于隐马尔可夫模型和并行模型组合的特征补偿算法.首先,利用一个包含较多状态的隐马尔可夫模型来描述全部单词特征向量的分布.然后,根据静音段估计的噪声均值和方差,采用并行模型组合方法调整隐马尔可夫模型的均值向量和协方差矩阵,使之与识别环境相匹配.最后,根据基于状态转移矩阵压缩的前向后向算法计算隐马尔可夫模型的后验概率,并通过最小均方误差准则估计纯净语音特征向量.实验结果表明,该算法能够更加准确地估计纯净语音特征向量,其性能明显优于基于高斯混合模型的特征补偿算法;状态转移矩阵压缩算法可以在不影响补偿精度的前提下,显著减少前向后向算法的计算量.  相似文献   

7.
为了解决向量空间模型(VSM)对短文本内容表示能力不足的问题,提出了一种基于频繁词集的特征扩展方法.定义了单词间的共现关系和类别同向关系,通过计算单词集的支持度和置信度,挖掘出具有相同类别倾向的频繁词集,并将其作为短文本特征扩展的背景知识库.对于短文本中的每个原始单词,从背景知识库中查找包含有该单词的频繁词集,将其作为扩展特征加入原特征向量中.搜狗语料集上的实验结果表明,置信度和支持度对背景知识库的规模有较大的影响,但是扩展过多的特征存在冗余性,对分类效果没有进一步的提升.基于频繁词集构建的短文本背景知识库可以作为有效的扩展特征;当训练文本数较为有限时,特征扩展对支持向量机SVM的分类效果有显著的提升.  相似文献   

8.
频谱检测是认知无线电的基础和关键技术,将其建模为隐马尔可夫模型(hidden Markov model,HMM),并由此提出基于隐马尔可夫模型的协作频谱检测策略.该策略首先使用Baum-Welch法对HMM的系统参数进行最大似然估计;然后基于HMM模型,利用各次用户的检测信息以及过去信道状态的后验概率信息进行贝叶斯推理,更新当前时隙信道状态的后验概率;最后根据最大后验概率准则对当前时隙的信道状态进行最终判决.使用后验概率,该策略可进一步估计系统协作检测的性能,在满足系统协作检测性能要求的前提下,选择尽可能少的、检测性能较优的次用户来参与协作,以节约开销和降低复杂度.仿真实验表明,所提出的策略的系统检测性能优于基于大数判决、似然比和Chair-Varshney准则的协作频谱检测策略.  相似文献   

9.
多标签分类是指数据可以同属于多个类的分类问题,其数据特征和标签间相关性对分类结果存在影响。因此,提出一种融合前述两种因素的多标签分类算法。将数据用核函数进行特征映射,根据训练数据的k-邻域计算得到每个标签的最大后验概率;并将其加入到对应的数据特征中。用加入最大后验概率的数据特征训练分类器。通过在经典的yeast、scene和emotion数据库上实验,证明了算法的有效性。  相似文献   

10.
重叠语音是影响说话人分割性能的主要因素之一。该文提出了基于语音高层信息特征的重叠语音检测方法以提高说话人分割效果。首先用通用背景模型(universal background model,UBM)提取语音的语言学高层信息特征,并融合这些特征和Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征建立隐Markov模型(hidden Markov model,HMM)检测重叠语音,然后对处理后的语音进行说话人分割。实验结果表明:对于由TIMIT语音库生成的数据集,该方法对重叠语音检测的错误率比单一采用MFCC特征有显著降低,而且说话人分割性能有明显的提高。  相似文献   

11.
针对已有分类器存在的缺陷, 提出一种以分类错误率为标准选择组合特征的分类方法, 提高分类器的分类精度. 先提取图像的4种分形维数作为纹理特征, 再通过组合不同分形维数特征应用于支持向量机(SVM)进入样本训练阶段. 将分类错误率最低的特征组合作为分类器的特征向量, 应用于测试阶段的分类, 提高分类器的分类精度. 实验结果表明, 该方法具有较好的推广性, 为图像特征组合提取提供了新途径.  相似文献   

12.
提出了一种基于最小分类错误(MCE)训练的采用多层感知器(MLP)结构的模式分类器设计方法。这是一种以分类错误率最小化为目标的模式分类器设计方法,将它用于MLP分类器设计能够进一步提高分类器的性能。采用MLP实现MCE训练中的分类损失计算,从而将MCE训练过程与MLP分类器设计统一在一个神经网络结构中,通过BP算法予以实现。这不仅能达到提高MLP分类器性能的目的,而且简化了它的设计过程。  相似文献   

13.
为解决目前临床上对早期糖尿病视网膜病(diabetic retinopathy,DR)诊断困难的问题,利用多焦视网膜电流图(multifocal electroretinogram,mfERG)和模式分类的方法,对DR进行早期诊断和自动分类的研究。对31例正常样本和58例早期DR样本,提取mfERG信号的平均一阶响应(K1成分)峰值和模板相关系数两个关键特征。使用线性分类器进行分类,并用“留一法”统计结果,正常人和早期DR病例的分类错误率为21.35%。该文还用聚类方法分析了早期DR样本的分布特点。结果显示,使用平均一阶响应的N2峰的幅值和位置作为特征对早期DR的诊断效果较好;早期DR样本的聚类结果具有一定的临床价值。  相似文献   

14.
由于采用传统的分类器进行检测时,存在检测率低而误报率高的问题.提出了一种基于免疫聚类的自适应分类器方法,采用多信息粒度的思想有效地克服了聚类算法与分类算法间的不一致性.通过在真实网络数据集上对多种入侵行为的检测结果表明:该分类器的检测率高、漏报率和误报率低,较RBF分类器和BP分类器具有更好的分类性能和推广性能.  相似文献   

15.
针对复杂场景中的人车分类问题, 提出一种基于多粒度感知SVM (support vector machine)的复杂场景人车分类方法。该方法首先对视频场景进行运动区域分析, 结合角点检测方法提取运动区域视觉感知信息, 在时空域中采用Kalman滤波将感知信息进行关联推理, 去除噪声干扰。 再以运动区域质心点为中心, 构造目标的多粒度感知特征, 最后构造2级SVM分类器, 将目标多粒度感知特征向量集输入SVM分类器进行训练及分类, 得到人车分类结果输出。实验结果表明, 该方法取得了良好的分类效果, 人、车全天候平均分类正确率分别达到93.6%以上, 能有效避免光照、色彩、目标大小等变化导致的误分类问题, 适用于智能交通视频的人车分类应用。  相似文献   

16.
Classic sparse representation, as one of prevalent feature learning methods, is successfully applied for different computer vision tasks. However it has some intrinsic defects in object detection. Firstly, how to learn a discriminative dictionary for object detection is a hard problem. Secondly, it is usually very time-consuming to learn dictionary based features in a traditional exhaustive search manner like sliding window. In this paper, we propose a novel feature learning framework for object detection with the structure sparsity constraint and classification error minimization constraint to learn a discriminative dictionary. For improving the efficiency, we just learn sparse representation coefficients from object candidate regions and feed them to a kernelized SVM classifier. Experiments on INRIA Person Dataset and Pascal VOC 2007 challenge dataset clearly demonstrate the effectiveness of the proposed approach compared with two state-of-the-art baselines.  相似文献   

17.
基于粗糙集的支持向量机故障诊断   总被引:2,自引:0,他引:2  
该文结合粗糙集属性约简及支持向量机分类机理,提出了一种新的故障诊断方法。首先利用粗糙集对过程特征变量进行约简,去除冗余的过程信息,并降低过程数据的维数,获得具有代表性的过程特征信息。基于该特征信息建立支持向量分类机用于故障的诊断。以高压直流输电系统为例,对交流单相接地故障和直流接地故障进行诊断,诊断时间分别为12ms和11ms,诊断正确率分别为98.8%和96.8%。  相似文献   

18.
钢丝绳断丝声发射定量检测方法研究   总被引:1,自引:0,他引:1  
采用声发射(AE)技术对钢丝绳断丝进行定量检测研究·通过波形分析确定合适的定时参数,从而将断丝事件表征为单个AE撞击信号,实现了断丝的定量化表示·通过二维图示方法选择特征参量,并根据断丝与非断丝类别的分布特点,采用多段线性分类器,以机器智能方式实现断丝的自动检测与识别·  相似文献   

19.
采用优化的分散矩形特征结合软级联进行了人眼检测研究,针对分散矩形特征会造成特征数量暴增的问题,给出了一种优化解决方案;针对级联分类器训练过程中训练难度不断加大的问题,提出了一种按指数规律调整每层的最小检出率和最大误检率的方法 .优化后训练所需时间缩短为优化前的1/3,改进后分类器性能相比原始特征有所提高.人眼检测实验结果表明:该分类器具有更好的分类能力.  相似文献   

20.
针对实际生活中普遍存在的多视角、多人脸检测问题,提出了一种新的分类器训练方法及人脸检测的解决方案;首先采用NPD差分特征对人脸特征进行描述,NPD特征通过判断两个像素值间相对差异对人脸进行描述,其特征值可从二维表直接获取,能大大节省训练时间;同时提出了一种深度二叉特征树结构来训练分类器,可有效结合特征间的关联性,将训练得到分类器与肤色算法相结合来提高检测速度;通过在CMU人脸数据库上对所提出算法进行验证,仿真结果证明在多人脸、多视角检测背景环境下,该算法较Ada Boost算法在检测率提高了8.7%,误检率降低了4.1%,检测速度提高了27.7%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号