首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
基于鉴别性向量空间模型的语种识别   总被引:1,自引:0,他引:1  
传统语种识别中训练数据库的规模庞大,对于语种分类有鉴别性的信息大量重叠,且训练数据的不同信道条件、不同来源都会对训练和测试有一定干扰。针对这些问题,提出一种鉴别性向量空间模型(D-VSMs)建模方法。D-VSMs能够自动过滤训练集中信息重叠的数据,使得每一个支持向量机的训练数据都有针对性,从而用较少的训练数据能取得较好的分类效果。在美国国家标准技术局(NIST)2009年语种识别测试中,D-VSMs只用了原训练数据的25%,计算量是传统并行音素识别器后接向量空间模型(PPRVSM)的10%,等错误率在30s、10s和3s的测试条件下分别比传统PPRVSM下降了12.75%、15.89%以及7.33%。  相似文献   

2.
针对短时语音时长过短以及训练语音和测试语音时长不等,导致语种识别性能大幅度下降的问题,提出了一种可变时长的短时广播语音多语种识别模型(Variable Duration-Language Identification, VD-LID).首先,对不同时长的语音进行时长规整;然后,对规整后的短时语音进行特征提取,提取其对数功率谱包络图作为语种特征;最后,将语种特征输入到残差神经网络中进行分类.实验结果表明,相比于传统特征输入,对数功率谱包络图特征将短时语音的语种识别准确率提高到了82.4%;相比于没有引入时长规整层的语种识别模型,VD-LID在测试语音时长为5 s和10 s的实验中,语种识别准确率分别提升了27.9%和37.7%.  相似文献   

3.
针对不同训练样本重要性的差异对模型推广能力的影响,提出了对各个样本的误差惩罚参数赋予不同权重的加权支持向量机求解路径算法.根据样本重要性的不同,利用分段线性插值得到加权系数,并通过加权系数调整求解路径,从而改变不同样本在回归模型中的作用.采用支持向量机加权求解路径算法对圆柱壳结构在不同边界条件下的时、频域响应数据进行预测,训练样本的重要性通过与测试样本的欧式距离来表达,结果显示所提算法可减小位移响应在多个评价指标下的预测误差,提高支持向量回归机的推广能力.该方法同样适用于其他求解路径算法,如λ-路径算法和ν-支持向量回归路径算法.  相似文献   

4.
加权合成的嵌入式隐Markov模型人脸识别   总被引:2,自引:1,他引:2  
嵌入式隐Markov模型能提取人脸的二维主要特征并对姿态和环境的变化具有较好鲁棒性,讨论了嵌入式隐Markov模型的进一步改进及其实现,首先分析了形成观察向量的采样窗大小和其二维DCT系数项数的不同对人脸识别结果的影响,然后确定最优的采样窗大小和其二维DCT系数项数,鉴于不同角度的照片包含信息量的不同,提出了一种加权合成的模型参数重估算法,重估模型参数时,首先计算每幅脸像相对应的模型参数,然后进行加权合并,权值由迭代公式求得,训练结束后用一个合成 的模型来表示一个对象。采用基于该方法的原型系统对ORL人脸库进行测试,识别正确率达到了99.5%。  相似文献   

5.
针对传统线性支持向量机在训练数据集时均等对待每一维输入特征,以及在原始空间直接分类造成预测准确率低的问题,提出低阶多项式数据映射和特征加权相结合的方法,来提高线性支持向量机的分类性能。该方法首先将每个样本映射到多项式核对应的2 阶显式特征空间,从而增加样本的隐性信息,然后使用模糊熵特征加权算法计算每一维特征的权重,通过权重衡量特征对分类结果的贡献大小。从不同数据库选取7个数据集进行测试,在训练时间和预测准确率2个方面将该方法与核支持向量机、线性支持向量机的其他改进算法进行比较。结果显示,随着数据集规模的扩大,训练时间降低一个数量级,预测准确率在一些数据集上取得与核支持向量机相接近的效果。结果表明:所提方法可以有效提高线性支持向量机的整体性能。  相似文献   

6.
一种基于VSM文本分类系统的设计与实现   总被引:10,自引:0,他引:10  
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现 ,包括对该系统的结构、预处理、特征提取、训练算法 ,分类算法等关键技术的介绍 .通过引入结构层次权重系数来改进文本特征项权重 ,同时提出一种新的训练算法和文本相似度域值计算方法 .实验结果证明 :该分类系统能有效地提高文本分类效果 ,开放性测试的平均准确率在 80 %以上 ,且平均查全率达到了 86 % .  相似文献   

7.
基于VSM的中文文本分类系统的设计与实现   总被引:25,自引:0,他引:25  
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重,并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到90%左右,而且标题权重的引入和新分类算法的实施有效地改善了分类性能。  相似文献   

8.
针对水库洪水调度决策中"模糊概念"难于处理,决策中没有充分考虑不确定的犹豫度和最优权重确定具有片面性的问题,提出了基于直觉模糊集的犹豫度加权组合方法。通过解线性规划问题和设置确定性系数得到属性的组合最优权重。利用直觉模糊集充分表达了决策中的犹豫度信息,进而根据组合模型计算相对贴近度对方案进行排序。实验数据证明该组合模型通过调整确定性系数,可以对不同时期的水库洪水进行有效和合理的调度决策。  相似文献   

9.
基于小波包和支持向量机的结构有限元模型修正   总被引:1,自引:0,他引:1  
提出了基于小波包变换和支持向量机(SVM)原理对大型空间网架结构有限元模型进行修正的方法.首先建立半刚性节点固结系数表示的空间网架单元刚度矩阵,通过对结构加速度信号进行小波包分析,提取小波包信号成分节点能量作为SVM模型的训练样本,建立SVM模型.其次由训练好的SVM模型,识别出节点的固结系数.最后将得到的节点固结系数代入空间网架结构的单元刚度矩阵,再由坐标变换得到修正后的结构总的刚度矩阵,从而实现网架结构的有限元模型修正.数值仿真结果表明该方法能对空间网架结构的有限元模型进行有效修正.  相似文献   

10.
目前行人重识别主要是基于完整人体的研究,但是某些特定场景下,完整行人图片难以获取,因此本文建立一个基于人头的重识别数据库,并提出了相关算法.算法采用局部Fisher向量编码和交叉视角二次判别分析算法,首先基于HSV颜色信息去描述特征,使用高斯混合模型对特征数据建模,然后Fisher向量加权聚合,最后对样本的低维特征子空间和度量矩阵同时进行学习.实验及分析证明了基于人头的重识别算法的可行性,其中基于Rank1的重识别率达到89.29%.  相似文献   

11.
提出一种基于向量空间模型(VSM)的音频分类算法.特征提取中,针对目前采用的参数主要为静态特征,提出了基于信息论的动态特征计算方法,并根据其物理意义设置关键帧提取中的初始值,解决聚类局部极值问题.通过引入音频聚类的类内标准差,对传统VSM未处理特征项间相关信息的缺点进行改进,提出新的相似性度量方法,并以此方法对不同类别的音频构造分类器.实验结果证明,此方法提高了分类精度,准确度可达85%以上.  相似文献   

12.
由于现有的经典本体映射方法以及相似度计算方法无法处理模糊信息,因此它们都无法计算模糊概念之间的相似度.为此,提出了一种新的基于向量空间模型的模糊概念相似度计算方法SimFC-VSM(similarityoffuzzyconceptbasedonvectorspacemodel).SimFC-VSM方法首先利用模糊本体中的模糊关系构建向量空间模型;然后将模糊概念表示成此向量空间模型中的向量;最后通过向量运算的方法来计算模糊概念之间的相似度.因此,所提出的方法SimFC-VSM可以有效地利用向量空间模型来计算模糊概念之间的相似度.  相似文献   

13.
基于权值调整的文本分类改进方法   总被引:14,自引:0,他引:14  
文本分类是文本挖掘的基础与核心 ,可广泛应用于传统的情报检索和 Web信息的检索与挖掘等。提出了一种利用权值调整思想对向量空间法 (VSM)和朴素 Bayes分类器 (NBC)进行改进的文本分类方法 ,并探讨了利用 EM算法进行无导师 Bayes分类的方法 ,设计和实现了一个中英文文本分类系统 CZW。 3组实验数据表明 ,用某些评估函数调节单词权值可有效提高 VSM和 NBC等文本分类模型的精度 ,并且训练文本规模越大 ,改进的效果越明显。 NBC的分类精度最高可达 86 %。  相似文献   

14.
开发了一套由中文分词、向量空间模型建立(VSM)、特征提取、降维处理和文本聚类等模块组成的舆情分析系统,实现互联网舆情信息的主题发现;在舆情分析系统的实现过程中,提出了一种K-means改进算法。实验证明,改进后的算法在查全率和查准率上都有了一定的提高,能够得到较高且稳定的准确率。  相似文献   

15.
数字图书馆个性化服务用户模型研究   总被引:32,自引:0,他引:32  
提出了一种数字图书馆个性化服务用户模型构架,并对实现过程中的几个关键问题,包括用户模型表示方法,用户模型的建立以及更新算法进行了详细论述.提出了基于本体论的空间向量用户模型表示方法,建立了简单的数字图书馆领域本体,以空间向量表示用户模型,以本体概念作为向量的特征项;采用支持向量机分类算法和无监督聚类算法相结合提取用户兴趣;在用户模型更新方法上,采用渐进遗忘和滑动窗口相结合的方法实现用户兴趣概念的漂移.  相似文献   

16.
由于P2P环境的分布式、易拓展等优点,越来越多的Web服务被部署到上面,但是如何在大量返回的结果中进行选择,是Web服务的关键问题。基于分布式哈希表路由算法,并引入向量空间模型相关思想,构建P2P环境中的服务推举网络,提出服务选择的思想和框架。其流程是:发出查询;接收结果(包括推举);进行本地比较,选择最优服务;根据选择的服务,对其进行评估,然后调整相应的模型。这些模型包括服务质量向量和服务推举可信度。最后通过实验对系统的精确性以及动态可调整性进行了验证。  相似文献   

17.
智能N维向量的空间模型   总被引:2,自引:0,他引:2       下载免费PDF全文
传统向量空间模型在计算复杂度、查询性能、智能性方面存在种种缺陷。在其基础上,提出了智能N维向量空间模型,改进了文档特征向量生成的算法,使用局部统计数据计算特征向量,大大降低了计算复杂度。模型采用用户点击作为反馈,提出了对初始的文档特征向量和用户查询向量进行调整的算法。最后,从理论上对两种模型的性能进行了对比分析。  相似文献   

18.
基于命名实体的Web新闻文本分类方法   总被引:1,自引:0,他引:1  
文章对Web新闻领域的文本自动分类问题进行了研究,提出一种基于新闻实体要素的分类方法;在应用空间向量模型的基础上,充分考虑命名实体对Web新闻文本分类的特殊作用,并进行了实验.实验结果表明,以新闻实体要素为特征的文本分类系统可得到较高的分类精度,该方法具有一定的实用价值.  相似文献   

19.
医疗文本具有实体密度高、句式冗长等特点,简单的神经网络方法不能很好地捕获其语义特征,因此提出一种基于预训练模型的混合神经网络方法。首先使用预训练模型获取动态词向量,并提取实体标记特征;然后通过双向长短期记忆网络获取医疗文本的上下文特征,同时使用卷积神经网络获取文本的局部特征;再使用注意力机制对序列特征进行加权,获取文本全局语义特征;最后将实体标记特征与全局语义特征融合,并通过分类器得到抽取结果。在医疗领域数据集上的实体关系抽取实验结果表明,新提出的混合神经网络模型的性能比主流模型均有提升,说明这种多特征融合的方式可以提升实体关系抽取的效果。  相似文献   

20.
魏海平 《科学技术与工程》2012,12(12):3002-3004
随着Internet技术的飞速发展,网页上存在着各种各样、类目繁多的信息,因此网页分类技术就显得越来越有意义。本文使用向量空间模型(VSM)来表示网页文本,提出了一种改进X2的文本特征选择方法,最后通过支持向量机方法进行分类。实验结果表明,相对于传统的X2文本分类统计方法,改进后的特征选择方法的分类效果要好于传统的X2统计方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号