首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 234 毫秒
1.
为了进一步提高低信噪比下语音激活检测(VAD)的准确率,针对基于统计模型的似然比检验方法容易造成非语音信号误检的问题,提出了一种基于子带保留似然比的VAD算法.在似然比综合判决准则中引入保留因子,根据人耳对语音感知敏感度在频率上的差异,采用全局非均匀、局部均匀的方式划分子带,对似然比大于阈值的频率分量所对应的子带信号提取语音特征并根据特征强度设置保留因子,只使用保留的频分量似然比进行综合判决.实验结果表明:该算法在不同的低信噪比环境下检测性能均优于LRT(似然比检验)、MO-LRT(多观测似然比检验)等算法,其漏检率更低,同时有效减少了非语音信号似然比虚高而导致的误检,VAD判决准确率平均提高了2%~14%.  相似文献   

2.
以往的词汇搭配抽取统计评价方法具有大致相同的效果,它们各有优劣,可以实现优势互补.该文提出多策略融合的搭配抽取方法. 首先,将互信息法用于衡量二元独立性,淘汰候选的无关二元组. 其次,对比χ2检验法与t检验法,发现使用χ2检验法能够更合理地反映搭配组合的同现性和期待性;然后,使用对数似然比检验法,解决其他方法无法克服的稀疏数据问题. 此外,加入构词法的启发式规则,最终形成一个多策略融合的方法.实验结果表明该方法的准确率较高,在实际应用中取得良好效果.  相似文献   

3.
基于条件随机域的Web信息抽取   总被引:1,自引:0,他引:1  
为了获取隐藏在Internet中的信息,基于条件随机域模型(CRF),提出了一种Web信息抽取的方法。该方法对网页样本中的每一行加注标签,确定文本特征,建立条件随机域模型,采用拟牛顿迭代方法对样本进行训练,参照学习得到的条件概率分布模型,实现网页搜索结果的抽取。与HMM模型相比,CRF模型支持网页文本的语言特征,抽取准确率高。实验结果表明,使用CRF模型的抽取准确率达到90%以上,高于使用HMM模型的抽取准确率。  相似文献   

4.
基于Web的未登录词(Out-of-Vocabulary,OOV)译文挖掘过程主要包含双语摘要获取、候选多词单元提取、最佳译文提取等步骤。通过改进候选多词单元提取方法和最佳译文选择方法以获取更高的译文挖掘准确率。在候选多词单元提取方面,在层次迭代的对数似然比(LLR)基础上提出了基于内部信息层次化过滤的对数似然比方法,相比LLR方法降低了噪音比且准确率提高了5%。在最佳译文选择方面,提出了基于左右熵(LRE)邻接信息过滤候选多词集合,同时将频度-距离模型(F-D)和基于LLR的词对关联度模型相结合使译文挖掘的召回率同比提高了5%~10%。  相似文献   

5.
针对现有的社团分析算法无法在大规模网络上应用的问题,提出一种社团抽取算法,可以高效地分析网络的社团特征.该方法无需事先获取网络的全部拓扑结构,采用网络搜索与社团判定相结合的思路,可有效地抽取结构未知的社交网络上的某个特定社团,从而使分析超大规模网络社团结构成为可能.在仿真数据集上进行实验,分析抽取准确率的影响因素,得出网络平均度越大抽取准确率越高.进一步实验结果表明,社团抽取算法的准确率与现有方法接近,并且执行效率明显高于现有方法,验证了该算法的可行性和有效性.  相似文献   

6.
通过研究抽取算法的本质和抽取算法之间的关系,对抽取算法的互补性进行分析,提出了一种多算法组合验证机制,该机制能检测出抽取算法的错误,并通过结合动态阈值调整的方法,提高抽取算法的抽取准确率.  相似文献   

7.
基于语义联系的新闻网页关键词抽取   总被引:1,自引:0,他引:1  
提出一种基于语义联系的新闻网页度,还考虑词语在具体上下文中的相关性,用词汇链将词语语义联系表示成图形式,在此基础上抽取出新闻网页关键词.对从网易网站选取120篇有核心提示的新闻网页进行测试,实验结果表明,所提出的方法比基于词频的关键词抽取方法和基于<知网>语义相似度构建词汇链的关键词抽取方法,在准确率和召回率上有很大的提高,当抽取关键词个数为3时,比基于词频方法的准确率和召回率分别提高了27.77%和21.38%.  相似文献   

8.
为了解决迁移学习的欠适配问题,将粒模型作为候选模型的集合,通过模型选择的方式引入目标域的辅助模型中包含的标注规则,提出粒模型推断中基于似然比的模型选择方法(likelihood ratio model selection,LRMS),实现了辅助模型与粒模型的融合。LRMS保持基于Viterbi算法的标注模型对整条序列进行计算的模式,避免了候选标注器对上下文关系的破坏。通过大量词性标注实验表明LRMS在每个迁移学习任务中都有准确率的提高,从而证明似然比模型选择是一种有效的解决欠适配问题的方法。  相似文献   

9.
本体是领域概念的术语和信息的集合,传统的信息提取方法主要有基于统计的方法、基于规则的方法和混合方法.提出一种基于OWL本体的信息抽取方法,建立英语求职简历本体,构建信息抽取原型系统.通过计算信息抽取系统的准确率和召回率,验证方法的有效性.  相似文献   

10.
针对传统的Web信息抽取方法运算量大、自动化程度低的问题,提出了一种基于SVM的WEB信息自动化抽取方法。利用SVM优秀的分类性能将网页中有用数据和无用数据分类标注,有效地完成Web信息抽取任务,准确地抽取出所需信息,实现数据抽取的自动化。实验结果表明,该方法可以有效地获取网页信息特征,具有较高的召回率和准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号