首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 585 毫秒
1.
针对贝叶斯信息准则(BIC)算法在说话人改变检测中计算量大、检测精度低的问题,文中提出了一种改进的BIC说话人改变检测算法.该算法通过限制分析窗内第一个数据窗的最大长度来降低计算量,并通过增加分析窗内第二个数据窗的有效长度(提高可测度)来提高检测精度;同时,该算法只在新增区间内寻找潜在说话人改变点,从而解决了长时间无说话人改变时计算量不断增大的问题.实验结果表明,该算法和传统的BIC算法相比,偏移误差范围由0.10~0.80降低到0.03~0.20;当分析窗长为40s时,计算时间节省了约75%.  相似文献   

2.
针对BIC说话人改变检测中检测精度低,计算量大的问题,本文提出了一种快速准确的改进BIC说话人改变检测算法:通过提高可测度的方法来提高检测精度;在分析窗长度增加时,通过增加分析窗内第一个数据窗的长度来降低计算量;在寻找潜在改变点时,只在新增加的分析窗内计算和寻找;通过限制分析窗内第一个数据窗最大值的方法来解决长时间没有说话人改变点计算量不断增大的问题。实验结果表明该算法在不影响说话人改变检测的总准确率的基础上提高了检测精度,节省了计算量。  相似文献   

3.
陈雪芳 《科学技术与工程》2013,13(12):3297-3300
提出了基于远近距离的说话人聚类算法:首先,使用端点检测算法把语音分割成读音段,然后,采用T2公式对近距离的说话人语音段进行聚类得到语音块,最后,使用谱聚类的方法估计说话人数目,对远距离的说话人(语音块)进行聚类。实验结果表明,在近距离的说话人聚类中,使用T2公式比使用BIC和KL在语音块准确率方面分别高出2.62%和13.84%,在远距离的说话人聚类中,使用谱聚类算法基本上可以把语音中的说话人数目计算出来,当说话人数目为15时,类纯度和说话人纯度可以达到78%,说明该算法可以有效地对说话人进行聚类。  相似文献   

4.
为了解决传统的小尺度密集工程车辆检测算法存在检测速度慢、鲁棒性差、识别准确率低等问题,采用基于改进型YOLO v3的卷积神经网络工程车辆检测算法,使用目标框与真实框交并比作为损失函数替代聚类算法中的欧式距离,同时结合工程车辆检测时标注真实框的特点,对候选框进行聚类;改进评估模型的损失函数,构建适合小尺度密集车辆的网络结构.在自制数据集上进行试验,结果表明,该方法对小尺度密集工程车辆的检测精度明显提高,准确率能够达到81.1%,召回率能达到95.9%.  相似文献   

5.
电话语音的多说话人分割聚类研究   总被引:2,自引:0,他引:2  
为了提高电话多人语音中提取的单人语音纯度,即多说话人分割聚类处理的性能,该文在传统的分步分割聚类算法机制上增加了重分割处理,提出逐级算法增强处理机制: 在分割部分,该文提出了一种基于Bayesian信息准则的分割算法,融合基于不同距离测度检测得出的分割点提高了分割点检测率;在聚类部分提出了基于BIC和交叉似然比准则(CLR)的分层聚类算法;在重分割部分引入和改进了进化隐Markov模型算法精化分割结果.该文在美国国家标准技术局(NIST) 1998年度多说话人识别数据库上进行实验,聚类后性能"类纯度"比传统算法提高了10%.  相似文献   

6.
动态环境与视觉混淆严重影响视觉闭环检测性能.基于贪心策略,提出了一种在线构建视觉词典的闭环检测算法.算法优先处理Surf描述与已有单词Surf描述欧式距离最大的特征点,改进特征点与单词Surf描述最近邻的约束条件,生成了表征性能强、量化误差小的视觉词典,算法具备实时性,并在动态环境图像集与视觉混淆多发生的图像集上,在确保100%,准确率的条件下,最大召回率分别提升了5%,与4%,.  相似文献   

7.
绝缘子缺陷检测是电网巡检过程中重要的一环,为提高绝缘子缺陷检测的精度,该文提出一种基于改进YOLOv5算法的绝缘子缺陷检测算法——YOLOv5t,能够在保证网络运行速度的条件下,提升网络的检测精度.该算法在YOLOv5s的基础上,将三重注意力机制(triplet attention)添加到骨干网络中,给予每个特征通道不同的权重,以提高网络的检测精度;并采用CIoU Loss作为网络回归损失的损失函数,提升网络的收敛速度;同时将Soft-NMS作为网络的预测结果处理方法,降低网络的漏检率.YOLOv5t与几种常用的缺陷检测网络的对比实验结果表明,YOLOv5t的准确率达到97.2%,召回率达到98%,平均精度均值达到99.1%,较YOLOv5s算法分别提升了0.9%、5.1%和2.1%,并且检测速度没有受到影响.  相似文献   

8.
为提高文本分类的准确性,针对健康节目台词文本各类别之间样本数量及各样本之间词数不平衡的特点,提出了一种基于word2vec均值算法及改进的词频-逆文本频率(TFIDF)算法的分类方法 .该方法通过引入信息熵及修正因子,缓解了数据不平衡对分类准确率及召回率造成的不良影响.实验结果表明:所提出的分类方法在准确率及召回率上与word2vec均值模型相比,分别提高7.3%及10.5%.  相似文献   

9.
为了提高网络入侵检测模型的准确率与泛化性,提出基于随机k-近邻集成算法的网络流量入侵检测模型。首先,该模型提出一种集成赋权距离,来提高预测精度;其次,采用一种随机策略的集成方法对k-近邻模型进行集成,从而提高了其在异常检测过程中的全局和局部优化能力;然后,利用并行计算的方法提高了算法运行的效率;最后,构建了基于随机k-近邻集成算法的网络入侵检测模型,并采用KDD99数据集进行实验。实验结果表明,基于随机k-近邻集成算法相对于其他模型具有更好的检测效果,准确率和召回率分别达到99.05%和91.96%。  相似文献   

10.
传统的以贝叶斯信息准则(Bayesian information criterion,BIC)作为相似性度量的说话人分离技术,在短时对话的分离任务中能取得较好的效果,但是随着对话时长的增加,BIC的单高斯模型不足以描述不同说话人数据的分布,且层次聚类(Hierarchical agglomerative clustering,HAC)时,区分相同说话人和不同说话人的门限值难以划定.针对此问题,提出基于短时BIC和长时G_PLDA的融合方法,充分利用BIC在短时聚类的可靠性和G_PLDA在长时段上的优异区分性,在美国国家标准技术局(NIST)08Summed测试集上的实验表明,该方法将分类错误率(DER)从BIC基线系统的2.34%降到1.54%,性能相对提升34.2%.  相似文献   

11.
免提式语音通信系统在VoIP(Voice over Internet Protocol),手持移动终端和远程会议系统应用得非常广泛.但是,由于扬声器和麦克风之间的耦合而产生的声学回声,严重影响了语音的清晰度.常用的NLMS2算法在遇到相关性很强的两路语音信号时,收敛速率变得很慢,为改进此算法,基于小波变换和语音信号能量分布的特点,提出了一种新的两路自适应回声消除算法——WL-APN-LMS2.计算机仿真结果表明,该算法比传统的NLMS2、AP2算法收敛性能更好,计算复杂度较低,综合性能更优.  相似文献   

12.
提出了一种基于形状加权的三维模型特征提取算法,同时考虑采样点与中心点间的距离,以及采样点所在三角面片面积大小,构建直方图获取特征描述符.该算法能够充分利用模型表面信息,提取步骤简单,时间消耗少.实验证明,利用本文算法得到的特征描述符进行检索,查全率和查准率都有明显提高.  相似文献   

13.
镜头边界检测是基于内容视频检索的基础环节。由于视频类型与内容众多,目前镜头边界检测中存在阈值选取困难、查全率和查准率不高等问题。针对以上问题提出一种改进的基于互信息量的镜头边界检测算法,在字幕检测定位算法有效定位字幕区域的基础上,通过比较非字幕、非四角区域HSV空间直方图求取的相邻帧间互信息量的差异程度,实现镜头边界检测。实验表明,与当前应用最广泛且比较有效的双阈值算法相比,突变镜头检测综合性能平均提高12.4%,渐变镜头检测综合性能平均提高8.2%,通过自适应阈值的选取,有效解决了阈值依赖人工经验选取的问题;与当前已提出的基于互信息量的镜头边界检测算法相比,该算法降低了计算复杂度、几乎能检测所有的淡入淡出镜头边界,并使得镜头边界检测具有较高的查全率与查准率。  相似文献   

14.
根据语音信号偏离高斯分布程度大而背景噪声信号偏离高斯分布程度小这一特征,提出一种改进的以语音短时幅度谱偏度为特征参数区分语音段和噪声段的语音激活检测算法,并应用到2.4 kbit/s混合激励线性预测(mixed excitation linear prediction,MELP)声码器中.通过与自适应多速率(adaptive multi-rate,AMR)语音编码标准中的语音激活检测算法相比较,该算法复杂度较小,且对背景噪声服从高斯分布的语音信号具有更好的端点检测性能.实现了可变速率MELP声码器的平均输出码率下降为1.9 kbit/s,通过非连续传输后合成的语音具有良好的舒适性和连续性.  相似文献   

15.
大学生闽南语说话人识别语音库的设计   总被引:1,自引:0,他引:1  
设计了一个包含120名在校大学生的闽南语说话人识别语音库.该语音库可以根据闽南语口音、说话人性别等条件来进行语音语料的查询.针对不同口音的说话人进行了一系列的GMM(Gaussian Mixture Speaker Model)说话识别实验,验证了特定口音模型比非特定口音模型的识别率一般要高10%左右.  相似文献   

16.
针对多类别车辆检测任务中存在计算复杂、检测精度不高的问题,提出一种基于中心点的多类别车辆检测算法.该算法首先通过Hourglass网络对各类型车辆特征进行提取,考虑到多类别车辆检测时易受车辆大小、视觉变化及非刚体形变等因素的影响,采用可变形卷积替换传统卷积的方法对Hourglass网络重建;在网络预测模块中,结合不同的预测分支支路,采用组合损失函数度量模型拟合的程度,同时引入GIoU损失提高模型拟合效果,减少车辆检测中漏检和误检现象的发生;最后通过Sigmoid激活函数得到最终的检测结果.在公开数据库上仿真实验,测试精度和检测速度分别达到了93.42%和49 f/s,在自制数据库上仿真实验,所提算法的精确率和召回率相比CenterNet算法分别提高了2.7% 和5.6%.实验结果表明,本文算法在车辆检测任务中具有明显优势.  相似文献   

17.
针对传统YOLOv3(you only look once-v3)算法目标检测精度较低、收敛速度较慢等问题,提出了一种改进的YOLOv3算法,分别对主干网络和损失函数进行了改进。采用迁移和冻结相结合的训练方法,以提升目标检测的精确度和速度。基于改进的YOLOv3算法对西南某通航机场3种不同场景下的运动目标检测效果进行了对比分析。结果表明,改进的YOLOv3算法对正常天气场景下的场面运动目标检测效果要明显优于雾天和雨天场景,对飞机目标的检测效果明显优于车辆和行人目标;3类目标的检测精度、召回率、平均精度值(mean average precision, mAP)分别达到92.96%、80.51%、91.96%,GPU处理速度为74.0帧/s,较传统YOLOv3算法和YOLOv4算法性能均有明显提升。  相似文献   

18.
提出了一种能够提高ITU-TG.729算法性能的静音检测技术,该技术的引入不仅可以降低G.729的语音通讯平均传输出特率,而且可以大量节省G.729压缩和解压过程的实际运算量,通过在不同的噪声背景下的性能分析,该静音检测技术的引入不会对G.729算法的合成语音质量产生明显的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号