首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对机器识别人类情感过程中的精度不高、泛化能力不强等问题,提出了一种基于语音、文本和表情动作的3种模态情感识别融合方法。在语音模态中,设计深度波场延拓和改进波动物理模型,模拟长短期记忆(long short-term memory, LSTM)网络的序列信息挖掘过程;在文本模态中,利用含有多头注意力机制的Transformer模型捕捉语义上潜在的情感表达;在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合。最终提出一种多性能指标下的模态融合方案,以实现高精度的、强泛化能力的情感识别。在通用的交互式情感二元运动捕捉语料库IEMOCAP中,将所提出的方法与现有的情感识别算法进行对比,实验结果表明:所提出的算法在单个模态和多个模态中的识别精度均较高,平均精度改善达到16.4%和10.5%,有效提升了人机交互中情感识别的能力。  相似文献   

2.
在现代的汉语语音合成的波形拼接合成方法中,没有考虑前后音节的声学影响,导致在音节连接处出现协同发音的低质合成,这大大降低了合成语音的自然度.为解决这一问题,提出了一个根据汉语语音韵律特征的研究,通过修改音节的韵律特征参数,实现音节之间韵律特征参数波形拼接平滑过渡的算法.实验表明本方法的有效性,其语音合成的自然度更高,对...  相似文献   

3.
提出并实现了一种基于STRAIGHT模型的、合成语音质量较高的语音转换系统。一方面STRAIGHT模型可以对语音的基频、时长等参数进行较大幅度的修改而不引起合成语音质量的下降,另一方面引入“预测”谱参数的概念,利用搜索预测码书的方法进行转换,既避免了经典系统中GMM模型谱参数估计的过平滑问题,又克服了经典系统基于LPC模型合成语音时,在帧与帧连接处会产生较大脉冲波形的缺点。语谱图分析、ABX测试和MOS分评价结果表明:提出的语音转换算法在合成语音质量和目标说话人特征映射上都远远好于经典的基于LPC模型的GMM转换系统。  相似文献   

4.
提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法. 为了更准确地评估嫌疑人的
统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型
信息,降低了对嫌疑人数据量大小的需求. 与基本识别系统相比的测试结果表明,使用该算法的识别系统不但具有
更优良的识别性能和可靠性,而且提高了语音证据对判别结论的支持强度.  相似文献   

5.
基于脑电信号深度学习的情感分类   总被引:1,自引:1,他引:0  
情感脑电研究作为人工智能高级阶段的重要任务,近年来受到越来越多的关注。情感脑电分类广泛应用于人机交互、医学研究等领域。该文以轻量级的卷积神经网络为核心,设计了情感脑电分类模型,以DEAP(dataset for emotion analysis using physiologicalsignals)提供的情感脑电图数据为基础,将其中的观看视频划分为唤醒度和愉悦度2个维度。为了获得频域信息,提取了theta、alpha、beta和gamma波段的功率谱密度特征进行评估,并将功率谱密度矩阵表示为二维灰度图像。然后将该图像输入到卷积神经网络训练分类模型并完成2个维度的分类任务。实验结果表明,与传统机器学习相比,卷积神经网络具有更好的分类效果,唤醒度分类准确率达到了82.33%,愉悦度分类准确率达到了75.46%。  相似文献   

6.
知识与技能目标是水,过程与方法目标是船,情感态度与价值观目标才是要到达的彼岸.通过观察教师情感态度与价值观目标的实施情况,发现教师对情感态度与价值观目标普遍重视度不高,教师思想上不够重视,并且设置的情感态度与价值观目标操作性不强.  相似文献   

7.
情感分类是当今网络环境下的热门应用之一,其目标在于判断文本内所包含的感情色彩和观点倾向。传统的情感词典分类法在面对长度短、非正式的文本时,会遇到部分文本无法被归入任何一个分类中的问题。为解决这一难题,文章选择将监督学习思想和情感词典结合,使得原本无法分类的文本都能被标注到一个特定分类中。最终,这一方法对中文电影短评论取得了理想的效果,准确率比单纯的情感词典方法有所提高。  相似文献   

8.
提出了一种基于Pre-LN Transformer的静态多模态情感分类模型.该模型首先利用Pre-LN Transformer结构中的编码器提取评论文本中的语义特征,其中编码器的多头自注意力机制允许模型在不同的子空间内学到相关情感信息.然后根据ResNet提取评论的图像特征,在特征水平融合的基础上通过视觉方面注意力机制...  相似文献   

9.
提出在高斯混合背景模型中嵌入自联想神经网络的方法,并将它用于说话人确认. 该方法利用神经网络 和高斯混合背景模型各自的优点,以极大似然概率为训练准则,将两者作为一个整体进行训练,揭示了特征向量的 空间信息. 嵌入的神经网络起到了数据整形的作用,增强了目标说话人数据的相似性. 在背景模型和目标模型的训 练中交替更新高斯混合模型和神经网络的参数. 实验表明,采用本文提出的模型并结合TNorm方法,比基线系统 的确认率提高26%.  相似文献   

10.
阐述了一个在较强噪声环境下针对汉语非特定说话人的连续无限制语音流中检测出其中关键词语音的公交车路线查询系统.为增强其关键词语音信号提出了建立一种新的基于离散变换的语音增强算法.并对同一噪声环境下增强关键词语音信号的模型与未增强关键词语音信号的模型进行了比较,结果显示,采用增强语音信号强度的算法在提高关键词的检测率同时,有效地降低了误报率,系统的整体性能较好,具有一定的实用性.  相似文献   

11.
<正>从最根本的涵义来说,情感教育就是教师在教学过程中,在充分考虑认知的同时,充分发挥情感因素的积极作用,以完善教学目标增强教学效果.情感教育是教育过程的一部分,它关注教育过程中学生的态度、情绪、情感以及信念,促进学生的个体发展和整个社会的健康发展,促使他们对学习、生活和周围的一切产生积极的情感体验,提高学生的综合素质[1-2].  相似文献   

12.
提出了基于进化高斯混合模型(EGMM)的说话人辨认系统建模方法.EGMM在进化算法的框架下,为改善模型的泛化性能对GMM模型的结构与参数共同进行了优化.同时,系统的优化目标中引入了其他用户的区分性信息以提高其分类精度.根据GMM的特点设计了专门的遗传算子并结合GA与EP提出了一种新的混合进化算法.初步实验结果表明,EGMM方法建立的说话人模型具有更强的泛化能力.在说话人辨认实验中,较之传统的GMM方法,基于EGMM的系统的正识率提高了近3%,并且模型具有更小的平均尺寸.  相似文献   

13.
<正>1情感教育的内涵情感是客观现实与人的主观需要之间关系的一种反映,人的主观需要有正确与错误、合理与不合理之分,因而人们的情感就有一个积极与否的问题.情感教育是教育过程的一部分,是教育者依据一定的教育教学要求,通过相应的教育教学活动,促使学生的情感向积极、健康的方向发展的过程,从而促进个体全面和谐地发展.  相似文献   

14.
基于人耳听觉模型和汉语语音的短时平稳特性,提出一种鲁棒性的汉语普通话声调提取方法.采用基于人耳听觉模型的相关图来提取语音信号的基频,运用无监督的侧抑制神经网络来模拟人耳侧抑制属性进行基频检测,为了克服在低信噪比情况下侧抑制神经网络的误判问题,引入了相邻语音帧的语音基频的帧间约束.试验表明,该方法在信噪比很低的条件下,仍能较准确地识别出目标语音声调,并能在双话者同时发音的情况下实现各自的声调分离.  相似文献   

15.
通过对流行音乐情感分类方法的分析,结合音乐主旋律的音程差值所占比例的高低,提取音乐的情感信息.并以音程差统计得到的数据为依据,建立基于SVM线性核函数情感分类的数学模型.通过对MIDI音乐文件进行主音轨定位,主旋律识别和乐段分割,结合一对多思想方法构造多分类SVM分类器,从而在SVM线性核函数基础上对流行音乐情感分类进行研究.  相似文献   

16.
提出一种基于深度学习的文本情感分析方法,将整个卷积神经网络的模型作为一种自动学习器,对输入词语的预表达特征进行学习,引入深度学习领域的递归自编码作为输出层情感分类器,实现语义情感信息的深度提取.设置实验对比卷积神经网络和递归自编码模型的参数,找出了实验过程的最佳参数组合,实验对比了CNN、RSC、CNN-RSC三种不同的算法.实验结果表明:基于CNN-RSC的组合优化算法在对文本情感特征的自动学习上有着较好的效果,在准确度和训练时间以及分类性能上均优于其他两种算法.  相似文献   

17.
针对传统控制方法难以克服飞行仿真转台伺服系统中存在的摩擦等非线性干扰力矩问题,提出了一种基于大脑情感学习(brain emotional learning, BEL)模型的转台伺服系统复合控制方法. 在传统PI反馈控制器的基础上,设计了基于BEL模型的同结构系统逆模型辨识器和前馈补偿控制器. 通过在线辨识系统逆模型来学习BEL模型的节点权值. 理想转台模型的数值仿真和实际转台伺服系统的实验结果都表明:BEL模型学习能力强,能满足实时控制要求,基于BEL模型的复合控制策略能有效抑制摩擦力矩的影响,提高转台系统的跟踪性能.  相似文献   

18.
高师学生职业情感现状调查   总被引:3,自引:0,他引:3  
以海南师范大学学生为样本,通过调查问卷的方式,从高师生对职业的情感、对未来教育对象的情感和对学科的情感三个方面进行调查和分析,提出了提高学生职业情感的策略.  相似文献   

19.
EMD在说话人辨认中的应用   总被引:3,自引:1,他引:3  
提出一种基于经验模式分解的说话人辨认方法.通过对语音信号进行经验模式分解得到一系列内在模式函数,提取每一级模式函数的Mel频率倒谱系数和相邻两级模式函数差的Mel频率倒谱系数作为表征说话人的特征参数,对得到的特征参数用矢量量化进行识别.实验结果表明,方法是有效的.  相似文献   

20.
研究了基于卷积神经网络的语音情感识别算法,改进了传统卷积神经网络训练过程中的卷积核权值的更新算法,使卷积核权值的更新算法与迭代次数有关联;同时为了增加情感语音之间的特征差异性,将语音信号经过预处理后得到的梅尔频率倒谱系数特征数据矩阵进行变换,提高卷积神经网络的表达能力.实验表明,改进后的语音情感识别算法的错误识别率比传统算法的错误识别率约减少7%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号