期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

魏琛陈兰岚张傲《华东理工大学学报(自然科学版)》2019,45(4)

采用脑电情感数据集SEED进行情感识别研究,旨在利用深度学习中的卷积神经网络(CNN)自动提取脑电样本的抽象特征,省去人工选择特征与降维的过程。首先,采用小波包变换(WPT)对脑电信号进行6级分解并构成二维结构样本;然后,通过改变网络深度设计了6个深度不同的CNN模型;最后,通过投票法与加权平均法建立集成模型,提高了识别精度。实验结果表明,本文方法对3种情感类别的平均分类精度达到了93.12%,能够满足情感识别的研究需求。相似文献

2.

基于卷积神经网络的大容量汉语孤立字语音识别方法

《东北师大学报(自然科学版)》2020,(2)

使用录音设备对1 605个常用汉字进行录音,得到920个孤立字发音、3 680个非特定人的语音样本库.采用语音语谱图作为汉语单字语音识别的特征,构建了6层卷积神经网络应用于模型库的语音识别.通过深度学习方法对语音样本进行了训练和识别.实验结果表明,所构造的20-40-3500结构的卷积神经网络模型对语音样本库具有最好的识别效果,对测试样本的识别率达到97.87%,对全部样本的识别率达到99.32%. 相似文献

3.

基于主辅网络特征融合的语音情感识别

《太原理工大学学报》2021,(5)

为了有效特征提取与融合提高语音情感识别率,提出了一种使用主辅网络进行深度特征融合的语音情感识别算法。首先将段特征输入BLSTM-Attention网络作为主网络,其中注意力机制能够关注语音信号中的情感信息;然后,把Mel语谱图输入CNN-GAP网络作为辅助网络,GAP可以减轻全连接层带来的过拟合;最后,将两个网络提取的深度特征以主辅网络方式进行特征融合,解决不同类型特征直接融合带来的识别结果不理想的问题。在IEMOCAP数据集上对比4种模型的实验结果表明,使用主辅网络深度特征融合的WA和UA均有不同程度的提高。相似文献

4.

基于随机森林的不平衡特征选择算法 总被引：1，自引：0，他引：1

尹华胡玉平《中山大学学报(自然科学版)》2014,(5):59-65

数据高维不平衡是当前数据挖掘的挑战。针对传统特征选择方法基于类别平衡假设,导致在不平衡数据上效果不理想的问题,利用随机森林内嵌的变量选择机制,构造了一个新的不平衡随机森林特征选择算法IBRFVS。IBRFVS在平衡的取样数据上构造多样决策树,采用交叉验证方式获取单棵决策树的特征重要性度量值。各决策树的权重和特征重要性度量的加权平均决定了最终的特征重要性序列,其中,决策树的权重由该决策树与集成预测的一致性程度决定。在UCI数据集上的随机森林超参数选择和预处理对比验证实验中显示,四种超参数K经验取值中,当K的取值为特征数的平方根时,IBRFVS性能较为稳定且优于传统特征选择算法。相似文献

5.

基于深度信念网络的语音情感识别

张丽吕军强彦刘继华《太原理工大学学报》2019,(1)

针对语音情感识别中的特征提取问题,通过多层深度信念网络(DBN)自动提取语音信号中的情感特征,把连续多帧的语音拼接在一起,形成一个高维抽象特征,将深度信念网络训练好的特征作为极限学习机(ELM)分类器的输入端,最终建立一个语音情感识别系统。实验结果表明,在CASIA情感语音数据库中,本方法优于其他情感识别方法。相似文献

6.

混合蛙跳算法神经网络及其在语音情感识别中的应用 总被引：3，自引：1，他引：2

余华黄程韦张潇丹金赟赵力《南京理工大学学报(自然科学版)》2011,35(5)

该文将混合蛙跳算法(SELA)优化方法应用于人工神经网络训练中,对6种语音情感进行了语音情感特征的分析与识别。研究了谐波噪声比特征随情感类别的变化特性。利用混合蛙跳算法训练随机产生的初始数据优化神经网络的连接权值,快速实现了网络收敛。实验比较了BP神经网络、RBF神经网络和SFLA神经网络的语音情感识别性能。结果表明,SFLA神经网络的平均识别率分别高于BP神经网络和RBF神经网络4.7%和4.3%。相似文献

7.

基于改进随机森林的火山岩测井岩性识别

下载免费PDF全文

黄安蔡文渊魏新路李瑶段高山刘迪仁《科学技术与工程》2023,23(9):3696-3704

准噶尔盆地石炭系火山岩岩性复杂,在某种岩性薄片、岩心等资料数量明显少于其他岩性时,常规方法划分岩性存在困难。为了解决上述问题,提高火山岩岩性识别精度,运用SMOTE算法增加少数岩性类别样本数量,解决数据不均衡问题；通过网格搜索和K折交叉验证法确定最优参数组合,开展基于改进随机森林的火山岩岩性识别研究。通过分析火山岩岩心、薄片、测井响应特征等资料,建立了岩性交会图版,确定了研究区对岩性敏感的测井参数重要性程度。实例资料应用表明,改进的随机森林算法有效的解决了传统随机森林算法受岩性样本类型不均衡及数据量较小的影响,火山岩岩性识别准确率由87%提升到了94%,为不均衡样本情况下火山岩岩性识别提供借鉴。相似文献

8.

非均衡数据下基于注意力网络和代价敏感学习的轨面状态识别

于惠钧张锦圣刘建华彭慈兵刘丽丽龚事引《科学技术与工程》2024,24(5):1972-1979

准确识别轨面状态,可为列车牵引/制动性能提升提供关键依据。重点针对传统代价敏感学习应用在非均衡轨面状态识别中存在的同类别样本重要性不同和多数类精度下降等问题,提出一种基于注意力网络和代价敏感学习的轨面状态识别方法。该法首先利用迁移学习思想将均衡数据集的特征迁移到非均衡轨面状态数据集,减轻少数类样本误分类影响;其次在骨干网络ResNet18中引入卷积注意力机制模块,增强网络对目标区域的特征学习能力和全局特征信息的感知性能,调整优化网络权重参数;最后构造依据轨面状态样本重要性大小的自适应加权平衡损失函数,降低决策边界对困难样本中多数类的过拟合,获得更加平滑的决策边界。非均衡数据下的实验结果表明,在3种非均衡比下,所提方法的准确率和召回率分别达到96.00%、90.67%、86.33%,与目前常用的方法Focal相比,分别提升了7.00%、2.34%、3.00%。此外,该方法在提高少数类召回率的同时可有效维持多数类的召回率,并且降低了网络训练时间成本。相似文献

9.

基于深度神经网络的语音情感识别方法

杨明极张家彬《科学技术与工程》2019,19(8)

语音情感识别是人机交互的重要方向,可广泛应用于人机交互和呼叫中心等领域,有很大应用价值。近年来,深度神经网络在识别情感方面取得了巨大成功,但现有方法对高层语音特征提取会丢失大量原始信息并且识别准确率不高,本文提出了一种新的语音情感识别方法,由卷积神经网络从原始信号中提取特征,并在其堆叠一个2层长短时记忆神经网络,最终识别准确率达到91.74%,本文方法显著优于基于EMO-DB数据集等其他方法。相似文献

10.

基于CGRU模型的语音情感识别研究与实现

郑艳陈家楠吴凡付彬《东北大学学报(自然科学版)》2020,41(12):1680-1685

语音情感识别是人机交互、情感计算中重要的研究方向.目前普遍使用深度神经网络用于语音情感特征的提取，但使用哪种神经网络模型、如何缓解模型过拟合问题还需进一步研究.针对这些问题，提出了一种结合一维卷积(CNN)以及门控循环单元(GRU)的CGRU模型，从原始语音信号的MFCC特征中提取语音的低阶以及高阶情感特征，并通过随机森林对其进行特征选择，在三种公用的情感语料库EMODB，SAVEE，RAVDESS上分别取得了79%，69%以及75%的识别精度.通过添加高斯噪声及改变速度等方法来增加样本量实现数据扩充，进一步提高了识别精度.通过在线识别系统验证了模型在实际环境中的可用性. 相似文献

11.

基于两层迁移卷积神经网络的抽象图像情感识别

《中国科学技术大学学报》2019,(1)

为弥合抽象图像底层视觉特征与高层情感语义间的鸿沟,同时缓解抽象图像情感识别所固有的小样本缺陷,将两层迁移学习策略引入传统的卷积神经网络,提出一种基于两层迁移卷积神经网络的抽象图像情感识别模型.该模型利用深度特征的层次性,首先通过大规模通用图像数据集来学习提取普适的底层图像特征;然后利用抽象图像风格分类数据集来学习提取抽象图像的专有高层语义特征;最后采用抽象图像情感识别数据集来微调整个网络.MART数据集上的实验结果表明,与传统的抽象图像情感识别方法相比,所提出的模型能够有效地提高识别精度. 相似文献

12.

基于语料库的语音情感识别的性别差异研究

曹欣怡李鹤王蔚《南京大学学报(自然科学版)》2019,(5)

性别是语音情感识别中重要的影响因素之一.用机器学习方法和情感语音数据库对语音情感识别的性别差异进行探究,并进一步从声学特征的角度分析了性别影响因素.在两个英文情感数据集以及它们的融合数据集上进行实验,分别用三种分类器对男女语音情感进行识别,并用注意力机制挑选出在男女语音情感识别中的重要特征并比较其差异.结果表明,女性语音的情感识别率高于男性.梅尔倒谱系数、振幅微扰、频谱斜率等频谱特征在男女语音的情感识别中的重要性差异较大. 相似文献

13.

基于色彩空间和深度残差网络ResNet-50的复杂岩性油气藏岩石样本智能分类及识别

刘今子杜文颖董驰秦志清杨楠廖恩浩《科学技术与工程》2023,23(29):12628-12637

岩石样本的分类识别是油气和矿产资源勘探中的重要环节。目前,仍然以人工识别的实验方法作为主要方法,普遍存在主观性强、周期长、成本高等典型问题。机器学习的分类算法在图像分类领域已经得到广泛应用,然而由于岩石样本图像具有明显的差异性特征,甚至同类岩石样本图像也具有一定的色差,直接应用现成智能算法进行分类,验证集的准确度仅为85%左右。所以,基于色彩空间下岩石样本图像的颜色特征曲线,提出了一种基于颜色类别和深度残差网络ResNet-50的智能分类及识别方法。首先,以7种不同岩性的岩石图像为样本,提取样本的RGB颜色特征,应用无监督K-means聚类算法,按颜色分为3个大类,再通过有监督精细K-近邻(K-nearest neighbor, KNN)算法对颜色类别进行验证,平均分类精度为99%。然后,对于不同颜色类别下的岩石样本,利用深度残差网络ResNet-50进行分类识别。结果表明,不同颜色类别的岩石样本平均训练精度为93.15%,验证精度为88.21%,可以作为岩石样本分类的有效方法。相似文献

14.

基于特征类内紧凑性的不平衡医学图像分类方法

孟元张轶哲张功萱宋辉《南京大学学报(自然科学版)》2023,(4):580-589

近些年,基于深度学习的算法和模型在各种图像分析任务中都取得了显著的成功,与常见的自然图像相比,医学图像数据集依然面临高度不平衡的问题,不平衡数据会导致特征空间里的决策边缘倾向样本多的类别,导致分类效果的下降.为了解决该问题,提出一种基于卷积神经网络考虑特征类内紧凑性的不平衡医学图像分类方法（Z-Score Compactness-based Convolutional Neural Network,ZC3NC）.首先,从一个卷积神经网络的最后一层卷积层提取训练集样本与测试集样本的特征图,随后引入一个新的Z分数来度量测试集数据的特征图相对训练集每个类在特征空间上的偏离度,偏离度的度量基于类内的紧凑度,其主要关注样本的分布特性,对各类样本数量的不平衡性不敏感.最终,根据计算的偏离度,对测试集的数据进行分类.在DermaMNIST数据集上的实验表明,在不对数据和神经网络模型做任何额外增强的情况下,该方法的平衡准确率比原卷积神经网络模型平均提高11.15%,最多提高14.08%,证明提出的分类方法能有效地提高多种卷积神经网络对不平衡医学图像数据的分类性能.此外,和最先进的不平衡分类方法 Und... 相似文献

15.

基于增量方法的卷积语音情感识别网络

下载免费PDF全文

朱永华冯天宇张美贤张文俊《上海大学学报(自然科学版)》2023,29(1):24-40

提出了一种新颖的语音情感识别结构,从声音文件中提取梅尔频率倒谱系数(Melscale frequency cepstral coefficients,MFCCs)、线性预测倒谱系数(linear predictive cepstral coefficients,LPCCs)、色度图、梅尔尺度频谱图、Tonnetz表示和频谱对比度特征,并将其作为一维卷积神经网络(convolutional neural network,CNN)的输入.构建由一维卷积层、Dropout层、批标准化层、权重池化层、全连接层和激活层组成的网络,并使用Ryerson情感说话/歌唱视听(Ryerson audio-visual database of emotional speech and song,RAVDESS)数据集、柏林语音数据集(Berlin emotional database,EMO-DB)、交互式情绪二元运动捕捉(interactive emotional dyadic motion capture,IEMOCAP)数据集这3个数据集的样本来识别情感.为提高分类精度,利用增量方法修改初始模型.为... 相似文献

16.

基于韵律语段的语音情感识别方法研究 总被引：2，自引：0，他引：2

韩文静李海峰《清华大学学报(自然科学版)》2009,(Z1)

语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别率达到67.9%,与使用定长语段特征相比有了很大的提高。相似文献

17.

一种基于彩票迁移的稀疏网络植株病虫害识别模型

张旭陈志奎李秋岑李朋高静《重庆大学学报(自然科学版)》2022,45(11):108-116

植株病虫害的识别能够有效地提高农作物产量,当前数据驱动的深度植株病虫害识别方法需要大量的有标签数据,导致现有方法难以很好地识别少样本的新病虫。且基于深度学习的方法需要对大量的参数进行训练,难以削减计算开销。研究设计一种基于彩票迁移的稀疏网络植株病虫害识别模型:定义深度网络的彩票迁移假设,利用压缩策略构建稀疏网络,识别迁移源域的本质知识,提高深度网络的迁移效率;然后,设计深度彩票迁移算法,训练植株病虫害深度识别模型,解决少样本病虫识别调整;最后,在典型的通用数据与植株病虫害识别数据集上,验证基于彩票迁移的深度植株病虫害识别模型能高效迁移源域的本质知识。在PlantVillage数据集上,对植株病虫害识别准确率为97.69%,且所需训练的参数只有原始网络的约30%。相似文献

18.

基于时空特征融合的语音情感识别

彭涛郑传锟张自力刘军平胡新荣何儒汉《郑州大学学报(理学版)》2022,(4):42-48

语音情感识别在人机交互中有重要的作用。在语音情感识别领域中,通常使用迁移学习解决语音情感数据难获取的问题,但忽略了语音数据的时序信息和空间信息。考虑到AlexNet网络中的参数来自图像数据集,不能完全表现语音数据的空间信息,并且不包含时序信息,因此提出通过膨胀卷积网络提取语音频谱图的空间信息,添加双向长短期记忆神经网络提取时序信息,并进行时空特征融合;针对语音中含有大量与情感无关的特征,通过将对数梅尔频谱图的三个通道作为输入,减少情感无关因素的影响,并添加注意力机制,选取情感权重大的时域信号。用公开数据集实验证明了方法的有效性,在WAR和UAR上都有提升。相似文献

19.

深度残差网络和LSTM结合的图像序列表情识别

马玉环张瑞军武晨屈军锁《重庆邮电大学学报(自然科学版)》2020,32(5):874-883

为了改善图像表情和图像序列表情识别效果,针对传统表情识别特征提取复杂和效果不理想问题,提出了一种深度残差网络和局部二值模式(local binary patterns,LBP)相结合的特征提取方法,利用深度残差网络提取数据集的空域特征,长短期记忆网络(long short-term memory,LSTM)处理时域特征,实现空域与时域特征的结合。研究了不同层数的残差网络、不同形式的LBP算子以及其他网络结构对人脸表情识别的影响,对比了支持向量机和随机森林实现的序列表情识别算法。在Cohn-Kanade数据集和AFEW6.0数据集上进行了验证,实验结果表明,算法在验证集上的准确率分别为73.1%和58.4%,相比其他算法有一定程度的提升。相似文献

20.

基于多维缩放和随机森林的轴承故障诊断方法

张西宁张雯雯周融通余迪《西安交通大学学报》2019,(8)

为快速准确识别轴承的运行状态,提出了一种基于多维缩放和随机森林的轴承故障诊断方法。该方法采用函数型数据分析,得到轴承振动信号自相关函数的拟合系数,构造故障特征集;使用网格搜索法优化随机森林参数,得到特征重要性排序;然后使用多维缩放方法对特征选择后的故障特征集进行降维;最后采用随机森林对降维后的故障特征进行诊断识别。为验证所提方法的有效性,开展了正常、内圈故障、外圈故障、滚子故障状态下的轴承振动实验,结果表明,函数型数据分析的特征提取方式能有效表征不同状态轴承振动信号的不同特征,与t分布随机邻域嵌入和主分量分析方法相比,多维缩放方法具有更高的类间距和类内距的比值,且优势明显,各类状态的诊断准确率均高达100%,较使用原始特征集的随机森林平均准确率提高了5%。相似文献