首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 515 毫秒
1.
文本分类是自然语言处理的重要内容,而有效提取文本全局语义是成功完成分类任务的关键.为了体现卷积神经网络提取特征的非局部重要性,在模型中引入Attention机制并建立了包含4个Attention CNN层的A-CNN文本分类模型.其中,Attention CNN层中普通卷积层用于提取局部特征,Attention机制用于生成非局部相关度特征.最后,使用A-CNN模型分别在情感分析、问题分类、问题答案选择等数据集上进行了实验和对比分析.结果表明:相比于其他对比模型,A-CNN模型完成上述3个文本分类任务时的最高精度分别提高了1.9%、4.3%、0.6%,可见A-CNN模型在文本分类任务中具有较高的精度和较强的通用性.  相似文献   

2.
一种文本分类数据挖掘的技术   总被引:7,自引:0,他引:7  
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题,并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性.  相似文献   

3.
针对现有文本情感分析方法实时性不强、难以应用到大规模文本、不能同时提取文本上下文信息和局部语义特征等问题,提出一种融合双向长短期记忆(LSTM)和卷积神经网络(CNN)的混合情感分析模型通过使用双向LSTM和CNN模型对由word2vec编码得到的文本词向量进行训练,运用注意力机制将双向LSTM模型学习到的特征作用于CNN模型上,并进行特征加权,最后将双向LSTM模型和CNN模型得到的结果进行拼接,由分类器得到相应的情感分类结果在NLPCC SCDL数据集上进行实验,结果表明所提出的融合双向LSTM和CNN模型在精度、召回、f1值和准确度方面优于两个单独的模型  相似文献   

4.
提出了一种改进的局部二值模式即局部均值模式用于对静态手势进行分类. 计算不同分辨率的原始手势图像、非线性光照变化图像、高斯模糊图像和椒盐噪音图像的局部均值模式、局部二值模式和局部角相模式. 利用gentle_Adaboost 分类算法对这些算子特征进行训练和测试,实现手势分类. 文中提出的局部均值模式能充分利用区域内像素灰度值之间相关性和区别性信息进行编码,恰当地描述不同手势的特征,具有简单快速及良好的区分度等特点. 实验结果表明:与局部二值模式和局部角相模式相比,局部均值模式算子取得了更高的分类准确度.对于原始图像,该描述子的分类准确度达到95%,同时该模式对非线性光照变化和高斯模糊具有较强鲁棒性.  相似文献   

5.
设计了一种基于VSM模型的动态文本分类器,它能针对文本的不同类别建立不同的特征子空间,各特征子空间之间相互独立,同时能将文本分类中常用的2个评估指标召回率和精确率转化为正确分类率和错分率;考察了特征子空间的维数和判定界值对这2个指标的影响.该动态文本分类器能对用户输入的文本流进行动态分类.  相似文献   

6.
基本图像特征用于文本图像文种识别   总被引:2,自引:0,他引:2  
为了解决现有方法在运算速度和识别效果上的矛盾,该文将基本图像特征用于文本图像文种识别. 按照纹理分析结构方法的观点,将纹理基元划分为7 种类型,提取描述文本图像纹理基元构成以及其空间位置关系的特征,采用支持向量机对所提特征进行训练和分类,实现文字种类识别. 实验选用有质量退化的中、英、俄、日、韩、阿拉伯等10 种不同语言文字的文本图像,结果表明该算法运算速度快,有较高的识别准确率,并对图像质量退化有较好的鲁棒性.  相似文献   

7.
针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然后,基于计算收集到的新的新闻文本内容与类别之间的余弦距离,利用eClass0分类器创建和更新模糊规则的数量和属性.最后,根据模糊规则推理和余弦距离进行文本分类.实验结果表明,该方法具有较高的正确分类率,且能够自适应Web新闻文本类别的变化.  相似文献   

8.
肋骨的皮质纹理特征是判断骨折的重要依据.提出了肋骨皮质纹理特征提取与分类算法,利用Canny算子图像进行预处理,利用Gabor小波实现纹理特征提取,利用KPCA完成降维和分类.实验结果表明,该算法得到的肋骨纹理特征提取与分类,提高了肋骨骨折的诊断率.  相似文献   

9.
现有的三维卷积神经网络(Three-dimensional convolutional neural network, 3D-CNN)模型常有参数过多和特征提取不全面的情况,并且对样本标签有限问题的处理存在不足。针对样本标签有限的问题,采用生成式对抗网络模型对原始数据进行数据增强,解决了个别样本标签少导致分类模型出现过拟合的现象;针对3D-CNN网络提取特征不全面的问题,所设计高效的3D-CNN网络模型,在网络中加入纹理信息增强模型,使网络能更好地提取图像的空谱特征。实验表明,算法在小样本数据情况下比原始网络分类精度更高,能自适应提取高光谱图像的空谱联合特征。  相似文献   

10.
提出了一种基于隐含狄利克雷分布(LDA)与距离度量学习(DML)的文本分类方法,该方法利用LDA为文本建立主题模型,借助Gibbs抽样算法计算模型参数,挖掘隐藏在文本内主题与词的关系,得到文本的主题概率分布.以此主题分布作为文本的特征,利用DML方法为不同类别的文本学习马氏距离矩阵,从而较好的表达了文本之间的相似性.最后在学习到的文本间距离上,利用常用的KNN及SVM分类器进行文本分类.在经典的3个数据集中的实验结果表明,该方法提高了文本分类的准确率,并且在不同的隐含主题数目参数下能体现较好的稳定性.  相似文献   

11.
基于CNN和Bi-LSTM的脑电波情感分析   总被引:1,自引:0,他引:1  
针对目前大多数脑电波情感识别方法存在的依赖手动特征提取等问题,提出一种基于卷积神经网络(convolutional neural network,CNN)和双向长短时记忆(bidirectional long short-term memory,Bi-LSTM)网络的混合模型.首先将一维数据转换为二维数据,采用CNN提...  相似文献   

12.
本文提出了一种将特征生成和长短期记忆(long short term memory,LSTM)模型相结合的网络流量分类方法。该方法采用矩阵乘法特征生成方式,分析对比了不同特征生成方法的分类性能。通过实验比较了原数据和特征数据在分类问题上的准确性,并比较了卷积神经网络(convolutional neural network,CNN)和本文方法用于网络流分类的效果。在统计特征时采用核函数,使其可以适应LSTM输入维度,获得更佳的分类效果。对真实网络流数据的实验结果表明,本文方法在细分类中的准确度可达93.9%,而在粗分类任务中可达99.2%,其性能明显优于现有其他分类方法。  相似文献   

13.
数据建模优化在多特征提取领域应用广泛,基于统计特征和基于结构特征的识别算法需要在数学建模优化下实施,可以改变图像的输入结构,从而能够对图形的统计特征进行提取,采取网格划分方法,对图像进行划分,然后对网格内文字像素进行比对,保证文字图像能够通过细分类模式进行识别.  相似文献   

14.
针对现有预测模型不能充分提取交通流时空特征的问题,提出一种基于改进卷积神经网络(convolutional neural network,CNN)和长短时记忆(long short-term memory,LSTM)神经网络的短时交通流预测方法。首先,采用分层提取方法使设计的网络结构和一维卷积核函数自动提取交通流序列的空间特征;其次,优化LSTM网络模块来减少网络对数据的长时间依赖;最后,在端对端模型的训练过程中,引入改进后的自适应矩估计(rectified adaptive moment estimation,RAdam)优化算法,加快权重的拟合并提高网络输出的准确性和鲁棒性。实验结果表明:在工作日与周末分时段,所提出的模型相比堆栈自编码(stacked auto-encoders,SAEs)网络预测模型,性能分别提升3.55%与8.82%,运行时间分别缩减6.2%与6.9%;相比长短时记忆网络-支持向量回归(long-short term memory-support vector regression,LSTM-SVR)预测模型,性能分别提升0.29%与1.79%,运行时间分别缩减9.0%与9.7%。所提模型能够更加适用于不同时段下的短时交通流预测。  相似文献   

15.
针对当前基于深度学习的金融文本分类模型严重依赖于标记数据的问题,提出了一种基于跨领域迁移的AM-AdpGRU金融文本分类模型,通过学习相关领域数据的分类准则将其迁移到目标领域数据。AM-AdpGRU模型首先利用深度网络自适应来克服源领域和目标域之间数据分布差异导致的迁移损失,使得即使数据分布发生变化时模型也无需重构;然后利用注意力机制建立了目标域对源领域的特征选择机制,使得模型对源领域的注意力可以集中在与目标域相似性更高的部分。在公开的跨域情感评论Amazon数据集和SemEval-2017的Microblog金融数据集上进行了实验,将AM-AdpGRU模型与其他方法进行比较,结果表明AM-AdpGRU模型的分类平均准确性相对于其他模型有了显着提升。  相似文献   

16.
针对场景图像的细粒度分类任务,结合图像视觉和文本的多模态信息提出了一种基于注意力网络推理图的细粒度图像分类方法.首先提取场景图像的全局视觉特征、局部视觉特征和文本特征,把位置信息分别嵌入局部视觉特征和文本特征后拼接成新的特征,再将这个新的特征作为图结构的节点生成一个异构图;然后设计两条元路径将异构图分解成两个同构图,并...  相似文献   

17.
自然场景中文本检测易受光照、复杂背景、多语言文字、字体及尺寸等因素影响,该文提出了一种基于Itti视觉关注模型与多尺度最大稳定极值区域(maximally stable extremalregion,MSER)结合的自然场景文本检测算法.首先利用改进的Itti视觉关注模型提取文本特征图,并采用不同结合策略得到各尺度文本显著图;然后结合多尺度的MSER区域得到3种文本候选区域.根据文字与生成文本框的几何规则合并文本候选区域得到文本行;最后利用随机森林分类器除去非文本区域得到最终文本区域.实验结果表明,该方法对于自然场景图像中的文本检测具有较高的精确度和一定的鲁棒性.  相似文献   

18.
提出了一种基于三维卷积和卷积长短期记忆(convolutional long short-term memory,CLSTM)神经网络的水产养殖溶解氧预测模型。首先,将输入向量及其转置相乘形成一个单通道矩阵,把一定时间段内的单通道矩阵堆叠成一个立方体作为输入数据;然后,将输入数据进行连续两次三维卷积来细化溶解氧相关因素的特征,并删除池化层以简化计算;最后,将三维卷积抽取的特征结果输入CLSTM模型以提取时间维度的信息,在全连接层根据梯度下降算法将数据反向更新。采集湖北省襄阳市某家特种水产养殖有限公司的实际数据进行实验。结果表明:相比于传统BP神经网络模型、Conv3D、Conv2D,所提出的模型具有更快的训练收敛速度、更高的预测精度和更好的预测稳定性,可以满足实际生产的需要。  相似文献   

19.
对深度学习领域的稠密卷积网络(dense convolutional network,DenseNet)进行改进,提出了一种嵌套网络模型下的相似图像检索方法。该方法主要通过嵌入压缩和激励网络(squeeze-and-excitation network,SENet),调整原DenseNet网络结构,优化特征提取模块,从而提高图像检索的准确率。在整个深度学习的过程中,给图像特征通道设置合理的权值,抑制图像中的无效特征,能够进一步提高图像的检索速度。实验结果表明,所提算法能够加强图像有效特征的传递,无论从精度和速度方面均可得到较好的图像检索结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号