首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
对上海中小学教材德目教育文本分类进行研究,提出了基于转换器的双向编码表征(BERT)预训练模型、双向长短期记忆(BiLSTM)网络和注意力机制的模型IoMET_BBA. 通过合成少数类过采样技术(SMOTE)与探索性数据分析(EDA)技术进行数据增强,使用BERT模型生成富含语境信息的语义向量,通过BiLSTM提取特征,并结合注意力机制来获得词语权重信息,通过全连接层进行分类. 对比实验的结果表明,IoMET_BBA的F1度量值达到了86.14%,优于其他模型,可以精确地评估教材德目教育文本.  相似文献   

2.
为实现对制动噪声的智能化识别,研究了一种小波散射结合深度序列神经网络的识别方法。采用3层小波散射变换构造出制动噪声相应卡钳振动信号的小波散射多维特征向量。首先,以单层一维卷积神经网络(1DCNN)和单层双向长短时记忆网络(BiLSTM)为基础,将小波散射特征以序列形式和分别输入方式进行训练和测试;结果显示,与短时能量和短时平均过零率这类一维序列输入相比,小波散射变换多维特征输入能够大幅提高分类准确率。其次,针对网络欠拟合状况,建立的4层深度1DCNN与3层深度BiLSTM网络相比,其基础网络具有更强的特征捕捉能力,均进一步提高了制动噪声分类准确率。根据分类性能指标F1,4层1DCNN的整体性能均超过3层BiLSTM网络,并且具有训练参数数量较少的优越性。  相似文献   

3.
近年来,网络安全问题层出不穷,其中僵尸网络是造成网络瘫痪的重要原因之一。僵 尸网络利用域名生成算法(DGA)生成大量恶意域名进行网络攻击,对网络安全造成威胁。现有的 DGA域名主要分为字典型和字符型,传统的深度学习方法无法同时检测出两种类型的DGA域名, 尤其是无法检测出基于字典的DGA域名。针对这个问题,本文提出了改进的CNN-LSTM的DGA 域名检测算法,该算法融合了卷积神经网络(CNN)、注意力机制和双向长短时记忆网络(BiLSTM), 可以同时检测出两种类型的DGA域名。最后进行了不同算法的对比实验,实验结果表明,与其他 深度学习模型相比,该算法提高了DGA域名的二分类和多分类的准确率和F1值。在多分类实验 中,通过改进损失函数,提高了小样本数据的域名检测率。  相似文献   

4.
杨磊  赵红东 《科学技术与工程》2020,20(33):13757-13761
环境声音识别(Eenvironment Ssound Rrecognition ,ESR)在基于情景感知和辅助技术等领域发挥着重要作用。卷积神经网络(CNN)和循环神经网络(RNN)作为两种最具代表性的特征提取方法,在语音和音乐信号处理方面都取得显著效果,然而二者都存在一定缺点,CNN无法有效提取时间特征,RNN在提取空间特征上也存在明显劣势。为了有效的提取并利用时间特征和空间特征,提出一种新模型,利用时间分布卷积神经网络(CNN)从梅尔频谱图中提取城市环境声音特征,然后应用双向长短时记忆网络(BiLSTM)从CNN输出中获取时间信息,最后在BRNN的输出序列上实施注意力机制,从而关注到与城市环境声音最相关的特征进而做出分类判断,注意力机制既提高了分类准确性,又增强了模型的可解释性。实验结果表明,在Urbansound8K数据集中,该模型可获得80.2%的分类准确率,这优于以前在同一数据集的报告结果  相似文献   

5.
为解决单一的卷积神经网络(CNN)缺乏利用时序信息与单一循环神经网络(RNN)对局部信息把握不全问题,提出了融合注意力机制与时空网络的深度学习模型(CLA-net)的人体行为识别方法。首先,通过CNN的强学习能力提取局部特征;其次,利用长短时记忆网络(LSTM)提取时序信息;再次,运用注意力机制获取并优化最重要的特征;最后使用softmax分类器对识别结果进行分类。仿真实验结果表明,CLA-net模型在UCI HAR和DaLiAc数据集上的准确率分别达到95.35%、99.43%,F1值分别达到95.35%、99.43%,均优于对比实验模型,有效提高了识别精度。  相似文献   

6.
现有短文本匹配方法更多关注于句子之间的交互方式,而较少考虑短文本自身关键特征的提取,为此本文提出一个融合自注意力机制和双向长短期记忆网络(BiLSTM)的短文本匹配模型。首先利用BiLSTM和自注意力机制进行特征编码,通过残差连接缓解信息丢失问题;然后利用双向注意力网络进行特征交叉,得到考虑了两个短文本之间交互影响的编码形式;最后将自注意力编码与双向注意力编码进行拼接,既能保留句子本身的重要特征,又能得到交互的特征信息。在两个公开数据集Quora和MRPC上进行对比实验,结果表明,该模型能有效改善短文本匹配性能,特别是在Quora数据集上的准确率达到87.59%,明显优于其他6种常见的同类模型。  相似文献   

7.
针对传统关系抽取模型依赖特征工程等机器学习方法, 存在准确率较低且规则较繁琐等问题, 提出一种BERT+BiLSTM+CRF方法. 首先使用BERT(bidirectional encoder representations from transformers)对语料进行预训练; 然后利用BERT根据上下文特征动态生成词向量的特点, 将生成的词向量通过双向长短期记忆网络(BiLSTM)编码; 最后输入到条件随机场(CRF)层完成对因果关系的抽取. 实验结果表明, 该模型在SemEval-CE数据集上准确率比BiLSTM+CRF+self-ATT模型提高了0.054 1, 从而提高了深度学习方法在因果关系抽取任务中的性能.  相似文献   

8.
为实现IFC构件精确、高效分类,提出一种改进的多视图卷积神经网络(Multi-view Convolutional Neural Network, MVCNN)模型,该模型引入了自注意力模块和长短期记忆(Long Short-term Memory,LSTM)网络,针对MVCNN模型特征融合的局限性,设计了LSTM_ATT模块;通过对各视图数据特征关系的自适应调整,并结合注意力权重对输入的各视图数据进行融合,得到一个更具辨识性的3D形状描述符,从而提高模型对各相似IFC构件的分类检测性能. 使用IFCNet数据集对建筑领域20个主要类别的IFC构件进行训练并在测试集上对改进MVCNN模型与MVCNN模型进行实验对比. 实验结果表明,改进模型的分类准确率和F1值分别达到了88.27%、86.72%,相比改进前准确率提高了9.46%,对相似构件之间的分类识别效果明显.  相似文献   

9.
藏文分词是实现藏文语音合成和藏文语音识别的关键技术之一。提出一种基于双向长短时记忆网络加条件随机场(bidirectional long-short-term memory with conditional random field model, BiLSTM_CRF)模型的藏文分词方法。对手工分词的语料经过词向量训练后输入到双向长短时记忆网络(bidirectional long-short-term memory, BiLSTM)中,将前向长短时记忆网络(long-short-term memory, LSTM)和后向LSTM学习到的过去输入特征和未来输入特征相加,传入到线性层和softmax层进行非线性操作得到粗预测信息,再利用条件随机场(conditional random field, CRF)模型进行约束性修正,得到一个利用词向量和CRF模型优化的藏文分词模型。实验结果表明,基于BiLSTM_CRF模型的藏文分词方法可取得较好的分词效果,分词准确率可达94.33%,召回率为93.89%,F值为94.11%。  相似文献   

10.
针对微博谣言带标签数据不足,且当下的谣言检测模型无法持续学习应对不断变化的微博网络语言等问题,本文提出BERT-BiLSTM-LML微博谣言持续检测模型.首先,使用BERT(Bidirectional Encoder Representations from Transformers)预训练模型提取两个任务输入文本数据的词向量;其次,使用双向长短时记忆(Bi-directional Long Short-Term Memory, BiLSTM)网络充分提取文本的上下文特征;最后,基于BiLSTM深层特征使用终身监督学习算法ELLA(Efficient Lifelong Learning Algorithm)对两个任务的特征数据进行建模,以实现对微博谣言的持续检测.实验结果表明:BERT词向量有效优化了模型性能,比基于Word2vec词向量的Word2vec-BiLSTM-LML模型在准确率和F1值都提升了5.5%.相较于独立学习,在持续学习争议检测任务后,模型的谣言检测准确率提升了1.7%,F1值提升了1.8%.同时,在持续学习过程中,随着知识的积累,谣言检测准确率持续提升.最终在公开...  相似文献   

11.
比较分析了等级列举式分类法、分面组配式分类法的结构原理、体系结构、类号组合、检索效率、功能作用、主要特点等方面, 从而得出分面组配法是现代分类法的发展方向。  相似文献   

12.
文中提出的分类法根据全球大气环流形势及其季节变化把全球气候划分为 5个气候带 :热带、副热带、温带、副极地带和极地带 ;除了极地带外的每一个气候带再划分为 4个气候型 :海洋性气候、过渡性气候、大陆性气候和高地气候 ;每一个气候型由若干个气候副型组成 .极地带根据其最暖月气温划分为两个气候型 .最后设计湿润指数 I =P/ ( EP.S)和第三个字母进行第三级划分  相似文献   

13.
通过对体育教学方法体系的演变过程进行回顾与分析,依照教学方法在体育教学活动中的实际情况,将体育教学方法分为3个层次:作为教学指导思想的教学方法;作为教学程序和操作步骤的教学方法;作为教学方式、手段的教学方法.并对其层次关系进行了解析,提出体育教学方法的应用原则并对其进行分类.  相似文献   

14.
均匀分类DHNN的分类对称性   总被引:1,自引:0,他引:1  
用对称性的观点,对均匀分类网络的分类表进行深入地研究,提出把吸引子间的Hamming距离转换成欧几里德空间两个点的距离的方法,并由此建立了一个能够描述网络的吸收子间相互关系的几何图一网络的吸引子图;借助网络吸引子图的对称性可以寻找能同时存储在一个均匀分类网络中且具有相同吸引域的模式矢量集。  相似文献   

15.
随着数据存储规模的海量增长,降低存储系统的总拥有成本,提高数据访问效率是海量数据分级存储系统的关键.在分析了两种典型的数据分级算法后,结合两种算法的优点对算法进行了改良,提出了基于数据访问频率和数据设备依赖度的自动分级算法,实验结果验证了算法的有效性和数据分级算法具有较高的准确率.  相似文献   

16.
基于改进分类模型的文本分类系统实现   总被引:1,自引:0,他引:1  
提出一种基于改进的分类模型的文本分类系统来实现文本的自动分类.针对传统的特征提取算法不能很好区分特征词在类内和类间分布情况的缺陷,该系统利用方差对该算法作了改进,用改进的特征提取算法量化各个特征词的权重,为了降低特征向量的维数,采用为每个类建分类器的分类模型,利用遗传算法来修正各个类特征词的权重,直到为每个类训练出能够代表本类的特征向量,最后用这些类的特征向量进行分类.通过在同一数据集上进行对比实验,说明本文提出的改进分类模型的文本分类系统是正确可行的.  相似文献   

17.
基于一类分类方法的多类分类及其应用   总被引:1,自引:0,他引:1  
在分析一种非线性数据处理新方法的核心概念基础上,研究了基于一类分类方法的多类分类基本原理,提出了应用于多类分类的可信度函数,使聚类与分类的结果更具有可信度.最后,以某企业对供应商关系的调查数据为例,将这种方法应用于企业商业关系网络分析中.结果表明了该方法的有效性.  相似文献   

18.
在定义了L-拓扑空间同胚映射的基础上,给出了L-区间的定义,并进行了分类。  相似文献   

19.
基于区域特征的图像分类技术   总被引:3,自引:0,他引:3  
为解决自然图像的对象分类问题,提出了一种新的区域特征提取和表示方法. 该方法采用六边形近似区域边界,使用六边形的边长比和角度表示区域的形状特征,并采用简化的SIFT描述子描述区域的外貌特征. 将这种区域特征矢量量化后形成码书,用于基于特征包的识别模型,完成分类任务. 用PASCAL2007视觉竞赛数据集作为测试数据集,获得了较好的分类效果,结果表明,该区域特征表示法综合了外貌特征和形状特征,具有较高的分辨性能,同时还具有描述简洁、通用性强的特点.  相似文献   

20.
基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法.根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词,利用获得的初始主题词构建中文新闻信息分类与代码体系的特征向量,将文本按该体系进行自动分类,分类结果采用人工抽样分析,一级类目的正确率为72%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号