首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 625 毫秒
1.
当前,情感识别已经成为情感计算中一个重要研究问题。传统的情感识别方法有人工神经网络(ANN)的 情感识别、模糊集的情感识别、支持向量机的情感识别和隐马尔可夫模型(HMM)的情感识别等。将选择性集成的 方法应用到情感识别中,该方法通过训练数据集的随机数抽取、训练,得到一批候选分类器,并通过差异性计算,挑选出大于平均差异性水平的分类器用来做最终情感识别。实验表明,该方法比传统的识别方法以及bagging集成 方法的效果都好,能有效地提高情感识别的精度。  相似文献   

2.
机器翻译自动评价中领域知识复述抽取研究   总被引:2,自引:0,他引:2  
针对通用领域语料中抽取的复述在特定领域机器译文自动评价任务的应用中容易出现复述匹配偏差的问题,提出采用抽取与测试领域相关的复述来提高机器译文自动评价的方法。首先将通用单语训练语料进行聚类,并利用改进的M-L方法过滤,得到特定领域训练语料,然后在训练语料中利用Markov网络模型,抽取特定领域复述表,最后将此复述表应用在机器译文自动评价中,以提高同义词和近义词的匹配精度。在WMT’14 Metrics task和WMT’15 Metrics task数据集上的实验结果表明,利用领域知识抽取的复述能够增加自动评价方法METEOR和TER与人工评价的相关性。  相似文献   

3.
中医古文献蕴藏着丰富的临床经验,是古代中医在行医过程中对临床诊疗的经验性总结,体现了中医学形成和发展的理论框架和思想基础.然而这些宝贵的临床经验不仅量大,而且分散在不同的文献中,使得中医从业者手工很难快速全面地获取它们,文献检索工具也只能提供文档级别的信息筛选,无法为这种细粒度的信息获取提供支持.此外,古汉语相对于现代汉语的不同特点也限制了主流文本分析工具的使用效果.为此本文提出面向临床经验获取的中医古文献信息抽取任务,用于识别古文献中描述临床经验的文本片段,手工标注了样本数据用于这种抽取模型的训练和测试,并设计了基于深度学习的序列标注器用于完成该任务.考虑到标注数据量小可能带来的过度拟合问题,本文引入对抗训练和虚拟对抗训练来增强模型的泛化能力.一系列充分的实验验证了模型的有效性,表明利用信息抽取技术从古文献获取中医临床经验具有可行性,为这一新的信息抽取任务提供了有希望的研究基线和可复用的标注数据集.  相似文献   

4.
由粗定位到精提取的图像显著区域检测   总被引:1,自引:1,他引:0  
图像显著区域检测旨在找出最具信息性的图像,将该任务归纳为一种由粗定位到精提取的处理过程。首先,将图像过分割为超像素,并根据其颜色差异、分形差异及空间分布求得一个表征超像素间相似性的矩阵。依据这个矩阵,利用相似传播算法对超像素聚类;并通过度量类间颜色对比度、类的结构紧凑度与偏离中心度评价每类的显著度。然后,通过比较像素与每类的颜色差异及位置关系更新像素的显著度,最终得到像素精度的、全分辨率的显著性图。对当前流行数据库的实验测试表明,算法具有令人满意的检测效果。  相似文献   

5.
针对双关语样本短缺问题,研究提出了基于伪标签和迁移学习的双关语识别模型(pun detection based on Pseudo-label and transfer learning)。该模型利用上下文语义、音素向量和注意力机制生成伪标签;然后,迁移学习和置信度结合挑选可用的伪标签;最后,将伪标签数据和真实数据混合到网络中进行训练,重复伪标签标记和混合训练过程。一定程度上解决了双关语样本量少且获取困难的问题。使用该模型在SemEval 2017 shared task 7以及Pun of the Day数据集上进行双关语检测实验,结果表明模型性能均优于现有主流双关语识别方法。  相似文献   

6.
By combining multiple weak learners with concept drift in the classification of big data stream learning, the ensemble learning can achieve better generalization performance than the single learning approach. In this paper,we present an efficient classifier using the online bagging ensemble method for big data stream learning. In this classifier, we introduce an efficient online resampling mechanism on the training instances, and use a robust coding method based on error-correcting output codes. This is done in order to reduce the effects of correlations between the classifiers and increase the diversity of the ensemble. A dynamic updating model based on classification performance is adopted to reduce the unnecessary updating operations and improve the efficiency of learning.We implement a parallel version of EoBag, which runs faster than the serial version, and results indicate that the classification performance is almost the same as the serial one. Finally, we compare the performance of classification and the usage of resources with other state-of-the-art algorithms using the artificial and the actual data sets, respectively. Results show that the proposed algorithm can obtain better accuracy and more feasible usage of resources for the classification of big data stream.  相似文献   

7.
谐波电流检测的实时性和准确度直接影响有源电力滤波器的谐波补偿效果.针对基于传统神经网络谐波检测方法的不足,提出了一种基于极限学习机的谐波电流检测新方法.首先详细给出了极限学习机的训练样本的组成和训练方法,然后构造检测模型实现对谐波电流幅值和相位的检测.仿真结果表明,该谐波电流检测方法的检测精度普遍达到10-6,在有白噪声影响的情况下检测精度达到10-4,与基于传统神经网络的谐波检测方法相比具有更高的检测精度和更强的泛化能力,更加适用于谐波源固定的场合.  相似文献   

8.
Event extraction is an important research point in information extraction, which includes two important sub-tasks of event type recognition and event argument recognition. This paper describes a method based on automatic expansion of the event triggers for event type recognition. The event triggers are first extended through a thesaurus to enable the extraction of the candidate events and their candidate types. Then, a binary classification method is used to recognize the candidate event types. This method effectively improves the unbalanced data problem in training models and the data sparseness problem with a small corpus. Evaluations on the ACE2005 dataset give a final F-score of 61.24%, which outperforms traditional methods based on pure machine learning.  相似文献   

9.
目前现有的基于图像的车辆检测系统大多数是利用滑动窗口法来确定车辆候选区域.为了提高车辆检测的速度并减少计算量,提出了一种新的基于图论的车辆检测方法.该方法针对每幅图像通过简单线性迭代聚类(SLIC)算法得到含有若干个超像素节点的图像,分析节点间的相互关系最终确定车辆候选区域.在检测阶段,本文把大量不同视角的车辆图片作为正样本进行训练,得到多视角的分类器;基于候选区域的几何信息,选择适当的多视角分类器进行检测.由公共交通分析数据集(KITTI)检测结果表明:与目前最新的、具有相同提取特征和分类器的算法相比,本文的方法具有更好的检测精度,在复杂的背景下也能取得很好的检测结果.  相似文献   

10.
Extracting and analyzing network traffic feature is fundamental in the design and implementation of network behavior anomaly detection methods. The traditional network traffic feature method focuses on the statistical features of traffic volume. However, this approach is not sufficient to reflect the communication pattern features. A different approach is required to detect anomalous behaviors that do not exhibit traffic volume changes,such as low-intensity anomalous behaviors caused by Denial of Service/Distributed Denial of Service(Do S/DDo S)attacks, Internet worms and scanning, and Bot Nets. We propose an efficient traffic feature extraction architecture based on our proposed approach, which combines the benefit of traffic volume features and network communication pattern features. This method can detect low-intensity anomalous network behaviors and conventional traffic volume anomalies. We implemented our approach on Spark Streaming and validated our feature set using labelled real-world dataset collected from the Sichuan University campus network. Our results demonstrate that the traffic feature extraction approach is efficient in detecting both traffic variations and communication structure changes.Based on our evaluation of the MIT-DRAPA dataset, the same detection approach utilizes traffic volume features with detection precision of 82.3% and communication pattern features with detection precision of 89.9%. Our proposed feature set improves precision by 94%.  相似文献   

11.
图像情感分布学习可以对多种情绪同时进行建模,但现有的模型缺乏有效的方法直接考虑情绪之间的相关性.针对这一问题,该文提出一种基于情感轮和多任务卷积神经网络(EW-MTCNN)的图像情感分布学习模型,通过先验知识模块将心理学情感知识直接引入到深度神经网络中.基于Mikel's情感轮定义成对情绪之间的相关性,EW-MTCNN模型采用多任务卷积神经网络学习情绪之间的相关性信息,同时优化情感分布预测和情绪分类任务.EW-MTCNN模型由3个模块组成,3个模块分别是图像特征提取层、情感轮先验知识层和多任务损失层.在情感分布数据集(Emotion6)和单标签数据集(Artphoto)上进行对比实验的结果表明:EW-MTCNN模型在情感分布预测与情绪分类任务上比其他情感分布学习方法具有更优的性能.  相似文献   

12.
目前事件检测方法往往将句中事件视为独立个体,忽视了句子或文档内事件间的相关关系,且某些触发词在不同语境下可能触发不同事件,而多种语境下训练的词向量会引入与当前语境无语义关联的噪声.针对此问题,本文提出一种融合多级语义特征的双通道GAN事件检测方法,使用多级门限注意力机制获取句子级和文档级事件间的语义相关性,并利用双通道GAN及其自调节学习能力减轻噪声信息的影响,进而提高事件特征表示的准确性.在公开数据ACE2005英文语料上进行实验,F1值达到了77%,结果表明该方法能够有效获取事件间的语义相关性,并提高语境判定的准确性.   相似文献   

13.
Network texts have become important carriers of cybersecurity information on the Internet. These texts include the latest security events such as vulnerability exploitations, attack discoveries, advanced persistent threats,and so on. Extracting cybersecurity entities from these unstructured texts is a critical and fundamental task in many cybersecurity applications. However, most Named Entity Recognition(NER) models are suitable only for general fields, and there has been little research focusing on cybersecurity entity extraction in the security domain. To this end, in this paper, we propose a novel cybersecurity entity identification model based on Bidirectional Long Short-Term Memory with Conditional Random Fields(Bi-LSTM with CRF) to extract security-related concepts and entities from unstructured text. This model, which we have named XBi LSTM-CRF, consists of a word-embedding layer, a bidirectional LSTM layer, and a CRF layer, and concatenates X input with bidirectional LSTM output. Via extensive experiments on an open-source dataset containing an office security bulletin, security blogs, and the Common Vulnerabilities and Exposures list, we demonstrate that XBi LSTM-CRF achieves better cybersecurity entity extraction than state-of-the-art models.  相似文献   

14.
一种网络入侵检测特征提取方法   总被引:2,自引:0,他引:2  
为了去除冗余特征,降低系统存储和运算负担,提高网络入侵检测分类器的性能,文中提出了一种基于Fisher分和支持向量机的网络入侵检测特征提取方法.针对KDD′99网络入侵检测数据集,应用该方法得到了混合攻击和4种单一攻击模式下的特征重要度排序,选取重要特征建立支持向量机入侵检测分类器.结果表明,该分类器精度与使用全部特征构建的支持向量机分类器相当,训练和测试时间则显著降低.  相似文献   

15.
基于NDVI时间序列数据的土地覆盖变化检测指标设计   总被引:11,自引:0,他引:11  
大中尺度土地覆盖格局及其变化检测是研究全球变化和能量平衡的重要内容.NDVI时间序列数据在土地覆盖变化动态遥感监测中占据着重要地位.针对NDVI时间序列数据,现有的土地覆盖变化检测方法和指标存在许多不足之处.本文在分析现有土地覆盖变化检测指标的基础上,设计了一个新的基于交叉相关光谱匹配(CCSM)和兰氏距离的变化检测指标.该指标充分考虑了NDVI时间序列曲线形状和数值两个变化特征.理论与实例检验结果表明本文设计的指标能够较好的抑制各种干扰噪音的影响,正确检测真实的土地覆盖变化,是一种较为理想的检测指标.  相似文献   

16.
在网络入侵检测中,样本数据的特征维数较高,而冗余特征的存在使系统的存储负担加重,分类器性能降低。本文提出一种基于Fisher Score和SVM的特征重要性度量和提取方法,针对KDD'99网络入侵检测数据集,应用该方法得到了混合攻击和单一攻击模式下的特征重要度排序,选取重要特征建立SVM入侵检测分类器,结果表明分类器精度与使用全部特征构建的SVM分类器相当,训练和测试时间有显著降低。  相似文献   

17.
针对基于传统机器学习方法设计的DR胸片肺结核检测器存在着泛化能力不强,实际检测精度低等问题,提出了一种基于Focal Loss的深度学习检测方法Tuberculosis Neural Net(TBNN).医学图像的特殊性,存在带标注的数据量小导致无法充分训练深层网络模型等问题.该方法利用肺炎和肺结核同为呼吸道感染疾病且在DR胸片上有相似表征的特点,基于迁移学习原理训练特征提取子网络,减少肺结核胸片样本不足对模型训练造成的影响.首先在大型的肺炎胸片数据集上训练特征提取网络,以获取DR图像中丰富的深层图像语义信息,然后使用样本较少的肺结核数据集微调网络参数,并将多层卷积的输出作为TBNN分类子网络的输入,得到基于DR胸片的肺结核病灶检测模型.实验结果表明,该方法生成的检测模型在分类精度和性能上均优于基于传统机器学习的肺结核检测器.在同等训练数据量和训练周期下,模型性能高于其他采用传统数据增强方法的深层网络肺结核检测算法,且能标识病灶区域,准度上有不低于放射科阅片医生的表现.  相似文献   

18.
提出了一种面向情绪分类的融合词内部信息和情绪标签的词向量学习方法。在CBOW模型的基础上,引入词内部成分和情绪标签信息,以适应微博情绪表达的不规范,同时丰富词向量的情绪语义。对于输入文本,按照词的TF-IDF权重对词向量进行加权求和,以作为文本向量表示。以上述词向量或文本向量作为情绪分类器的输入,采用机器学习的分类方法(LR、SVM、CNN),验证本文情绪词向量在情绪分类任务上的实验效果。实验表明,情绪词向量与原始CBOW词向量相比,在准确率、召回率、F值等各项指标上都有更好的表现。  相似文献   

19.
实体关系抽取是知识图谱技术的重要环节之一。英文实体关系抽取的研究已经比较成熟,相比之下,中文实体关系抽取的发展却并不理想。由于相关语料的匮乏,中文实体关系抽取的发展受到了一定的限制。针对这一问题,COAE2016在任务三中提出了中文实体关系抽取任务。通过分别使用了基于模板、基于SVM与基于CNN的实体关系抽取算法解决了这一问题,并根据其在COAE2016任务三的评测数据集上的效果,对比分析了三种实体关系抽取算法的优缺点。实验证明,基于SVM的算法和基于CNN的算法均在评测数据集上表现出了良好的效果。  相似文献   

20.
Sentinel-1双极化数据舰船目标几何特性提取   总被引:1,自引:0,他引:1  
 舰船目标几何特性提取是合成孔径雷达(SAR)图像海上目标检测识别的重要基础。在具有几何真值样本的基础上,通过参数寻优和拟合回归,能够提高几何特性提取的精度,这在TerraSAR-X数据上已有研究。本文考虑Sentinel-1大部分情况下均能提供双极化数据这一特点,探索双极化信息能否进一步提升几何特性提取的精度。基于OpenSARShip测试库,首先使用二维度滤波进行图像处理,该图像处理过程中的关键参数使用交叉熵方法进行寻优,在大样本基础上,得到最优参数;之后,在目标几何特性的图像处理提取结果上,综合传感器、环境、目标3方面信息,特别是融合双极化信息,使用多元线性回归模型进行拟合,得到比仅用单极化信息更高的几何特性提取精度,证实了双极化信息的可用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号