首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 155 毫秒
1.
提出了一种基于支持向量机(SVM)和条件随机场(CRF)的双层模型进行中文机构名识别的方法.第一层模型采用CRF识别简单机构名,并将识别结果传至第二层辅助下一步的识别;第二层采用基于驱动的方法,将SVM和CRF结合进行复杂机构名的识别;最后将两层的识别结果合并,并通过一个后续处理对置信度较低的识别结果进行修正.大规模真实语料的开放测试表明,精确率达到94.83 %,召回率达到95.02%,证明了该方法的有效性.  相似文献   

2.
针对目前中文医疗机构名识别问题,提出一种基于层叠条件随机场模型的中文医疗机构名识别方法;该方法第一层条件随机场(CRF)模型基于词粒度,结合自定义词典,实现人名、地名以及简单机构名识别,将最终的结果传递到第二层CRF模型;第二层CRF模型通过词性、词界以及上下文等特征最终完成对复合嵌套的医疗机构名实体的识别。结果表明:在封闭实验中,该方法识别正确率达到94.6%,召回率达到96.2%;在开放实验中,该方法识别正确率达到92.3%,召回率达到90.2%。本文模型相比于结合规则的单层CRF模型,F值分别提高1.99%、2.8%,总体结果得到显著改善。  相似文献   

3.
互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。  相似文献   

4.
随着微机电系统(MEMS)研究的精细化,人体传感器网络(简称体感网)技术在医疗监护领域有了长足发展,而人体动作分析与识别是体感网中富有挑战性的研究课题.采用动态隐马尔可夫模型(HMMs)方法对基于用体感网技术的人体动作序列进行了分割,并且对分割精准度进行了度量分析.从实验结果可以看到,动态HMMs方法优于LIR和Top-Down方法,其分割精准度达到了80%以上.对分割后的数据提取均值、方差等特征,采用支持向量机(SVM)方法分类识别的结果表明所提分割方法具有良好的稳健性,平均识别准确率在89%左右,与手动分割接近.  相似文献   

5.
采用长短时记忆(LSTM)神经网络预测方法对某岛礁地形模型的四个典型波浪试验数据进行预测分析,并建立了单步和多步预测模型.首先对波高时间序列数据进行归一化处理;然后建立了包括输入层、隐藏层和输出层的LSTM网络模型框架;最后对测试样本进行单步预测,将预测结果与支持向量机(SVM)模型和反向传播(BP)模型进行了对比.结果表明:LSTM神经网络预测精度有明显优势;多步预测中,提高预测时长其预测精度并无明显降低.  相似文献   

6.
为了快速处理航天情报,基于数据驱动的深度学习技术,提出融合多源异构知识标注中文航天情报数据集的方法流程,以及基于预训练(pre-training)模型的航天情报实体识别(AIER)方法;通过对航天情报进行命名实体识别,达到对航天情报进行信息抽取的目的.通过融合BERT(bidirectional encoder representation from transformers)预训练模型和条件随机场(CRF)模型构建AIER模型(BERT-CRF模型),将其与隐马尔可夫模型(HMM)、条件随机场(CRF)模型、双向长短期记忆网络加条件随机场(BiLSTM-CRF)模型进行实体识别对比实验.结果表明:基于预训练模型的AIER模型能够取得93.68%的准确率、97.56%的召回率和95.58%的F1值;相比于其他方法,基于预训练模型方法的性能得到提高.  相似文献   

7.
研究了基于支持向量机(Support Vector Machine,SVM)方法下的生物医学事件触发词识别的问题.利用SVM对事件抽取的过程进行分类,建立相应的模型来对生物医学事件中的触发词进行识别,得到了相应的实验结果,并验证了此方法的可行性.  相似文献   

8.
针对维吾尔语命名实体识别存在无法关注词序列依赖关系等问题,提出一种基于迁移学习的联合深度模型(TBIBC).首先通过BERT(Bidirectional Encoder Representations from Transformers)预训练中文数据集生成具有语义信息的词向量,再将词向量序列通过空洞卷积神经网络(IDCNN)进行膨胀操作以减少神经元层数和参数,输出向量输入到双向门控循环单元(BiGRU)进行上下文语义信息提取,然后通过CRF层得到最优标签序列.模型采用共享深度神经网络隐藏层的方法将训练好的中文实体识别模型迁移到维吾尔语模型上.结果表明,该模型的准确率为91.39%,召回率为90.11%,F1值达到90.75%,能显著提升维吾尔语命名实体识别性能.  相似文献   

9.
针对特定音频事件识别中持续时间特别短的音频事件漏检概率高、识别速度较慢的问题,提出一种融合高斯混合模型(GMM)及支持向量机(SVM)的特定音频事件识别算法. 该方法利用GMM的统计分布描述能力和SVM的推广泛化能力,将GMM和SVM分别识别的结果进行融合处理,以手枪、步枪、机关枪等10类以上枪声为实验数据,无需针对每种枪声生成相应的识别模板,仅需训练生成2个识别模板. 实验结果表明,识别准确率达到92.71%. 该方法模板数量少,不需要多次训练,算法复杂度较低,不仅便于应用而且可大幅提升识别效率.   相似文献   

10.
基于支持向量机的中文文本中地名识别   总被引:2,自引:0,他引:2  
提出并实现了一种基于支持向量机(SVM)的中文文本中地名的自动识别方法.结合地名的特点,抽取单字本身、基于字的词性、是否在地名特征词表中及其上下文的信息作为向量的特性,并将其转化为二进制表示,在此基础上建立了训练集,并通过对多项式Kernel函数的测试,得到了用支持向量机进行地名识别的机器学习模型.实验表明,所建立的SVM地名识别模型是有效的,系统开式召回率和精确率分别达86.69% 和93.82%,F-值为90.12%.  相似文献   

11.
为了有效利用电能质量复合扰动识别中存在的大量难以标注的实测样本,提出了一种基于Jerk流形正则化深度极限学习机(DJRELM)的半监督扰动学习方法. 算法通过堆叠嵌入Jerk流形正则化的极限学习机自编码器(JRELM-AE)实现在复合扰动特征自动提取的同时保持数据内部流形结构. 分类层通过阈值预测极限学习机和Jerk正则化半监督极限学习机的结合将多层网络扩展到多标签半监督分类应用. 实验结果表明:该方法在不同噪声环境下的分类准确率均高于几种基于极限学习机的监督学习、半监督学习算法、传统多层极限学习机和深度卷积神经网络,具有理论意义和实用价值.  相似文献   

12.
基于流形正则化的在线半监督极限学习机   总被引:1,自引:0,他引:1       下载免费PDF全文
在基于流形正则化的半监督极限学习机(SS-ELM)的基础上,利用分块矩阵的运算法则,提出了在线半监督极限学习机(OSS-ELM)方法.为避免在实时学习的过程中由于数据累积引起的内存不足,通过对SS-ELM的目标函数的流形正则项的近似,给出了OSS-ELM的近似算法OSSELM(buffer).在Abalone数据集上的实验显示,OSS-ELM(buffer)在线学习的累计时间与所处理的样本个数呈线性关系,同时,9个公共数据集上的实验表明,OSS-ELM(buffer)的泛化能力与SS-ELM的泛化能力的相对偏差在1%以下.这些实验结果说明,OSS-ELM(buffer)不仅解决了内存问题,还在基本保持SS-ELM泛化能力的基础上大幅度提高了在线学习速度,可以有效应用于在线半监督学习当中.  相似文献   

13.
为提高分类准确率, 解决城市区域社会功能标签分类难的问题, 提出了一种基于不确定抽样选择策略的半监督城市土地功能分类方法。该算法从轨迹数据中提取城市区域的特征向量, 只需对少量区域进行标签, 根据不确定抽样的主动学习选择策略, 从未标注训练样本中选取具有较多信息的数据, 利用半监督学习算法进行标注, 得到新的标注训练样本添加到训练集, 反复迭代后得到分类结果。实验结果表明, 该方法对不同社会功能的城市区域分类准确率可达90. 2%, 与传统方法相比分类准确率高, 减少了大量标注工作, 在少数标签数据上仍有较好的分类效果。  相似文献   

14.
基于希尔伯特-施密特独立性提出了一种新的半监督学习方法,称为最大化依赖性多标签半监督学习方法(dependence maximization multi-label semi-supervised learning method,DMMS)。该方法将样本已有标签作为约束,以最大化特征集和标签集的关联性为目标,通过求解一个线性系统为无标签数据打上标签,具有实现简单,无参(nonparameter)的特点。多个真实多标签数据库的实验表明,DMMS与最好的多标签学习方法,包括多标签近邻(multi-labelk-nearest neighbor,MLKNN)和图半监督学习方法具有类似的识别效果。  相似文献   

15.
韦艳玲 《科学技术与工程》2012,12(22):5580-5583
ELM(极限学习机)简单、易用,学习速度快且泛化性好,故将ELM引入虫害预测中。为了更好地提高ELM的效率和精度,首先采用模糊聚类对所有样本进行预处理,再把处理后的数据作为ELM的输入数据进行训练和预测。仿真实验结果表明,经过模糊聚类处理后,ELM预测精度较高,泛化性好,能够满足虫害预测对准确率和实时性的要求。通过实例,为虫害预测的应用提供一种新方法。  相似文献   

16.
实际应用中的大量数据具有不确定属性,而传统的挖掘算法无法直接应用在不确定数据集上.针对不确定数据的分类问题,提出一种基于抽样方法的不确定极限学习机.该算法通过抽样的方法,对不确定数据集中样本的抽样实例进行学习和分类,得到该不确定样本的所属类别的概率,从而实现了传统极限学习机分类算法对不确定数据的分类,并极大降低了不确定对象实例的枚举代价.实验结果表明,该算法在不确定数据的分类问题中具有较好的有效性和高效性.  相似文献   

17.
基于深度学习算法的预测通常被盲目地认为是准确的,而这种劣势在半监督学习中更为明显.为了解决这个问题,本文引入了一种简单但有效的正则化方法,即不确定性交叉伪监督.该方法通过不同的参数初始化对双学生网络施加了一致性约束,并将一个学生输出的独热分割图用作伪标签来监督另一个学生.同时独热分割图之间的詹森 香农距离用来估计伪标签的不确定性.此外,本文还提出了一种不确定损失用于降低拥有高不确定性的伪标签所带来的损失项权重.实验结果表明,本文方法实现了最先进的半监督语义分割性能.  相似文献   

18.
The Extreme Learning Machine(ELM) is an effective learning algorithm for a Single-Layer Feedforward Network(SLFN). It performs well in managing some problems due to its fast learning speed. However, in practical applications, its performance might be affected by the noise in the training data. To tackle the noise issue, we propose a novel heterogeneous ensemble of ELMs in this article. Specifically, the correntropy is used to achieve insensitive performance to outliers, while implementing Negative Correlation Learning(NCL) to enhance diversity among the ensemble. The proposed Heterogeneous Ensemble of ELMs(HE2 LM) for classification has different ELM algorithms including the Regularized ELM(RELM), the Kernel ELM(KELM), and the L2-norm-optimized ELM(ELML2). The ensemble is constructed by training a randomly selected ELM classifier on a subset of the training data selected through random resampling. Then, the class label of unseen data is predicted using a maximum weighted sum approach. After splitting the training data into subsets, the proposed HE2 LM is tested through classification and regression tasks on real-world benchmark datasets and synthetic datasets. Hence, the simulation results show that compared with other algorithms, our proposed method can achieve higher prediction accuracy, better generalization, and less sensitivity to outliers.  相似文献   

19.
大坝变形预报的神经网络极限学习方法   总被引:1,自引:0,他引:1  
针对大坝变形具有强非线性的特点以及在采用传统BP神经网络模型进行预报时存在学习速度慢、易陷入局部极小等问题,提出将极限学习机(ELM)方法用于大坝变形预报。该方法不仅可以简化网络参数选择过程,而且可以明显提高网络的训练速度,并具有良好的泛化性能。工程实例结果分析表明了ELM方法应用于大坝变形预报具有可行性和有效性。  相似文献   

20.
针对训练电能质量复合扰动分类模型遇到少量已知历史数据和海量未标注的采样数据共存的现象,本文提出了一种基于混合流形正则化半监督极限学习机(Laplacian Hessian Semi-supervised-Extreme Learning Machine,LHSS-ELM)的复合扰动识别方法。该方法通过图拉普拉斯正则化和海森正则化相结合更好地挖掘未标注扰动样本的局部结构信息。不同噪声水平下的实验结果表明:LHSS-ELM在复合扰动识别上准确率高于常见的半监督极限学习机模型,它与传统基于支持向量机的半监督模型对比精度也有明显的提高,表明该方法是一种有效的复合扰动识别方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号