首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于CNN-CRF的中文电子病历命名实体识别研究   总被引:1,自引:0,他引:1  
智慧医疗技术的发展让我们不满足仅使用传统方法做医学研究。针对中文电子病历实体识别问题,设计了一种基于卷积神经网络结合条件随机场(convolutional neural network-conditional random field,CNN-CRF)的实体识别算法框架。为得到高质量的词向量,将标注实体加入词典进行分词,并将已标注和未标注文本作为语料,用word2vec工具对已分词文本进行无监督学习;为避免扩张卷积层数增加导致过拟合,采用迭代扩张卷积处理输入向量,并使用dropout随机丢弃一些连接;运用条件随机场对网络的分类结果进行修正。把该方法在中文电子病历上进行对比试验,从病历中提取出身体部位,疾病,症状,检查及治疗5类实体。实验结果表明,该方法能有效地辨别病历中的实体,其识别的准确率、召回率和f1值分别为90.01%,90.62%,90.31%,准确率和速率比传统方法都有一定提高。  相似文献   

2.
基于条件随机场的越南语命名实体识别方法   总被引:2,自引:0,他引:2  
针对越南语特点,提出一种基于条件随机场模型的越语命名实体识别方法。该方法针对越语词和词性的特点,采用条件随机场算法,选取词和词性作为特征,定义特征模版,选取越南语新闻文本,标记地名、人名、组织机构等6类实体语料,训练获得越南语实体识别模型,实现实体识别。实验结果表明该方法提取实体的准确率达到83.73%。  相似文献   

3.
电子病历实体识别是医疗领域人工智能和医疗信息服务中非常关键的基础任务.为了更充分地挖掘电子病历中的实体语义知识以提升中文医疗实体识别效果,提出融入外部语义特征的中文电子病历实体识别模型.该模型首先利用语言模型word2vec将大规模的未标记文本生成具有语义特征的字符级向量,接着通过医疗语义资源的整合以及实体边界特征分析构建了医疗实体及特征库,将其与字符级向量相拼接以更好地挖掘序列信息,最后采用改进的Voting算法将深度学习结果与条件随机场(Conditional Random Fields,CRF)的结果加以整合来纠正标签偏置.实验表明,融入外部语义特征的改进模型的F值达到94. 06%,较CRF高出1. 55%.此外,还给出了模型最佳效果的各项参数.  相似文献   

4.
航行通告是民用航空情报领域的重要情报资料,针对中文航行通告专业名词较多、格式不统一及语义复杂等问题,提出一种基于BERT-Bi-LSTM-CRF的实体识别模型,对航行通告E项内容中事件要素实体进行抽取。首先通过BERT(bidirectional encoder representations from transforms)模型对处理后的向量进行预训练,捕捉丰富的语义特征,然后传送至双向长短期记忆网络(bidirectional long short-term memory, Bi-LSTM)模型对上下文特征进行提取,最后利用条件随机场(conditional random field, CRF)模型对最佳实体标签预测并输出。收集并整理机场类航行通告相关的原始语料,经过文本标注与数据预处理,形成了可用于实体识别实验的训练集、验证集和评价集数据。基于此数据与不同的实体识别模型进行对比实验,BERT-Bi-LSTM-CRF模型的准确率为89.68%、召回率为81.77%、F1值为85.54%,其中F1值相比现有模型得到有效提升,结果验证了该模型在机场类航行通告中要素实体识别的有效性。  相似文献   

5.
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.  相似文献   

6.
针对中文产品命名实体,提出了一种基于多种特征融合的识别方法。该方法以词为标注粒度,将多种特征融合到条件随机场模型中,采用递增式学习策略选取最优的特征模板,实现了从中文自由文本中识别产品命名实体。实验表明,该方法获得了令人满意的实验效果,准确率、召回率和F值分别达到94.87%、92.50%和93.67%。  相似文献   

7.
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次, 第一层包含因果、并列、转折、解说四大类。在此语料上, 利用上下文特征、词汇特征、依存树特征, 采用最大熵的分类方法对四大类关系进行识别。实验结果显示, 总正确率为62.15%, 其中并列类识别效果最好, F1值达到75.26%。  相似文献   

8.
中文化学命名实体结构没有严格的构词规律可循,识别实体中包含字母、数字、特殊符号等多种形式,传统字向量模型无法有效区分化学术语中存在的嵌套实体和歧义实体。为此,将高中化学试题资源的命名实体划分为物质、性质、量值、实验四大类,并构建化学学科实体词汇表辅助人工标注。通过ALBERT预训练模型提取文本特征并生成动态字向量,结合BILSTM-CRF(Bidirectional Long Short-Term Memory with Conditional Random Field)模型对高中化学试题文本进行命名实体识别。实验结果表明,该模型的精确率、召回率和F1值分别达到了95.24%、95.26%、95.25%。  相似文献   

9.
非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特征表达是一项具有挑战性的任务.该文针对安全漏洞领域,提出一种双向长短期记忆网络BLSTM与条件随机场CRF相结合的安全漏洞领域实体识别模型,并使用基于词典的方法对结果进行校正,F值可达到85%以上.实验表明,该方法在提高实体识别的准确率和召回率的同时,能够显著地降低人工选取特征的工作量.  相似文献   

10.
针对武器装备领域复杂实体的特点, 提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先, 使用BERT 模型对武器装备领域数据进行预训练, 得到数据向量, 使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征, 获取特征向量。然后, 将数据向量与特征向量融合, 利用Bi-LSTM模型进行编码, 使用CRF解码得到标签序列。最后, 基于武器装备领域知识, 对标签序列进行复杂实体的触发检测, 完成复杂命名实体识别。使用环球军事网数据作为语料进行实验, 分析不同的特征组合、不同神经网络模型下的识别效果, 并提出适用于评价复杂命名实体识别结果的计算方法。实验结果表明, 提出的挂载领域知识且融合多特征的武器装备复杂命名实体识别方法的F1值达到95.37%, 优于现有方法。  相似文献   

11.
随着互联网金融的迅速发展,配资类网站给人们的财产安全造成的威胁日趋严重.而传统的恶意网站识别技术只适用于部分特征显著的网站识别,导致对配资网站的识别效果不佳.本文从多个维度选取特征,将识别特征归纳为域名特征、搜索引擎收录特征、标签特征、图片特征和文本特征等五大类,较好地体现了配资网站与其他类别网站的本质不同,并结合深度神经网络,建立配资网站识别模型.为验证该模型的有效性,论文设计了深度神经网络模型与决策树算法、支持向量机算法、K-邻近算法的对比实验.从实验中发现,基于深度神经网络的配资网站识别模型提高了配资网站的识别准确率,模型准确率达到95.9%,精确率达到98.7%,各类评估指标效果均优于传统的机器学习算法.实验结果表明,该方法能有效地识别配资网站.  相似文献   

12.
张英杰  谢云 《科学技术与工程》2023,23(24):10437-10444
为深入研究脑电信号时空特征之间的关联,解决因手动提取特征导致的脑电情感识别准确率较低问题。将卷积神经网络(Convolutional neural network, CNN)和长短时记忆网络(Long short- term memory, LSTM)相结合,构造出了CNN-LSTM模型。首先,提取了5个频段的5个不同特征:功率谱密度(PSD)、差分熵(DE)、差分不对称(DASM)、理性不对称(RASM)和差分熵差分(DCAU)。其次,将特征输入CNN-LSTM模型,在DEAP数据集中的效价和唤醒两种情感维度上展开四分类实验。最后,将堆栈自编密码器(SAE),卷积稀疏自编码器(CSAE),深度置信网络(DBN)分别与LSTM组合,构造SAE-LSTM,CSAE-LSTM,DBN-LSTM三种混合模型同CNN-LSTM进行分类准确率比较。实验结果表明,DE特征的分类识别效果在五种特征中占最优,β和γ频段上所有特征的识别准确率远高于其他频段,尤其是γ频段。CNN-LSTM模型获得了最高的平均分类准确率92.48%,充分证明了CNN-LSTM模型的有效性。  相似文献   

13.
针对目前下肢动作模式识别技术存在的数据量少、识别率低的问题,提出了一种新的基于卷积神经网络的下肢动作模式识别方法。以下肢步态动作识别为对象,采集无负重平地行走,无负重上/下楼及负重上/下楼5种步态的表面肌电信号(surface electromyography,sEMG),对sEMG进行特征提取,构建了一种以特征集作为输入的卷积神经网络,并比较了其与另外几种传统分类识别方法的识别准确率和工作特征。实验结果表明,新方法对于5种步态的平均识别准确率大于95%,错误率都低于8%,具有较高的准确性。因此所提方法的输入特征集更能代表预测模型特征,模式识别率更高,可为康复医疗机器人、助力机器人等设备改善下肢运动功能提供参考。  相似文献   

14.
一种快速精确的汽车牌照字符切分算法   总被引:5,自引:0,他引:5  
针对汽车牌照具有字符间距、字符数、字体等统一的纹理特征,提出了一种快速精确的牌照字符切分方法,设计了一系列的特征函数和判决函数突出其纹理特点从而进行车牌字符的切分。对在不同气候条件和不同地点采集到的1000幅图片进行了实验,实验结果表明,该算法具有快速和鲁棒性的特征,字符切分准确度达到98.1%。  相似文献   

15.
本文提出了一种新的描述多种印刷体汉字的方法——特征链码法.使用该方法无需先对汉字图像进行细化和平滑处理,可以克服汉字图像位移、不同大小以及一些噪声的影响.实验中针对常用的一级字库约3700个仿宋体、宋体、黑体(理论上还可以扩充到二级字库6700多个印刷体汉字,字体还可以增加楷体等),以及相应的尺寸出现的变化如24×24、24×48、48×48等做了特征抽取和识别试验,实验中还对链码特征库进行了几种预分类.  相似文献   

16.
基于改进概率神经网络的手势动作识别   总被引:1,自引:0,他引:1  
为寻找一种快速且高识别率的手势识别方法,提出一种基于改进的概率神经网络手势识别算法。该算法采用K-W检验方法实现sEMG(Surface Myoelectrogram Gestures)的特征选择,利用粒子群优化方法对传播率参数进行优化。在7种手部姿势识别的实验中,该算法平均正确识别率均在90%以上,而传统BP算法的正确率仅为85.7%。仿真实验结果表明,改进的概率神经网络算法具有更短的训练时间和更强的分类能力。  相似文献   

17.
在基于惯性传感器人体行为识别的研究中,特征选择的作用是挑选相关特征,以提高分类性能,去除冗余特征以降低计算复杂度。针对传统的过滤式特征选择方法仅使用一种相关度量系数筛选特征效果不佳的问题,提出一种改进的基于最大相关与最小冗余(mRmR)准则的特征选择方法。该方法在基于mRmR准则下,采用多种相关度量系数融合的方式,在考虑分类类别的条件下,分析待挑选特征与已选特征间的相关性对特征筛选可能产生的积极影响,以去除部分冗余、不相关特征,进而得到初选特征子集;然后利用二进制数对筛选后的特征编码,通过遗传算法搜索最优或次优特征子集。分别使用SVM和KNN分类器对7种日常行为进行分类。实验结果表明,与其他几种方法相比,该方法对实验分类的7种行为有最高的总体平均识别精度,通过SVM和KNN分类的各行为总体平均识别精度分别达到了97.02%和95.73%,与传统的mRmR方法相比,分别提高了13.72%和9.92%。  相似文献   

18.
电子鼻判别挥发性气体的实验研究   总被引:4,自引:0,他引:4  
文中模拟人的嗅觉形成过程研制了一套用金属氧化物半导体气敏传感器阵列组成的电子鼻系统.深入研究了电子鼻的气敏传感器阵列和数据处理分析器,并用该电子鼻对5种不同浓度乙醇溶液( 0. 5%, l%, 1. 5%, 2%, 5%)进行分析,详细阐述了实验过程,同时用 BP神经网络对样本进行识别分析,神经网络的回判正确率为90%,测试正确率为80%.[  相似文献   

19.
郭依正 《科学技术与工程》2012,12(18):4535-4537,4544
以医学肝脏CT图为研究对象,设计了一种基于LVQ神经网络的医学图像识别方法。基本思想是首先确定图像ROI区域,并作灰度映射变换。接着提取其颜色、纹理和形状特征构成表征医学图像的特征矢量,最后将特征归一化后利用LVQ神经网络进行识别。通过与其他典型神经网络识别方法的实验比较,结果表明,设计的方法能取得更为理想的识别效果。  相似文献   

20.
基于内容的医学图像分类研究   总被引:2,自引:0,他引:2  
基于内容的医学图像分类是一个复杂的非线性问题,分类器的性能主要取决于提取的特征和模式识别算法。讨论了医学图像基本特征提取方法和多特征融合技术的发展,以及常用的模式分类算法。最后指出了支持向量机在医学图像分类中应用时需要解决的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号