首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
词类标注是自然语言理解中的的一个关键问题,是句法分析和语义分析的基础.本文分析了汉语的多类词现象.提出了在基于神经网络的词类标注方法的基础上,根据汉语的语法结构增加了规则的排歧处理阶段,增加了上下文词类信息的处理能力.实验表明:在原有神经网络方法的基础上,利用规则的方法进行修正,可以提高词性标注的正确率.  相似文献   

2.
基于LM-BP神经网络模式的酸性染料分类方法   总被引:2,自引:1,他引:1  
提出用Levenberg-Marquardt Backpropagation Neural Network(LM-BP)网络对酸性偶氮染料进行分类,网络结构为4-6-5。优化了隐含层神经元数和网络训练次数,表明隐含层神经元数应比输出层神经元数多一个。考察了训练集样本的选择对结果的影响,测试集的样本参数大小要处于训练集样本之间。本网络把其中22种染料作为训练集,把另外18种染料作为测试集,与采用GCEDM逐次分类法比较,测试集识别率为83%。  相似文献   

3.
基于隐Markov模型的汉语词类自动标注的实验研究   总被引:3,自引:0,他引:3  
汉语词类自动标注技术在中文信息处理现实应用中占据着十分重要的位置。论文在经过人工分词和词类标注的大规模汉语语料库的支持下 ,通过一系列对比实验 ,对基于隐 Markov模型的汉语词类自动标注算法进行了系统的考察 ,并得出结论 :1Bigram模型的“性能价格比”较 Tri-gram模型更令人满意 ;2以 7万词次左右的标注语料库训练 Bigram模型即已基本够用 (此时 ,兼类词词类标注正确率及文本词类标注正确率分别可达 93%和 97%以上 ) ;3Bi-gram模型对不同领域具有一定的适应性。这些结论对设计实用型汉语词类自动标注系统具有指导意义。  相似文献   

4.
一个改进的汉语词性标注系统   总被引:5,自引:0,他引:5  
汉语词性标注的难点在于确定具有多个词类的词(兼类词)在上下文中的词性。基于兼类词在词典中仅占很小的比例(约为3%),提出了具有双重状态的隐马尔可夫模型,它不但有一个常规的状态转移概率矩阵,还在逻辑上为每个具有多个词类的词保留一个专有的状态转移概率矩阵,使模型从一个状态转移到另一个状态的概率不再和观察无关,提高了模型的精确性。  相似文献   

5.
为了对灾难场景图像进行快速分析和识别,提出了一种基于多分辨率卷积神经网络和残差注意力机制(attention module)相结合的图像分类模型.首先,对灾难场景数据集进行预处理,在相同类型的条件下将其随机划分为训练集和测试集.基于改进的卷积神经网络(convolutional neural network,CNN),提取训练集的图像特征.使用训练集图片的特征进行训练,并且在测试集图片上实现分类测试.选取DenseNet、Xception和MobileNetV2三种模型,以灾难场景数据集(Disaster_Data_Scenes)为数据集进行实验验证.结果表明:改进的Xception和MobileNetV2网络在灾难场景数据集上进行的图像分类实验测试,比原网络精度分别提升了4.56%和3.04%.其中改进的DenseNet网络比原网络模型精度分别提升9.13%、17.88%和10.27%.可见改进的卷积神经网络模型的分类精度得到有效提高.  相似文献   

6.
近年来基于字的词位标注汉语分词方法极大地提高了分词的性能,该方法将汉语分词转化为字的词位标注问题,借助于优秀的序列标注模型,词位标注汉语分词逐渐成为汉语分词的主要技术路线.该方法中特征模板集设定和词位标注集的选择至关重要,采用不同的词位标注集,使用最大熵模型进一步研究了词位标注汉语分词技术.在国际汉语分词评测Bakeoff2005的语料上进行了封闭测试,并对比了不同词位标注集对分词性能的影响.实验表明所采用的六词位标注集配合相应的特征模板集TMPT-6较其他词位标注集分词性能要好.  相似文献   

7.
为了提高沥青路面内部病害的检测精度及效率,开展了路面探地雷达(GPR)图像的自动识别研究.采用三维探地雷达(3D-GPR)设备高效、无损地探测沥青路面内部结构,以获取海量3D-GPR图像数据;通过多维度GPR图像辨识内部病害(横向裂缝和层间不良)的回波特征,矩形框准确标注纵断面GPR图中病害特征,进而构建内部病害回波特征GPR图像数据集(训练集、验证集和测试集);基于深度学习技术,引入YOLOv4(you only look once version 4)算法模型,首先利用训练集和验证集完成模型网络参数的迭代更新,然后利用测试集进行模型综合检测性能评估.研究结果表明:YOLOv4模型在测试集上测试的综合检测精度大于95%,并且其检测视频的每s帧数也超过30;而层间不良的回波特征相对内部横向裂缝识别更加准确;该模型可以实时、高精度自动识别出沥青路面GPR图像中病害回波特征.  相似文献   

8.
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.  相似文献   

9.
由于各医学图像分割任务的差异性,通常在单独的数据集上进行神经网络的训练,而跨数据集的共享信息可提高各项任务的表现。本文旨在提出一种部分监督的语义分割方法在由两个数据集合并的部分标注数据集上进行血管内超声影像(IVUS)的冠脉结构分割,即:使用多标签语义分割来解决数据集标注不一致的问题,并提出了一种具有类再平衡策略的非对称双分支网络来提高分割性能。本文提出的方法取得了比全监督方法更好地分割性能;并且分割结果与参考标准在管腔面积(r=0.99;P<0.001)、中膜面积(r=0.99;P<0.001)和斑块负荷(r=0.95;P<0.001)也取得了强相关性及优秀的一致性;此外,本文方法有效地利用了标注不一致的部分标注数据集,缓解了IVUS影像分割中“数据饥饿”的问题。  相似文献   

10.
为解决裂缝检测深度学习模型训练时数据集标注效率低、成本高的现状,以及现有计算机标注算法对复杂环境适应性较弱的问题,基于计算机视觉与概率统计理论,提出低监督快速标注的概念,并以计算机标注和人工标注相融合的全新标注模式,形成了完整的裂缝检测模型数据集的快速标注算法。与人工逐像素标注相比,标注精度均为84%以上,且可节省至少85%的时间;与传统计算机标注方式相比,标注干涉和简单人工标注方式可以较好地处理复杂背景问题。经U-Net深度学习模型验证,测试集的平均交并比可达0.90。  相似文献   

11.
有机固体废物厌氧消化为非均相体系,预警调控对系统的稳定运行非常重要。为了准确预测负荷跨越式提升的联合厌氧消化体系的日产气量,利用灰色关联分析方法量化了厌氧消化体系中常见因素间的关联度,评估了厌氧消化体系的复杂程度,构建了反向传播(back propagation,BP)神经网络对日产气量进行预测。结果表明,各指标间的灰色关联度均大于0.7,表明厌氧消化体系中各参数之间关系的高度的关联性和复杂性。利用试验获取的148组数据作为BP神经网络的训练集和测试集,构建的BP神经网络精度较高,对148组样本数据的平均预测准确率达到99.17%,对日产气量具有较好的预测能力。  相似文献   

12.
文本挖掘中中文歧义字段的自动分词是计算机科学面临的一个难题.针对汉语书写时按句连写,词间无间隙,歧义字段分词困难的特点,对典型歧义中所蕴含的语法现象进行了归纳总结,建立了供词性编码使用的词性代码库.以此为基础,通过对具有特殊语法规则的歧义字段中的字、词进行代码设定,转化为神经网络能够接受的输入向量表示形式,然后对样本进行训练,通过改进BP神经网络的自学习来掌握这些语法规则.训练结果表明:算法在歧义字段分词上达到了93.13%的训练精度和92.50%的测试精度.  相似文献   

13.
一致性测试中的时间约束及测试用例生成算法   总被引:2,自引:0,他引:2  
针对协议测试理论中的时间约束问题,从不同的一致性测试方法出发对协议测试中的时间参数做了严格的约束,同时给出了基于等待、协调和同步时间的严格约束下的测试用例生成算法.在控制流测试中,先生成引导序列,然后按照测试拓扑环境设置和事件约束对引导序列、测试序列的时间进行约束设置.在数据流测试中,等待时间只需按照需求描述和约束来设定.对边界网关协议进行测试的结果表明,所提算法能适应不同的网络拓扑环境,其生成的测试用例在测试中能够有效降低测试代价.  相似文献   

14.
为解决数控(computer numerical control, CNC)机床设计知识图谱构建过程中关键实体的抽取问题,制定了数控机床领域知识分类标准和标注策略,构建了领域数据集,并提出了一种基于RoBERTa(robustly optimized BERT pretraining approach)的数控机床设计知识实体识别方法。首先,利用数控机床领域数据集对RoBERTa模型进行微调,再利用RoBERTa对文本编码,生成向量表示;其次,采用双向长短期记忆(bidirectional long short-term memory, BiLSTM)网络提取向量特征;最后,利用条件随机场(conditional random field, CRF)推理出最优结果,进而为实体打上标签。实验结果表明:模型在数据集上的F1值为86.139%;对多数关键实体的F1值大于85%;相比其他模型提升2%~18%。可见该方法在数控机床设计知识实体识别中具有明显优势,能够识别机床设计知识文本包含的关键实体,为数控机床设计知识图谱构建提供了数据基础。  相似文献   

15.
基于粗神经网络的语音情感识别   总被引:1,自引:1,他引:0  
语音情感识别是从语音信号中提取一些有效的声学特征,然后利用智能计算或者识别的方法对话者的情感状态进行识别。介绍了国内外在该领域中关于语音情感数据库、特征提取、识别方法的研究现状。基于对该领域现状的了解,发现特征提取对识别率有着非常大的影响。录制了1050句语音,每句语音提取了30个特征,从而形成了一个1050×30的数据库。提出了用粗糙集理论中的信息一致性对数据库中的30个特征进行化简,最后得到了12个特征。用神经网络中的BP网络对话者的情感状态进行识别,最高识别率达到了84%。从实验结果发现不同的情感用不同的方法识别结果更好。  相似文献   

16.
为消除城市内涝事件的突发性和空间易变性对城市内涝灾害决策调度的影响,构建城市内涝事理图谱,并在此图谱上提出成因分析应用的框架。利用规则模板库抽取中文城市内涝语料库中的因果事件句,基于投票机制的深度神经网络融合方法抽取因果句中的事件,融合手工规则实现城市内涝事理图谱的构建。采用事理图谱自动生成以内涝点为中心的场景,用生成的场景自动生成并训练离散动态贝叶斯网络,并在该网络上进行内涝点成因分析。结果表明,所构建的城市内涝事理图谱能较好地描述所在城市的内涝演化规律,成因分析结果与真实结果对比表明,此方法能准确找到内涝点处产生内涝的成因,并排除有干扰影响的伪成因。  相似文献   

17.
电子鼻判别挥发性气体的实验研究   总被引:4,自引:0,他引:4  
文中模拟人的嗅觉形成过程研制了一套用金属氧化物半导体气敏传感器阵列组成的电子鼻系统.深入研究了电子鼻的气敏传感器阵列和数据处理分析器,并用该电子鼻对5种不同浓度乙醇溶液( 0. 5%, l%, 1. 5%, 2%, 5%)进行分析,详细阐述了实验过程,同时用 BP神经网络对样本进行识别分析,神经网络的回判正确率为90%,测试正确率为80%.[  相似文献   

18.
设计了一个中文姓名抽取系统, 该系统采用神经网络进行汉语句子的分词处理, 根据姓名后置特征词进行姓名的抽取, 成功解决了尾字和下文成词的姓名抽取问题. 以1998年1月份《人民日报》语料库中含有此类姓名的语句作为测试数据,结果表明, 姓名抽取的召回率和精确度较现有方法都有很大提高.  相似文献   

19.
为了准确表征和预测光伏(PV)组件在不同工况下的电流电压(I-V)特性,本文提出一种利用改进Elman神经网络的光伏I-V曲线黑盒建模新方法。首先通过皮尔森相关系数分析影响I-V曲线的环境因素;其次使用基于电压电流的双线性插值法对实测I-V曲线进行重采样,以提高I-V曲线上数据点分布的均匀性;进而使用基于辐照度温度的网格采样法对I-V曲线数据集进行下采样,降低数据冗余度;再利用量子粒子群(QPSO)算法优化Elman神经网络的初始权值和阈值,从而构造QPSO-Elman预测模型。最后根据美国国家可再生能源实验室(NREL)提供的I-V曲线数据集进行实验验证和测试。实验结果表明,所提出的建模预测方法精度更高,稳定性和泛化能力更好。  相似文献   

20.
针对风力发电机组变桨系统故障诊断模型参数难以优化问题,提出了基于状态转移算法优化多类最优间隔分布机(multi-class Optimal Margin Distribution Machine optimized by the State Transition Algorithm,mcODM-STA)的风电机组变桨系统故障诊断方法.该方法选择风电机组功率输出作为主要状态参数,利用Pearson相关系数对风电数据采集与监视控制系统中风电机组历史运行数据进行相关性分析,剔除与功率输出状态参数相关性较低的特征,对余下特征进行二次分析,减少样本特征.将数据集分为训练集和测试集,训练集用来训练所提故障诊断模型,测试集用来进行测试.利用国内风电场实际运行数据进行实验验证.实验结果表明,与其他多种参数优化方法相比,所提方法故障诊断准确率和Kappa系数更高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号