首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
赵源 《科技信息》2010,(35):58-58,49
本文在中文分词技术的基础上,提出了一种基于中文文本主题提取的分词方法,以概念语义网络的思想构造主题词典,描述词间概念语义关系,采用改进的最大匹配算法对文本进行切词,既提高了分词的准确性,又能识别文中的未登录词,并同步完成主题词的规范工作。从而在概念层次上理解用户的需求,实现概念检索,提高查准率。  相似文献   

2.
张盼盼  张健飞 《河南科学》2020,38(4):560-567
针对结构健康监测系统产生的海量数据难以高效分析的问题,采用了一种基于二维卷积神经网络的损伤识别检测方法,该方法直接将结构在外界激励作用下的加速度时程数据作为输入信息,通过卷积神经网络自动提取加速度数据中的隐含特征,识别结构的损伤.以板的损伤识别为例,给出了卷积神经网络损伤识别模型的输入数据格式、网络结构和训练方法,分析了卷积神经网络分别在不含噪声,含噪声5%、10%以及混合噪声情况下的损伤识别能力.测试结果显示这种基于加速度输入的卷积神经网络具有较高的损伤识别精度和抗噪能力,从而为结构健康监测系统数据分析和损伤识别提供了一种新的途径.  相似文献   

3.
针对维吾尔语事件时序关系识别问题,提出了一种结合注意力机制的双向长短时记忆模型.基于维吾尔语语言及事件时序关系的特点,抽取13项基于事件间内部结构信息的特征.将词向量作为双向长短时记忆模型的输入,挖掘给定事件句隐含的上下文语义信息.结合事件触发词建立注意力机制,获取该事件句的事件语义特征.将事件内部结构特征和语义特征相融合,作为softmax层的输入,进而完成事件时序关系的识别.实验结果表明,该方法在获取事件句隐含语义信息的同时也能获取对应的事件语义特征.融合事件内部结构特征后,识别准确率为89.42%,召回率为86.70%,衡量模型整体性能的F值为88.03%,从而证明了该方法在维吾尔语事件时序关系识别任务上的有效性.  相似文献   

4.
针对传统文本分类方法忽略词语间的语义特征的问题,并为了改善输入文本的表示质量,提出一种基于短语结构和词语词性相结合的情感分类方法.该方法首先通过短语结构优化分词,可以更好地提取文本特征;其次利用Word2vec工具训练词语和词性相结合的文本语料库得到词向量模型,解决了Word2vec无法识别一词多义的问题;最后通过SVM算法对文本进行情感分类.实验结果表明,该算法能够提高文本情感分类的正确性.该方法对舆情监控、股票市场行情预测和了解消费者对产品的偏好等具有较高的实用性.  相似文献   

5.
针对基于位置服务(LBS)中缺乏语义基础的问题,分析了LBS涉及的数据和服务特点,设计了用于识别和关联语义相关概念的混合结构本体,对其进行建模.该方法克服了LBS中可能出现的语义异质问题,便于用户和服务之间进行概念的共享和交换.示例的结果,表明了基于本体的LBS在克服语义异质问题上的优点.  相似文献   

6.
张荣梅  张琦  陈彬 《科学技术与工程》2020,20(12):4775-4779
传统的车牌识别算法包括模板匹配、特征统计等方法,但是这些算法依赖于人工提取图像特征,识别准确率低。卷积神经网络LeNet-5算法能够自动提取车牌图像的特征,提高车牌识别准确率。但是目前基于LeNet-5网络结构的车牌识别算法存在识别不完整,运算时间长等缺点。提出基于改进的LeNet-5网络的车牌识别算法,该算法将输入车牌字符图像归一化为32×16大小,并通过删除传统LeNet-5网络中的C5层、修改输出层中神经元个数等,将车牌字符按照汉字和数字/字母的形式识别输出。通过采集大量车牌数据进行训练验证,结果表明:与前人改进的LeNet-5网络结构相比,本文算法在识别率和时间效率上均得到了提高。  相似文献   

7.
提出了一种新的语义相似度计算方法。该算法结合了被评估概念的高度、路径长度和公共细化度(specificity);改进了基于路径的语义相似度算法,利用本体结构,引入基于信息量算法的思想,使得新算法能够获取更多的语义信息,同时又不需要对于文本数据进行预处理;考虑本体中簇的粒度对本体的相似度计算有一定影响,在公式中添加概念在本体中的高度信息,达到低层次的概念间共享的信息要比高层次的概念间共享的信息更多。为了评估所提出的新方法,在实验中,用标准的生物医学系统命名法-临床术语(systematized nomenclature of medicine-clinical terms,SNOMED CT)作为输入本体,用已标注好的概念对集合作为数据集。实验结果表明,所提出的方法不仅保留了基于路径算法的简洁性,还优于现有语义相似度算法,证明了所提出方法的有效性。  相似文献   

8.
对话系统的口语理解通常涉及意图识别和语义槽填充两个任务.目前意图和语义槽填充联合识别成为口语理解研究的主流方法.本文采用一种基于注意力机制(Attention Mechanism)的双向长短时记忆(Bi-directional long short-term memory,BiLSTM)模型,对呼和浩特市公交问路查询语句进行意图和语义槽填充的联合识别.实验结果表明,该模型在意图识别准确率和语义槽填充F1值方面,均达到了较好的水平,优于基于长短时记忆(long short-term memory,LSTM)模型的其他方法,并且该模型基于字切分的结果优于基于词切分的结果,证实了该方法的有效性.  相似文献   

9.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

10.
针对命名实体识别方法存在字与字之间语义信息丢失、模型召回率不佳等问题,提出了一种跨度语义信息增强的命名实体识别方法。首先,使用ALBERT预训练语言模型提取文本中包含上下文信息的字符向量,并使用GloVe模型生成字符向量;其次,将两种向量进行拼接作为模型输入向量,对输入向量进行枚举拼接形成跨度信息矩阵;然后,使用多维循环神经网络和注意力网络对跨度信息矩阵进行运算,增强跨度之间的语义联系;最后,将跨度信息增强后的矩阵进行跨度分类以识别命名实体。实验表明:与传统的跨度方法相比该方法能够有效增强跨度之间的语义依赖特征,从而提升命名实体识别的召回率;该方法在ACE2005英文数据集上比传统的方法召回率提高了0.42%,并且取得了最高的F1值。  相似文献   

11.
一种基于神经网络的结构参数识别方法   总被引:10,自引:2,他引:8  
提出了一种基于神经网络的结构参数识别方法,该方法以残余力向量作为结构参数识别的网络输入。针对训练样本在数据空间分布不均匀的问题,采用GSL变换对训练样本数据进行预处理。从而提高了网络收敛速度及参数识别精度。本文算例说明了方法的有效性。  相似文献   

12.
为解决已有复述语义计算方法未考虑句法结构的问题, 提出基于句法结构的神经网络复述识别模型, 设计基于树结构的神经网络模型进行语义组合计算, 使得语义表示从词语级扩展到短语级。进一步地, 提出基于短语级语义表示的句法树对齐机制, 利用跨句子注意力机制提取特征。最后, 设计自注意力机制来增强语义表示, 从而捕获全局上下文信息。在公开英语复述识别数据集Quora上进行评测, 实验结果显示, 复述识别性能得到改进, 达到89.3%的精度, 证明了提出的基于句法结构的语义组合计算方法以及基于短语级语义表示的跨句子注意力机制和自注意力机制在改进复述识别性能方面的有效性。  相似文献   

13.
为解决当前城市道路网自动提取方法难以同时对道路几何、拓扑、语义进行精细建模的问题,提出一种基于泛在位置数据的城市道路网一体化精细建模方法。首先,利用轨迹转向角热点分析方法提取道路交叉口区域,对交叉口和路段进行分治;然后,识别道路交叉口的出、入口点,分别采用低频轨迹聚类和交叉口连通性分析方法,识别交叉口的转向模式,并对路段轨迹进行分类,在此基础上对道路网几何、拓扑结构进行精细建模;最后,利用自然语言处理和地图匹配技术,利用位置文本数据和车辆轨迹数据提取道路名称和平均速度等信息,实现道路网几何、拓扑、语义精细建模。研究结果表明:本文方法能够用于快速获取城市道路网几何、拓扑、语义信息并精细建模。  相似文献   

14.
反映信息系统的结构语义是数据库设计的主要目的之一。这一目的一般采用语义数据模型来达到。我们考察这一问题的逆问题:识别关系数据库模式中IFO结构。本文描述了将无语义的关系模式转换成IFO图的方法,同时给出了该方法的具体应用。  相似文献   

15.
反映信息系统的结构语义是数据库设计的主要目的之一。这一目的一般采用语义数据模型来达到。我们考察这一问题的逆问题:识别关系数据库模式中IFO结构。本文描述了将无语义的关系模式转换成IFO图的方法,同时给出了该方法的具体应用。  相似文献   

16.
为解决基于非结构化文本的中文领域本体概念提取效率和准确率不理想的问题, 提出了一种基于关联规则和语义规则的领域本体概念提取方法。利用领域一致性和相关性检查以及关联规则分别获取候选概念和关系集合, 计算候选概念在领域术语关系中的深度和广度, 利用深度和广度信息反馈概念隶属度的思想, 定量分析术语与领域的隶属程度, 进行本体概念的领域隶属度检查, 完成领域本体概念的提取。实验结果表明, 该方法提高了领域本体概念的提取效率和准确率, 具有可行性和合理性, 领域本体概念的提取准确率提高了12%左右。  相似文献   

17.
为了融合碎片化林业文本数据,解决目前林业网络知识散乱、无序和关联性不强的问题,将深度学习与知识图谱相结合,提出一种基于改进BERT和双向RNN的模型用于林业实体识别和实体关系抽取.通过基于实体Mask的BERT词向量处理,自动提取出序列中与研究领域相关的词级和语义特征,将词向量输入命名实体识别模型和实体关系提取模型训练...  相似文献   

18.
针对由于行人拍摄相机参数、拍摄环境以及角度等的差异,使行人重识别算法的准确率较低的问题,提出了一种基于行人语义感知信息以及深度学习的行人重新识别算法。首先,超分辨率重构行人视图,提升行人视图细节特征,提取行人的整体特征值,并用其识别体型差异较大的行人。其次,感知行人图像的语义信息,根据上述结果提取行人语义信息的特征值,用于识别体型相同或相似的行人。然后将行人视频中的人体宏观特征值以及语义感知的信息特征值融合为综合的特征值。使用生成的特征值计算与不同个体视频特征值的间距,识别海量人物图像。最后,在不同的数据集中验证了算法的性能。实验结果表明,该基于语言感知行人重识别算法的mAP和rand-1值最高。  相似文献   

19.
随着本体技术的逐渐成熟,如何为本体搭建语义桥梁以实现知识的重用与共享成为新的研究热点。在分析现有相关技术的基础上,提出一种计算不同本体中概念间语义相似度的方法,该方法以基于距离的概念相似度算法为基础,同时对概念结构进行分析将两者结合,从而计算出最终的概念间语义相似度。实验证明该方法有效。该研究工作可以应用于面向Web的知识检索领域。  相似文献   

20.
基于Nutch的Web数学公式提取   总被引:1,自引:0,他引:1  
本文主要研究基于公式的数学搜索引擎中数学公式的识别和提取方法,总结了MathML、Open-Math、LaTex、Infix格式数学公式在网页中出现时的各自特征,提出了基于特征和启发式规则的公式识别和提取方法,并用实验说明了该识别和提取方法的可行性和准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号