首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
基于条件随机场的汽车领域术语抽取   总被引:1,自引:0,他引:1  
中文领域术语抽取是中文信息处理领域的一项重要研究任务,在词典构建、领域本体构造等方面有重要的应用.采用条件随机场(conditional random fields,CRFs),从汽车知识网站上爬取网页,预处理后得到纯文本,然后分析汽车领域的术语组成特点并制定相应的语料标注规则进行人工标注,对汽车领域进行了术语抽取.在使用词和词性特征的基础上增加了词典特征、领域词频和背景领域词频等特征,精确率、召回率和F-值分别达到84.61%、80.50%和82.50%.与其他方法比较说明所提出的汽车领域术语抽取方法是有效的.  相似文献   

2.
基于语言特性的中文领域术语抽取算法   总被引:2,自引:0,他引:2  
提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.  相似文献   

3.
基于登录词邻接关系的双条件概率的领域术语抽取算法   总被引:2,自引:2,他引:0  
领域词典作为中文信息处理的基础,在各个领域都有着重要的应用.而人工构建领域词典不仅工作量大,而且缺乏时效性.因此,自动构建领域词典成为目前研究的重点,而构建领域词典的关键是从领域语料中自动抽取领域术语.本文以金融领域作为切入点,提出了根据登录词前后邻接关系计算邻接词之间的双条件概率自动识别领域术语.实验证明,本文提出的算法不仅能够有效地提取新术语,同时在小语料和低词频情况下也能取得较好的效果.  相似文献   

4.
术语自动抽取是信息处理领域的基础性课题,日益受到研究者的关注。似然比方法能有效抽取低频词汇,但抽取准确率偏低。为了解决这个问题,将似然比的抽取结果用C-value进行改进。实验证明,两者相结合,在保证似然比方法高召回率的前提下,比单纯依靠似然比方法抽取准确率提高了约8%。  相似文献   

5.
本体构建的重点在于概念的抽取,针对甲骨文卜辞特有的特征和已有的领域概念抽取算法的缺陷,提出了一种基于上下文语义的甲骨文领域概念抽取算法。该算法针对传统的基于DR+DC的概念抽取算法的缺点进行改进,提出了基于上下文的概念间的相似度的计算方法,并给出了基于语义的领域概念筛选算法。实验数据表明,该方法在准确率和召回率以及困惑度衰减比率都有较大的提高。  相似文献   

6.
基于互信息与词语共现的领域术语自动抽取方法研究   总被引:1,自引:0,他引:1  
领域术语自动抽取是本体建设中最基础最重要的工作。领域术语的自动抽取,通常采用基于规则或者基于统计的方法,这些方法是从术语的完备性,或者是检验术语的领域性进行检验。在前人的基础上提出了一种方法,该方法不仅测试领域术语的完备性,同时测试了其领域性,以期获得更好的结果。实验结果表明,该方法获得的术语准确率得到了一定的改进,准确率和召回率分别达到了81.7%和70%。  相似文献   

7.
随着互联网的快速发展,信息也呈爆炸式增长,如何从海量的文本信息中获取所需的信息成为当今一门重要的课题.检索、分类、抽取等文本信息处理技术取得了长足发展,但面向人物属性的自动信息提取却没有引起人们的重视.基于规则的人物信息抽取算法,首先对需要抽取的信息进行规则描述,重点是时间、地点、籍贯等信息.在规则的基础上,研究开发人物信息抽取系统,最终实现了半结构化人物属性信息的自动提取.  相似文献   

8.
通过分析跨站脚本攻击的特性, 提出一种基于分隔符的跨站脚本攻击防御方法, 该方法适用于UTF-8编码的Web应用程序。首先, 仅对可信数据中的分隔符进行积极污点标记; 然后, 利用字符UTF-8编码值的转换轻量级完成污点标记, 该污点信息可随着字符串操作直接传播到结果页面; 最后, 根据结果页面中分隔符的污点信息及页面上下文分析, 检查脚本执行节点的合法性和脚本内容的可靠性, 精确地检测并防御跨站脚本攻击。针对PHP平台实现了原型系统XSSCleaner。实验证明, XSSCleaner可轻量级地完成污点分析, 并且能够对跨站脚本攻击进行精确防御, 页面生成的时间开销平均为12.9%。  相似文献   

9.
针对传统问答系统答案抽取方式对答案片段的分词和上下文语义理解准确性的依赖严重,抽取过程耗费大量的人力和时间的问题,提出采用分步抽取答案的方法,先从答案片段中抽取包含答案的句子,再从提取的答案句中进行最终答案的抽取方式。在答案句抽取过程中使用Bi-LSTM( Bi-directional Long Short-Term Memory)和Max Pooling 结合的方法构建答案句抽取模型。实验结果表明,在答案句的抽取中,该模型的MRR( Mean Average Precision) 指数接近0. 75。  相似文献   

10.
基于传统卷积框架的实体抽取方法,由于受到卷积感受野大小的控制,当前词与上下文的关联程度有限,对实体词在整个句子中的语义欠考虑,识别效果不佳.针对这一问题,提出一种基于残差门卷积的实体识别方法,利用膨胀卷积和带残差的门控线性单元,从多个时序维度同步考虑词间的语义关联,借助门控单元调整流向下一层神经元的信息量,缓解跨层传播...  相似文献   

11.
徒手体操术语与定位法舞谱作为描述形体动作的工具,它们在理论体系上是不同的,本文通过比较,总结了构成它们各自理论体系的基本原理、描述依据与构成因素等,并指出二者在运用时的准确性、简炼性、易懂性的差异.  相似文献   

12.
介绍了碟式分离机的结构特点,在此基础上,分析了碟式分离机的主要故障。由于碟式分离机的结构和故障形式具有特殊性,因而在设计碟式分离机故障诊断系统过程中,针对不同故障采用了不同的措施来提取能够正确反映设备状态的特征参数。为了能够快速、准确地对碟式分离机的各主要故障进行识别,引入了专家系统和神经网络技术。利用文中介绍的原理和方法设计出了碟式分离机故障诊断系统,在DRJ-460碟式分离机上进行了试验,取得了良好的效果。  相似文献   

13.
基于遗传算法的半导体器件模型参数提取   总被引:1,自引:0,他引:1  
随着半导体器件特征尺寸的缩小,半导体器件模型也变得越来越复杂,模型参数个数急骤增加,目标函数自变量空间的维数也变得越来越大,传统的一些基于梯度的参数提取方法已经不能很好地解决问题。遗传算法是一种应用基因工程和人工智能模拟的优化算法,近年来在半导体器件模型参数提取领域被广泛使用,这种方法能有效地克服传统参数提取方法中的一些困难。详细阐述了采用遗传算法提取半导体器件模型参数的原理,同时也指出了采用这种方法提取模型参数时的缺点和目前的一些解决方法。  相似文献   

14.
介绍了一款基于单片机的空分设备的电路设计,详细阐述了该电路各组成部分的工作原理及软件设计,指出该电路具有安全可靠、价格低廉、结构简单等特点。  相似文献   

15.
韩超  邓甲昊  邹金慧  韩敏 《北京理工大学学报》2012,32(12):1247-1251,1257
为提高对车辆图像的检测程度和实时性,针对智能交通系统,通过对实时路况的信息采集和视频图像的处理,提出了一种基于差分均值的背景提取计算方法和矩阵分区域的阴影检测方法,最终得到一个视频车辆的检测原型,从而实现对运动车辆的检测.实验结果表明,此种方法简单、计算量小、鲁棒性高,能快速地提取出背景图像,检测出比较完整的车辆阴影,可满足多运动目标的实时检测要求.  相似文献   

16.
热分离机内的非正常一维流动   总被引:1,自引:0,他引:1  
分析了热分离机内的不定常流动过程 ,描绘了简化波图 ,指出了影响制冷过程的主要因素  相似文献   

17.
主要介绍了HHT算法的基本概念和基本特征,分析了滚动轴承的故障频率及滚动轴承保持架轻微受损的特征提取。  相似文献   

18.
典型隐马尔可夫模型对初始参数非常敏感,采用随机参数训练隐马尔可夫模型时常陷入局部最优,应用于W eb信息抽取时效果不佳.文中提出基于模拟退火算法与隐马尔可夫模型的W eb信息抽取算法.通过实验比较选择最佳的模拟退火算法参数,结合Baum-W elch算法优化隐马尔可夫模型并应用于W eb信息抽取.实验结果表明新算法在信息抽取的精确率和召回率都有明显的提高.  相似文献   

19.
常规气锚在油气比较高的条件下油气分离效率低,进而导致抽油泵充满度小,泵效低,无法满足高气油比生产井生产要求.且体积大,不便于安装.在此,根据气蚀理论和离心分离原理研制出KZQ-48/89油气分离器.该油气分离器与常规气锚相比具有油气分离效率高,且体积小、安装方便等特点.现场试验表明,该油气分离器具有较强的油气分离能力,油气分离效率较高,极大提高了抽油泵充满度及泵效,可满足高气油比生产井生产要求.该分离器在新疆漠北区块进行试验3井次,成功率达100%,具有较强的实用性和良好的推广应用前景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号