共查询到19条相似文献,搜索用时 46 毫秒
1.
在信息抽取中,关系抽取是一项准确识别自然语言中实体间关系的关键技术。针对关系抽取模型中容易丢失关键语义特征问题及远程监督的基本假设容易引入噪声数据的问题,本文提出一种基于远程监督的ENCODER_ATT关系抽取模型。基于循环神经网络构造的ENCODER模型在以词级别进行特征记忆提取,并在句子层面进行语义特征信息整合,保证不遗失关键语义特征的同时去除冗余特征。然后在句子层面引入了注意力机制来降低噪声数据对实验结果的影响。在真实的数据集上进行实验,并绘制准确率-召回率曲线,实验结果表明ENCODER_ATT模型对比同类型的关系抽取方法有明显的提升。 相似文献
2.
3.
关系抽取是许多信息抽取系统中的一个关键步骤,旨在从文本中挖掘结构化事实.在应用传统的远程监督方法完成实体关系抽取任务时存在2个问题:①远程监督方法将语料库中的文本与已标注实体和实体间关系的知识库启发式地对齐,并将对齐结果作为文本的标注数据,这必然会导致错误标签问题;②目前基于统计学的方法过于依赖自然语言处理工具,提取特... 相似文献
4.
远程监督为关系抽取任务提供了大量自动标注的数据集,且领域迁移性强,为实现自动抽取奠定了基础。然而,构造的数据集伴随了强约束性的假设,存在着严重的错误标签问题,且这些噪声数据极大影响了最终的性能结果。为了缓解错误标注的问题,文中提出了一种双重注意力模型:第一层注意力机制通过在句子编码部分引入TransH预训练好的实体向量,与句子特征共同进行注意力选择,为体现关系信息的特征分配更高的权重来提高句子编码质量;第二层则是从句子级别再进行一次注意力计算,挑选出有效的实例,进一步降低噪声数据的权重。通过在广泛使用的数据集上进行多次对比实验,表明文中所提模型可以充分利用所有信息资源,结果明显优于其他基线模型。 相似文献
5.
融合门控机制的远程监督关系抽取方法 总被引:1,自引:0,他引:1
提出一种融合门控机制的远程监督关系抽取方法。首先在词级别上自动选择正相关特征, 过滤与关系标签无关的词级别噪声; 然后在门控机制内引入软标签的思想, 弱化硬标签对噪声过滤的影响; 最后结合句子级别的噪声过滤, 提升模型的整体性能。在公开数据集上的实验结果表明, 相对于句子级别噪声过滤方法, 所提方法的性能有显著提高。 相似文献
6.
针对关系三元组抽取任务中的冗余关系问题和实体重叠问题,提出一种基于关系过滤器的二维实体对标注方案(RF2DTagging). RF2DTagging模型由两部分组成:1)用于过滤冗余关系的关系过滤器(relation filter); 2)能有效解决各种实体重叠问题的二维实体对标注方案(2D entity-pair tagging scheme).为进一步验证RF2DTagging模型,在3个公开的中文关系抽取数据集(CCKS2019-Task3,CMeIE和DuIE2.0)上进行实验.实验结果表明,该模型能有效解决上述两个问题,且总体性能比对比模型更好. 相似文献
7.
在构建中文基础教育知识图谱过程中,使用远程监督的方法能够有效解决训练语料匮乏的问题,同时使用神经网络模型能够提升构建过程中关系抽取的准确率.为了缓解远程监督中引入的错误标签带来的影响,模型通过双向门限循环单元(bidirectional gated recurrent unit)获取双向上下文中的语义信息,同时引入句子... 相似文献
8.
提出了一种将监督学习和半监督学习融合的方法,并用于从文献中自动抽取蛋白质关系.在AImed语料上的实验得到63.2%的F值,这表明该方法达到目前较好的性能. 相似文献
9.
为了提高实体关系联合抽取的效果,提出一种端到端的联合抽取模型(HSL).HSL模型采取一种新的标记方案,将实体和关系的联合抽取转化成序列标注问题,同时采用分层的序列标注方式来解决三元组重叠问题.实验证明,HSL模型能有效地解决三元组重叠问题,在军事语料数据集上F1值达到80.84%,在公开的WebNLG数据集上F1值达... 相似文献
10.
吴友蓉 《科技情报开发与经济》2010,20(7):89-90
介绍了目前最流行的知识抽取方法,分析比较了Amilcare、TEXTRUNNER、Pythor、MnM、Text2Onto、SELKAS等知识抽取系统。 相似文献
11.
组件技术在现代远程教育平台中的应用 总被引:1,自引:0,他引:1
通过分析现代远程教育中基于网络的全新授课与学习模式,结合现代远程教育平台的授课、学习、管理、数据采集、数据分析等各项功能,在平台的具体实现中对应用组件技术进行开发进行了深入地分析和研究。 相似文献
12.
油页岩溶剂萃取技术 总被引:1,自引:1,他引:1
周国江 《黑龙江科技学院学报》2010,20(3):189-193
为实现油页岩的清洁、高效利用,自制液固萃取设备,采用氢氟酸酸化前处理方法,对油页岩进行了溶剂萃取研究。实验结果显示:二硫化碳和N-甲基-2-吡咯烷酮(CS2-NMP)混合溶剂具有较高的萃取率,萃取率可达到8.9%,且萃取物含有的物质数量最多。CS2-NMP萃取物中烃类物质质量分数达到62.1%,成分类似于柴油;且含有β-雌甾醇、L(+)-抗坏血酸等高附加值的化合物。X射线荧光分析和扫描电镜分析发现:经酸化处理后的萃余物因SiO2反应及有机质的溶解,萃余残矿具有良好的孔隙结构。 相似文献
13.
近几年卫生监督工作应用了GPS技术,对提高工作效率,提高快速执法能力,快速反应能力有较大的帮助作用;同时,对于卫生监督执法人员是否按时到达执法地点开展执法工作,在上级下达执法任务给有关人员后,单位运用GPS定位系统具有很好作用监控、监督全体用车人员利用公务车辆离开辖区内到外地去办私事,有制衡作用,这对提高卫生监督人员的整体形象具有十分重要意义。 相似文献
14.
对胜利油田郝现联合站的罐底泥进行了分析,针对油泥特点,进行了化学破乳一溶剂萃取一离心分离的脱油处理技术研究。实验结果表明,室温时在油泥中加入油泥体积2%的破乳剂、80%的提取剂,搅拌均匀,在转速1500r/min时离心15min,脱油率可达91.7%,脱水率为25.5%。溶剂可循环利用,脱除的油可回收。该方法经济可行,为油田油泥砂综合利用或无害化处理提供了一条有效途径。 相似文献
15.
16.
提出一种基于案例分析的文本数据抽取方法,通过将知识进行特征化表示,借助"用户特征—案例特征—案例知识"三者之间的映射关系和概念模块间的知识关联,完成复杂信息的知识抽取,同时引入增量式案例知识学习模型,有效地避免了因人工干预导致的知识拓展的不连续性,提高了抽取过程的识别效率. 相似文献
17.
原油罐底泥的溶剂提取法处理技术 总被引:4,自引:0,他引:4
对胜利油田郝现联合站的罐底泥进行了分析,针对油泥特点,进行了化学破乳溶剂萃取离心分离的脱油处理技术研究。实验结果表明,室温时在油泥中加入油泥体积2%的破乳剂、80%的提取剂,搅拌均匀,在转速1500r/min时离心15min,脱油率可达91 7%,脱水率为25.5%。溶剂可循环利用,脱除的油可回收。该方法经济可行,为油田油泥砂综合利用或无害化处理提供了一条有效途径。 相似文献
18.
油页岩催化萃取工艺 总被引:1,自引:1,他引:1
为探讨温和条件下油页岩催化萃取技术的可行性,以LiCL为催化剂、CS2-NMP为溶剂,对粒级为0.104mm的油页岩进行催化萃取实验,分析LiCl的添加方式、用量及萃取时间对油页岩溶剂萃取率的影响,确定油页岩催化萃取的最佳工艺条件。结果表明:当油页岩用量为5±0.250g时,萃取开始时即添加LiCl,用量为0.25g,萃取时间为12h,萃取率为13.64%。这比文献[3]提高了五个百分点。油页岩原矿、萃余残矿及萃取物的红外光谱(FFIR)分析显示:萃取物中含有大量脂肪族结构和含氧官能团结构的物质,并有少量的芳香类物质;萃余残矿中脂肪族物质以及含氧官能团结构物质相对原矿减少。该研究为油页岩的高效、清洁转化提供了技术参考。 相似文献
19.
本文以新疆农科院轮台果树资源圃提供的11种行人品种为原料,以各种溶剂为提取剂,采用索氏提取法对杏仁油提取率、精制及脱色过程进行研究,并讨论了精制剂和脱色剂的添加量对提取率的影响。结果以正己烷为提取剂、料液比为1:10、提取温度为80℃、提取时间2h、提取次数为2次时,小白杏、大优佳、佳娜丽和大白油杏等4个品种杏仁油的提取率高。精制剂用量为杏仁粗油体积的5%,活性白土用量为杏仁油重量的4%时,脱色效果最佳。 相似文献