首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
在中文事件触发词抽取任务中,基于词的模型会受到分词带来的错误,而基于字符的模型则难以捕获触发词的结构信息和上下文语义信息,为此提出了一种基于跨度回归的触发词抽取方法。该方法考虑到句子中特定长度的字符子序列(跨度)可能构成一个事件触发词,用基于Transformer的双向编码器的预训练语言模型获取句子的特征表示,进而生成触发词候选跨度;然后用一个分类器过滤低置信度的候选跨度,通过回归调整候选跨度的边界来准确定位触发词;最后对调整后的候选跨度进行分类得到抽取结果。在ACE2005中文数据集上的实验结果表明:基于跨度回归的方法对触发词识别任务的F1值为73.20%,对触发词分类任务的F1值为71.60%,优于现有模型;并与仅基于跨度的方法进行对比,验证了对跨度边界进行回归调整可以提高事件触发词检测的准确性。  相似文献   

2.
针对现有文本情感分析方法实时性不强、难以应用到大规模文本、不能同时提取文本上下文信息和局部语义特征等问题,提出一种融合双向长短期记忆(LSTM)和卷积神经网络(CNN)的混合情感分析模型通过使用双向LSTM和CNN模型对由word2vec编码得到的文本词向量进行训练,运用注意力机制将双向LSTM模型学习到的特征作用于CNN模型上,并进行特征加权,最后将双向LSTM模型和CNN模型得到的结果进行拼接,由分类器得到相应的情感分类结果在NLPCC SCDL数据集上进行实验,结果表明所提出的融合双向LSTM和CNN模型在精度、召回、f1值和准确度方面优于两个单独的模型  相似文献   

3.
刘芳  张涛 《河南科技》2022,(18):118-121
针对知识图谱中实体关系抽取技术从专利角度进行分析研究。首先分析该领域的专利申请量趋势、国内外主要申请人,然后对该领域的重要专利进行挖掘,在专利挖掘的基础上结合非专利技术文献等内容,对各技术构成的技术演进路线进行梳理,最后得到实体关系抽取技术目前的技术发展概况。  相似文献   

4.
实现彝语文自动分词是计算机彝文信息处理中一项不可缺少的基础性工作,计算机彝文信息处理只要涉及到信息检索、机器翻译、语法分析、语义分析等方面的应用,就都需要以词为基本的处理单位.论文以彝语言的特点作为出发点,首先提出了计算机彝文分词规则与分词词表的设计思路,其次提出了实现计算机彝文自动分词技术的算法基础、系统结构,以及实现流程,而且进行了抽样测试,其分词的速度和准确率都比较高.论文最后根据彝语言的特点对实现计算机彝文自动分词的难点进行了分析.  相似文献   

5.
利用S-粗集[1-7],给出S-知识和S-知识牲征值的概念,S-知识依赖于知识属性集的变化而存在.利用S-知识的特征值,给出知识数据生成的概念,提出知识模型,模型生成特性,模型生成定理.  相似文献   

6.
Web是一个巨大的知识库,作为知识的载体,Web上的海量网页数据包含了各种各样的内容,在这些内容中,命名实体(named entity)是一类重要的内容.随着Web规模的指数级膨胀,如何在海量Web信息中定位自己所需的信息,成为一个非常紧迫的需要.本文结合大量相关文献,对Web命名实体提取的研究工作进行了介绍、分析与比较,并指出了以后努力的方向.  相似文献   

7.
针对局部特征的图像描述模型存在的不足之处,提出了一种结合局部和全局特征的带有注意力机制的图像描述生成模型.在编码器-解码器结构框架下,在编码器端利用InceptionV3和VGG16网络模型分别提取图像的局部特征和全局特征,将两种不同尺度的图像特征融合形成编码结果.在解码器端,利用长短期记忆网络将提取的图像特征翻译为自然语言,借助微软COCO数据集进行模型训练和测试.实验结果表明:与基于局部特征的图像描述生成模型相比,该方法能够从图像中提取更加丰富完整的信息,生成表达图像内容更加准确的句子.  相似文献   

8.
随着社交网络的发展,网络虚拟社区的成员数量快速增长.在虚拟社区中,用户会偏向选择浏览自己喜欢的内容,同时倾向与具有相近或相关兴趣爱好或目的的人进行内容交流与处理合作.在虚拟社区中,用户之间的交互内容以数据、信息和知识的形态存在.虚拟社区上大量的数据、信息与知识形态的网络类型化资源中保留了许多网络用户使用"痕迹".这些痕迹是真实用户的数字化存在代表.为了实现对虚拟社群用户生成内容按照偏好和兴趣进行量化调控,采用数据信息知识及智慧(data information knowledge wisdom, DIKW)图谱对这些类型资源进行建模.根据用户DIKW图谱结合自我构建理论将用户按性格指数进行进一步的归类,并根据DIKW图谱结合自我决定理论将用户的心理需求分类.根据性格指数和心理需求设计了针对不同用户的不同的性格转换方法,模拟了用户生成内容的产生.  相似文献   

9.
深度学习促进了自然语言处理技术的发展,基于文本生成的信息隐藏方法表现出了巨大的潜力.为此,提出了一种基于神经机器翻译的文本信息隐藏方法,在翻译文本生成过程中进行信息嵌入.神经机器翻译模型使用集束搜索(Beam Search)解码器,在翻译过程中通过Beam Search得到目标语言序列各位置上的候选单词集合,并将候选单词依据概率排序进行编码;然后在解码输出目标语言文本的过程中,根据秘密信息的二进制比特流选择对应编码的候选单词,实现以单词为单位的信息嵌入.实验结果表明,与已有的基于机器翻译的文本信息隐藏方法相比,该方法在隐藏容量方面明显提升,并且具有良好的抗隐写检测性和安全性.  相似文献   

10.
基于纹理特征分类与合成的鲁棒无载体信息隐藏   总被引:2,自引:2,他引:0  
针对图像无载体信息隐藏算法嵌入容量与鲁棒性无法很好兼顾的问题,提出了一种基于纹理特征分类与合成的鲁棒无载体信息隐藏算法,使用空间金字塔算法提取纹理图像特征,通过监督式分类训练得到分类模型,同一类别下的不同图像块,利用位置信息进行区分,根据图像块分类和位置信息的不同构建映射字典,传递秘密信息;发送方依据秘密信息选择图像块并根据公共密钥将所有图像块组合为一幅大尺寸图像,通过可逆形变生成复杂的纹理图像并发送给接收方;接收方根据密钥将纹理图像恢复为图像块,利用分类模型识别图像块所属分类并确定位置信息,对照映射字典提取秘密信息.实验和分析表明该算法对JPEG压缩、高斯噪声、椒盐噪声等攻击具有较好的鲁棒性,同时嵌入容量可随图像类别的增加得到提高.  相似文献   

11.
作为Web内容挖掘的重要组成部分,基于Web的命名实体提取与实体关系发现,以海量Web网页中蕴涵的海量实体及丰富的实体间关系为对象,充分利用Web数据本身的特点,发展一整套方法和技术,力求高效、准确地提取Web网页中的实体与关系.  相似文献   

12.
论创新教育     
知识经济时代呼唤创新教育,创新教育需要树立解放思想、实事求是观、创造的价值观、丰富的知识文化观,本文从营造创新性氛围、培养创造性品质及提高信息技术运用能力三个方面阐述创新教育的实施。  相似文献   

13.
付炜 《应用科学学报》2004,22(3):291-297
介绍了地理专家系统的知识化数据模式的设计原理与实现方法,采用知识表示的框架网络结构描述地理环境的实体单元,将各级专家知识的表示以指针链接,形成了由知识到语义的框架网络.采用了基于知识的扩展R-F关系数据模式进行专家知识的表示,并讨论了系统知识库的组织结构和推理机的设计原理.该数据结构可以实现地理实体及其相互关系的完整性描述,并使系统知识库的操作简便易行,保证了推理机的实现.并以乌鲁木齐河流域为试验区,阐述了流域土地合理利用规划决策专家知识的表示方法,以及专家知识表示的基本规则和系统专家知识的组织方式.此外,还讨论了系统推理机推理规则的设计原理与组织方法及推理算法.  相似文献   

14.
应用二值图像信息隐藏技术实现彩色图像中的安全隐写   总被引:2,自引:0,他引:2  
该文提出一种以彩色图像为载体的安全隐写方法,应用二值图像信息嵌入技术,将隐蔽信息隐藏在颜色分量的较高层位面中,可实现优良的隐蔽性和较大的嵌入量.所使用的二值图像数据隐藏方案包括一组完备的规则,能够准确判断边缘像素是否可承载嵌入数据,保证嵌入数据的无差错盲提取,并可引入密钥以增强安全性.实验表明,在彩色图像中数据嵌入量达到每像素1.5 bits时视觉不可察觉,峰值信噪比保持在40 dB以上,直方图无异常,并能抵御多种有效的隐写分析算法,兼顾了隐蔽信息容量和安全性.  相似文献   

15.
针对场景图像的细粒度分类任务,结合图像视觉和文本的多模态信息提出了一种基于注意力网络推理图的细粒度图像分类方法.首先提取场景图像的全局视觉特征、局部视觉特征和文本特征,把位置信息分别嵌入局部视觉特征和文本特征后拼接成新的特征,再将这个新的特征作为图结构的节点生成一个异构图;然后设计两条元路径将异构图分解成两个同构图,并...  相似文献   

16.
一种改进逐字二分中文分词词典设计   总被引:2,自引:0,他引:2  
在研究了多种分词词典机制的基础上,提出一种改进的词典机制.在传统的首字哈希表中增加拼音首字母和次字哈希标志项,在首字哈希表中查询次字的拼音首字母,根据双字以上词的数量决定是否按次字拼音首字母散列到次字首字母哈希表中,以此决定次字的查询方式.在兼顾空间复杂度的同时,缩小次字查询范围能较大幅度地提升高频词的次字的整体查询效率.第3字及其后的字串的匹配仍然采用目前成熟的词典机制.通过实验测试,该机制在增加少量的存储空间情况下,时间效率可提升26%.  相似文献   

17.
本研究选取熟练掌握闽南语和普通话的20名大学生为被试,利用DMDX实验程序,让被试根据视觉或听觉线索词,在闽南语或普通话的语境下进行自由回忆.实验结果表明:1.普通话和闽南语存在言语依赖效应.2.当普通话和闽南语共享相同的文字表征时,语音对记忆依赖的影响更显著.3.语码转换现象出现的次数极少,与言语依赖无关,与被试的闽南语词汇储备量有关.  相似文献   

18.
上下文相关汉语自动分词及词法预处理算法   总被引:8,自引:0,他引:8  
提出了一种适合于汉英机器翻译的上下文相关汉语自动分词及词法预处理算法.该算法采用正向多路径匹配算法和基于上下文相关知识的歧义切分消解算法,充分利用汉英机译系统词典库中的大量语法和语义等知识进行上下文相关的规则推导消歧,使自动分词的准确率达到了99%以上.同时,该算法还对汉语中意义冗余的重叠词和可以与中心词离合的虚词等进行了词法预处理,从而一方面可以减少系统词典的收词量,另一方面方便于对句子的分析处理.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号