共查询到20条相似文献,搜索用时 0 毫秒
1.
拟基于词映射实现跨语言沟通,缓解缺乏查询-文档语料及语言差异给检索带来的影响,提出一种基于双语交互注意力机制的伪查询句融合方法,通过词映射构造伪查询句,并基于双语交互注意力机制获取跨语言特征表示来实现跨语言信息检索(Cross-language information retrieval,CLIR)。主要包括以下三个部分:首先基于词映射分别构造伪查询句;其次,基于共享Transformer获取查询、伪查询及文档的上下文表示,同时借助查询与伪查询之间的双语交互注意力机制获得查询的跨语言特征表示;最后利用双语交互排序获得查询和文档的匹配分数实现跨语言信息检索。基于英菲、英斯两种低资源CLIR公共数据集和本文构建的汉越数据集的实验结果表明,本文方法相比跨语言检索基线方法,MAP指标分别提升了1.5%和5.4%。 相似文献
2.
自动生成技术在信息提取任务中具有重要作用,为此研究设计了基于双向Transformer编码器(Bidirectional Encoder Representation from Transformers, BERT)的摘要生成模型.模型的掩码方式由casual改为了seq2seq,模型使用改进的随机集束搜索算法(Random Beam Search Algorithm, RBSA)作为解码算法.实验结果显示,RBSA的多样性百分比最高为69.20%,高于对比算法.摘要模型的覆盖度分数为30.12,生成的摘要在数据集1上的ROUGE-1、ROUGE-2、ROUGE-L数值分别为39.11、17.20、29.71,在数据集2上分别为41.21、18.70、38.29,均优于对比模型,可以自动生成中文和英文文本摘要,通过快速提取原文信息提高翻译效率. 相似文献
3.
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。 相似文献
4.
针对汉越跨语言事件检测缺少平行语料,越南语标注困难,需要统一跨语言语义空间,且触发词存在较大的歧义和局限性等问题,提出基于事件类型感知的汉越跨语言事件检测方法。构造类型感知的注意力机制突显事件特征,融入汉越的词位置、词性和命名实体信息,并通过梯度反转(gradient reversal layer, GRL),实现有标注汉语和无标注越南语之间的对抗训练,将从大量汉语新闻文本中学到的语言无关的事件类型特征融入到联合特征提取器中,进行汉越跨语言的无触发词事件检测,缓解越南语的数据稀缺和触发词的局限性。实验中提出的方法较最好的基线模型在准确率上提升了4.32%。 相似文献
5.
利用混沌系统对初始条件和混沌参数非常敏感以及产生的混沌序列具有随机性与不可预测的特性,提出一种构建在Logistic映射上的信息摘要算法.通过将原始明文信息块作为混沌射的初始值,经过混沌系统的迭代得到系统的输出来构建原始明文的信息摘要.利用Jave的BigDecimal类进行了算法的实现,运行结果表明该算法性能良好. 相似文献
6.
当今互联网上语言呈现多样性趋势,如何组织这些多语言的资源成为研究的热点。通过对双语平行语料库提取语义对应关系,构建潜在语义对偶空间,把双语文档映射到此概念空间后,实现跨语言分类。并通过改变训练集样本大小及语言构成来验证模型的分类性能。实验结果表明基于潜在语义对偶空间的跨语言文本分类具有良好的稳定性和准确度。 相似文献
7.
为了解决蒙古族网络用户获取信息困难的问题,通过分析多语言语义词典在跨语言信息检索中的应用,提出采用多语言本体技术构建面向跨语言信息检索的蒙汉语义词典的方法,详细介绍了词典的信息组织模式,并给出计算机术语蒙汉语义词典的查询、推理及词典测试方法. 相似文献
8.
9.
张慧智 《河北经贸大学学报(综合版)》2014,(1):30-32
在认知语言学中,隐喻不但是一种十分重要的语言现象,而且它还是一种重要的思维方式,可以用来帮助我们更好地了解这个世界。隐喻从本质上来说就是一种映射,即从始源域到目标域的映射。爱情,人类情感永恒的主题,其隐喻的表达在英汉两种语言中比比皆是。研究爱情隐喻在两个概念域(始源域和目标域)之间的跨域映射问题,能帮助人们更好地了解爱情隐喻的工作机制。 相似文献
10.
11.
实践发现现存概率语言Power平均算子在应用中存在概率信息丢失、计算过于繁琐等问题,针对这些问题,提出一种基于调和概率语言术语集的Power平均算子。结合新的基本运算法则与新的支撑度,给出新的概率语言Power平均算子、概率语言Power几何平均算子、概率语言Power加权平均算子、概率语言Power加权几何平均算子,同时论证分析了这几类新型算子的性质。最后通过实验数据,将提出的算子与现存算子进行对比分析,验证了所提算子的有效性与可行性。 相似文献
12.
针对评价信息为概率语言术语集,专家权重和属性权重完全未知的多属性群决策问题,提出基于概率语言相关系数的多属性群决策模型.首先定义了概率语言的相关系数并且拓展到概率语言矩阵间的相关系数; 然后基于每个专家的决策矩阵,通过最小化加权相关系数总和求得每个专家的属性权重向量,并且通过决策矩阵的相关系数客观地确定专家权重; 最后将经典的ELECTRE方法加以改进用于方案排序,并且通过算例分析与比较分析证明了该决策方法的有效性与优越性. 相似文献
13.
为解决传统学习算法不能有效利用新可用数据这一不足,提出一种基于自组织映射(SOM)和概率神经网络(PNN)的增量式学习算法——增量式模块化自组织映射概率神经网络(IMSOMPNN)。使用模块化SOM对每类训练数据进行学习,以训练后SOM的原型向量作为此类别的模式神经元来构建PNN。IMSOMPNN可以方便地实现对不同类型的新数据进行增量式学习,并且在进行增量学习时,不再需要利用到原始的训练数据,仅使用新的数据对已有模型进行局部调整;最后,IMSOMPNN还具有较强的抗噪能力。在UCI Landsat Satellite数据集上的实验验证了该文所述方法的有效性。 相似文献
14.
《山西大同大学学报(自然科学版)》2009,25(2):86-86
摘要(abstract)是科技论文的重要组成部分.国家标准化组织IS0214—1976(E)中定义:摘要是对文献内容的准确而不加注释或评论的简略陈述.换言之,摘要是以提供论文内容梗概为目的,不加评论、补充和注释,简明、确切地记述原文内容的短文. 相似文献
15.
基于VIKOR方法解决概率语言术语集语义环境下的多属性决策问题,将概率语言术语集刻画的属性指标与VIKOR方法有机结合,将候选方案的整体效益和个体属性遗憾程度同时纳入决策目标体系,并通过对VIKOR决策的判断准则进行修正,构建PLTS-VIKOR多属性决策模型,克服了以往TOPSIS法、集结算子综合法等在决策机制上的不足.通过决策实例验证了该方法的决策有效性和计算过程的相对简便性. 相似文献
16.
在物联网环境下,大量物品通过各种传感技术加入到网络中。如何有效地组织和管理日益增加的物理资源,如何满足多样化的物联网应用需求,将成为物联网发展中一个非常重要的问题。网络虚拟化技术通过有效地管理虚拟用户请求到物理资源的映射来达到充分共享物理资源的目的,在解决该物联网问题时体现出它的优势。在现有互联网虚拟网络映射算法的基础上,针对物联网环境中物理节点所呈现的异构性特点,提出了一种基于物联网的虚拟网络到物理网络的资源映射算法。 相似文献
17.
语言的性别差异及其对跨性别交际的影响 总被引:1,自引:0,他引:1
男性和女性在跨性别交际中常常出现交际失误。语言的性别差异往往是引起这些交际失误的原因。因为不同性别的交际者在用词、表达方式和会话风格等方面存在着差异。也即,男性和女性因受不同性别文化的影响,各自形成一套不同的语言风格。为避免交际误解,应培养跨性别交际的敏感性,这样才能达到有效交际的目的。 相似文献
18.
针对本体映射特别是大尺度的异构本体映射由于语义异质性导致的映射精度和效率较低的问题,提出一种基于节点语义相似度的本体映射方法.首先,研究基于网络的本体解析和表示、本体自动分块、相似子本体快速识别、基于节点语义的子本体映射等关键技术;其次,以本体对齐评估倡议评估数据集中会议本体集进行实验,结果表明,该方法在性能上优于传统映射方法,在精度上高于基于片段的映射方法. 相似文献
19.
本文介绍了以英语学习者为例的双语者的跨语言结构启动现象,以图片描述法为例简单介绍了三种跨语言结构启动的研究方法,总结了目前跨语言结构启动的研究发现及产生机制,如双语动词句法表征模型等,并针对跨语言结构启动现象提出了其在英语教学上的应用前景。 相似文献
20.
针对跨语言检索中查询翻译歧义问题,文章从藏汉跨语言检索的特点出发,采用了平衡翻译(Balanced Transation)方法,减少了歧义翻译数量,提高了翻译的准确度.在文档索引上,为了弥补藏文分词对于命名实体识别的不足,采用了4元组的索引方法,明显提高了检索的速度和准确度. 相似文献