首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 244 毫秒
1.
全面准确地标注Deep Web数据是实现Deep Web数据集成系统的关键问题,然而现有的DeepWeb数据语义标注方法还不能很好地解决这一问题.提出一种基于CPN网络的Deep Web数据语义标注方法,通过提取属性值的基本特征,采用CPN网络实现Deep Web数据语义标注.同时,采取了一种有效的方法准确获取Deep Web结果页面中的属性值,为语义标注奠定了良好的基础.与同类成果相比,基于CPN网络的Deep Web数据语义标注方法提高了语义标注的准确率及召回率.  相似文献   

2.
将句法分析与词义消歧相结合, 根据层次化语义知识的句法分析框架, 在句法分析训练过程中, 利用句法结构信息对文法模型进行调整, 解决了引入语义时所面的歧义问题, 构建一种句法分析和词义消歧的 一体化方法。实验表明, 在句法分析过程中进行词义消歧处理, 使句法分析的性能显著提升, 同时也获得词 将句法分析与词义消歧相结合, 根据层次化语义知识的句法分析框架, 在句法分析训练过程中, 利用句法结构信息对文法模型进行调整, 解决了引入语义时所面对的歧义问题, 构建一种句法分析和词义消歧的一体化方法。实验表明, 在句法分析过程中进行词义消歧处理, 使句法分析的性能显著提升, 同时也获得词义消歧能将句法分析与词义消歧相结合, 根据层次化语义知识的句法分析框架, 在句法分析训练过程中, 利用句法结构信息对文法模型进行调整, 解决了引入语义时所面对的歧义问题, 构建一种句法分析和词义消歧的一体化方法。实验表明, 在句法分析过程中进行词义消歧处理, 使句法分析的性能显著提升, 同时也获得词义消歧能力。  相似文献   

3.
提出一种利用规则与统计相结合的方法用于英汉机译系统中以消解语义级歧义 ,建立了一种根据单词之间的词语搭配关系以消除歧义的模型。该模型利用英汉双语语料选择合理的词组语义 ,对有歧义的单词作出标注。在此基础上给出了语义消歧的学习算法 ,并建立了一套有效的提高召回率的消歧算法。算法在英汉机译系统中的实际应用使正确率提高了约 10 % ,效果显著。  相似文献   

4.
中文分词是中文信息处理的前提和基础.文章综合基于词典的分词方法和统计的分词方法的优点,旨在提出一种基于词性标注与分词消歧的中文分词方法,针对初次分词结果中的歧义集进行对比消歧.利用正向、逆向最大匹配方法以及隐马尔可夫模型进行分词,得到三种分词结果中的歧义集.基于词信息对歧义集进行初次消歧.通过隐马尔可夫模型标注词性,利用Viterbi算法对每种分词结果选取最优词性标注.并基于定义的最优切分评估函数对歧义集进行二次消歧,从而获得最终分词.通过实验对比,证明该方法具有良好的消歧效果.  相似文献   

5.
维吾尔语是典型的资源稀缺型语言,由于词义消歧标注语料资源和语义分析工具的不足,导致传统的有监督方法难以实现.针对该问题,将篇章文本的词义消歧问题类比为文本主题分类问题,在LDA(latent Dirichlet allocation)主题模型的基础上提出了一种维吾尔语无监督词义消歧模型.为强化主题模型对歧义词语义项的分类性能,加入了3个数据预处理过程:去除停用词,过滤有效词和强化同义词词频权重.实验结果表明,在随机抽取的63组测试样本集中,该模型的词义消歧准确率达到65.08%,在篇章文本采样词任务中词义消歧准确率达到61.2%.  相似文献   

6.
语义歧解对交际造成的影响多是消极的,避免歧义和误解成了修辞的基本原则;但如何利用语境所造成的歧义多解来构造幽默,也是修辞研究的课题。在言语交际中,歧解在语音、语义、语用等方面构造幽默的功能是独具特色的  相似文献   

7.
语义歧义大量存在于自然语言中,其排歧成功率是衡量机器翻译、信息检索、文本分类等自然语言处理软件性能的重要指标.对语义消歧这一自然语言理解领域的难点技术问题进行了探讨,分析了统计学习方法在语义消歧中的应用,阐述了统计语义消歧的有关技术,并给出一个基于贝叶斯与机读词典的语义消歧实例,取得了较高的语义消歧成功率.  相似文献   

8.
由于造型原理、方法等原因,三维模型中的面往往不具有明确的工程语义,使三维模型上标注工程尺寸等信息易产生歧义,目前商用CAD软件没有很好地解决该问题.基于OpenCASCADE几何造型内核研究了解决该问题的方法,提出造型面和工艺面的概念,通过对造型面的数学属性识别,结合机械工程中工程语义,将造型面进行绑定,形成符合工程语义的工艺面,把模型三维标注信息作为工艺面的属性,增加了系统三维尺寸标注的智能性,也为后续的产品虚拟装配、加工制造以及产品服役中语义信息的自动提取提供可能.  相似文献   

9.
在自行研究和开发的基于知网的语义剪枝系统中,对大规模语料库中的语料多义词进行知网释义的自动提取,然后进行语义剪枝.将语义剪枝系统的实验结果与人工标注的结果相比,来解决自然语言处理过程中的词义排歧问题.其目的是通过语义剪枝系统尽可能地减少歧义词在上下文中的错误的或最不可能的义项.语义剪枝后形成一个词和其可能义项的列表,尽量将一个词真正正确的义项保留下来.使用召回率和简化率两个指标对语义剪枝算法进行评价,结果表明窗口尺寸和分析单元的选取对召回率和简化率有影响.  相似文献   

10.
基于深层特征抽取的日文词义消歧系统   总被引:1,自引:0,他引:1  
词义消歧的特征来源于上下文.日文兼有中英文的语言特性,特征抽取更为复杂.针对日文特点,在词义消歧逻辑模型基础上,利用最大熵模型优良的信息融合性能,采用深层特征抽取方法,引入语义、句法类特征用于消解歧义.同时,为避免偏斜指派,采用BeamSearch算法进行词义序列标注.实验结果表明,与仅使用表层词法类特征方法相比,本文构造的日文词义消歧系统的消歧精度提高2%~3%,动词消歧精度获得5%的改善.  相似文献   

11.
在字面相同语义不同和字面不同语义相同的情况下,短文本匹配往往不能准确地得到语句间语义的相似程度。针对这一问题,提出一种融合语境语义差异特征的短文本匹配模型。该模型以BERT系列的语言模型作为基础匹配模型,采用一种新的Diff Transformer结构作为差异特征提取器,并以门控方式融合基础语义表示和差异特征表示来提升匹配效果。在中文测试数据集上的实验结果表明,所提出的模型可以达到先进模型的效果。  相似文献   

12.
双语影视知识图谱的构建研究   总被引:1,自引:0,他引:1  
提出一种双语影视知识图谱(BMKG)的构建流程。通过半自动化的方法构建了双语影视本体(BMO), 将各个影视数据源对齐到BMO, 以保持异构数据源的语义描述一致性。在知识链接方面, 在充分挖掘和利用领域特征的基础上, 采用基于Word2Vec 和TFIDF 两种向量模型的实体相似度计算方法, 使相似度特征增加一倍, 大大提升了模型的链接效果。在实体匹配方面, 提出基于相似度传播算法的实体匹配算法, 并利用影视数据源之间的内在联系, 克服了跨语言实体之间计算相似度的语言障碍。实验结果表明, 当阈值取到0.75 以上时, 实体匹配的准确率都能达到90% 左右。此外, 还建立了影视知识图谱共享平台, 并提供开放性的数据访问和查询接口。  相似文献   

13.
云制造中加工设备资源语义模型研究   总被引:1,自引:1,他引:0  
为了解决云制造环境下加工设备资源的虚拟化封装问题,建立了一种开放的、柔性的加工设备资源模型。在深入解析制造资源内涵、分类、特性的基础上,分析了加工设备资源的特点,结合语义知识和WEB技术,建立了加工设备资源模型。给出了加工设备资源语义描述方法,建立了描述模板。最后详述了云制造资源匹配流程,为云制造平台资源管理提供了重要基础和条件。  相似文献   

14.
现代战争需要对多源异构的装备数据进行高效集成。针对不同来源数据中装备名称不一致的问题,设计了装备数据的聚合模型和聚合流程,在综合分析现有算法的基础上,结合装备名称特点为该模型提供了一种新的相似度匹配算法,算法将Jaro-Winkler和最长公共子序列相结合,以提高匹配的精度。最后通过实验进行了验证,结果表明该算法与传统相似度算法相比具有较高的适配性和鲁棒性,可以为装备数据聚合工作提供有效支撑。  相似文献   

15.
D-S证据理论可应用于多源数据融合领域,但在处理高度冲突的证据时,可能会出现反直觉的结果.为解决这一问题,本文提出了差异信息量的概念及融合方法.首先,通过信息熵表明证据的相对重要性,采用散度获取证据可信度.然后利用证据可信度优化证据差异度以得到差异信息量,经过计算获取数据的最终权重,并将其作为D-S证据理论中的基本概率分配进行决策.在处理冲突证据、一致证据及不同数量证据等方面的数据融合问题时与其他方法对比,所提方法收敛更快,准确度更高.故障诊断的应用实例表明,所提方法的不确定性更小,优于现存的其他方法.  相似文献   

16.
采用半自动化的方法构建中文影视知识图谱。以国内影视领域数据为研究对象,对豆瓣网、百度百科和时光网的数据进行本体对齐,使异构数据源语义描述一致。在知识融合方面,借鉴并优化了Similarity Flooding算法的核心思想,实验结果表明,实体匹配的准确率基本保持在85%以上。建立了中文影视知识图谱可视化平台,并提供开放性的数据访问和查询接口。  相似文献   

17.
To solve the problem of information fusion from multiple sources in innovation alliances, an information fusion model based on the Bayesian network is presented. The multi-source information fusion process of innovation alliances was classified into three layers, namely, the information perception layer, the feature clustering layer,and the decision fusion layer. The agencies in the alliance were defined as sensors through which information is perceived and obtained, and the features were clustered. Finally, various types of information were fused by the innovation alliance based on the fusion algorithm to achieve complete and comprehensive information. The model was applied to a study on economic information prediction, where the accuracy of the fusion results was higher than that from a single source and the errors obtained were also smaller with the MPE less than 3%, which demonstrates the proposed fusion method is more effective and reasonable. This study provides a reasonable basis for decision-making of innovation alliances.  相似文献   

18.
Multi-source network coding allows intermediate nodes to linearly combine packets from multiple sources, but it is vulnerable to pollution attacks which can cause multiple downstream data to be polluted. To solve this problem, we take advantage of lattice signature and homomorphic property to build a secure multi-source network coding scheme. By means of the lattice basis delegation algorithms, our scheme can generate a public lattice for all source nodes and the homomorphic signatures can be calculated on this lattice. Consequently, the multi-source signature problem can be transformed into single-source signature problem only if all source nodes are considered as a whole. Scheme analysis shows the correctness and homomorphic property of the proposed scheme.  相似文献   

19.
在联合作战体系中,数据作为基础性战略资源发挥着重要的底层支撑作用,数据妥善管理和高效利用是推动作战能力整体跃迁和作战样式深度变革的重要动力。为实现不同作战系统间信息的互联互通,提出 一种基于联邦学习的多源异构网络无数据融合方法。从多源数据融合面临的安全性和异构性问题出发,利用条件生成对抗网络提取本地知识和全局分布,集成数据信息;结合局部教师模型-全局模型架构,以无数据知识蒸馏的方式对局部模型知识进行迁移,融合异构网络,细化全局模型,实现不同系统间安全、高质量的信息交互,为智能化指挥信息系统建设提供技术支撑。实验结果表明:该方法在结构化数据和图像数据上具有可行性,整体准确率可达到80%以上。  相似文献   

20.
为了对微环境监测平台上的传感器所捕获的异构、大量、连续的数据流进行语义注释,从而及时地根据语义上下文推理出新的或隐含的知识,以实现微环境监测平台的实时监测,对SASML映射语言和SDRM算法进行了研究和改进,设计了S-SASML映射语言和SDS2R算法,用于将传感器原始数据流转换为符合SOSA/SSN本体的RDF数据流;并利用线程池技术实现方法的高并发处理,提高了方法的实时性能。改进后的映射语言和算法实现了微环境监测平台对连续、大量的数据流的实时语义注释,不仅解决了动态传感器数据流语义注释的问题,而且避免了高频数据流导致的系统过载现象,具有稳定高效的处理能力,基本满足了微环境监测平台的需求,具有一定的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号