首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
根据篇章分析的任务和实践, 结合传统研究, 提出汉语的基本篇章单位为子句, 并从结构、功能、形式等方面给出其定义。分析了逗号与子句的关系, 并在标注语料上进行了基于逗号的汉语子句识别研究。首先手工标注了CTB6.0中前100篇文档的逗号是否为子句边界的信息, 在标注结果中抽取句法、词汇、长度等特征进行实验, 子句识别准确率为90%。然后利用信息增益选出贡献最大的9个特征, 使用它们也可获得较高的子句识别准确率。最后仅使用词法信息, 子句识别准确率可达84.5%。实验证明子句的定义合理, 基于逗号的子句识别在理论上和实验上均可行。  相似文献   

2.
现有基于深度学习的情感原因发现方法往往缺乏对文本子句之间关系的建模,且存在学习过程不易控制、可解释性差和对高质量标注数据依赖过大的不足。为此,该文提出了一种结合规则蒸馏和层级注意力网络的情感原因发现方法。该方法使用结合位置编码和残差结构的层级注意力网络捕获子句内部以及子句和情感表达句之间的潜层语义关系。进而,采用基于对抗学习的知识蒸馏框架将情感原因表达相关的语言学规则引入模型,最终实现结合深度神经网络和语言学规则的情感原因发现。在中文情感原因发现数据集上的实验结果显示,该方法F1值比现有最优方法提升约0.02,达到了已知的最佳性能。  相似文献   

3.
本文介绍了一个分布式知识库系统DKBS/TH—1的结构模型。它以PROLOG作为推理工具,Unify关系数据库系统作为存放知识的机构,二者之间通过一阶谓词逻辑的子集Horn子句进行联系.分布式系统中各结点之间的通讯联系也由Horn子句来实现,本文还讨论了PROLOG与关系数据库的结合方法及查询优化的技术.  相似文献   

4.
基于本体的文档语义标注改进方法   总被引:2,自引:0,他引:2  
在领域本体知识的语义环境和资源文档结构基础上,提出一种文档语义标注改进方法,分析、计算标签一文档的词频相关性和语义环境在局部窗口的共现性,实现对各类文档资源的语义标注.该方法首先提取出文档资源的纯文本内容,并分解出子句、句和段落集合.然后,对于每个具体的领域知识项,在本体知识库中寻找其语义环境信息.最后,按照7条相关度规则,分别计算出这些信息与分解后文档内容的相关度,从而完成整个文档库内和知识库内的综合计算,得到该项知识与文档资源的最终相关度.卖验结果显示,该方法能够依据领域本体,有效地对互联网中大量以网页等形式存在的多种类文档知识资源进行自动语义标注.  相似文献   

5.
为了提高综合系统的效率,减少对综合系统的人工干预,提高其自动化程度,对VHDL硬件描述语言中的AFTER子句进行研究.通过对其行为综合语义的定义,给出了在AFTER子句时延约束下的ASAP和ALAP算法,建立了AFTER子句时延约束下的调度模型,并采用整数线性规划法求解调度模型.实验结果表明,在综合过程中考虑AFTER子句,不仅提供了一个有效给出时序约束的手段,而且使得设计描述方式更能够符合思维习惯,同时扩大了行为描述中可用语法范围,提高了行为综合的可预见性.  相似文献   

6.
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理RDF文档之外,还试图从传统HTML网页中通过强化学习的方法发现更多RDF文档链接.  相似文献   

7.
以W3C关于XML查询语言的推荐标准XQuery数据模型为基础,定义了XML(eXtensible Markeup Language)文档更新粒度,设计了XML文档更新语言XUL,对删除、重命名、前插入、后插入、追加和替换6种更新子操作进行XQuery语法形式的描述,并通过示例表述了更新操作的语义,同时考虑了有序和无序文档.最后提出了一种基于关系数据库存储策略的XML文档更新的实现架构,在Kweelt系统基础上实现了XUL定义的更新操作.  相似文献   

8.
提出一种基于最大树法的生成多文档文摘子主题划分方法.对多文档集合中的句子进行基于语义词典的相似度计算,形成相似度矩阵.提出了将相同或相似的句子通过模糊聚类的方法归并成一类,每一类代表一个子主题,通过抱团结构分析划分出子主题.实验结果表明,生成的多文档文摘覆盖性强,冗余信息少,具有一定实用价值.  相似文献   

9.
一个子句(或基本子句集合)的非模型是不满足该子句(或基本子句集合)的解释.本文给出计算有限基本子句集合的非模型个数的一种方法,并使用概率的观点从理论上加以证明.  相似文献   

10.
利用正交方法解SAT问题   总被引:1,自引:0,他引:1  
提出了一种解决SAT问题的新算法.该算法首先定义了子句之间的正交关系;然后从消除子句之间的交叠信息出发,利用正交子句的特性,结合有效的简化技术,逐渐将问题简化为一组与原问题完全等价的正交子句组;最后,根据正交子句组对整个赋值空间的覆盖情况来判断SAT是否满足.该算法为SAT问题的解决提供了一个新的思路.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号