首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
采用一个自建的汉语篇章结构语料库(隐式关系占80%)进行隐式关系识别。语料中将篇章关系分成3个层次, 第一层包含因果、并列、转折、解说四大类。在此语料上, 利用上下文特征、词汇特征、依存树特征, 采用最大熵的分类方法对四大类关系进行识别。实验结果显示, 总正确率为62.15%, 其中并列类识别效果最好, F1值达到75.26%。  相似文献   

2.
隐式篇章关系识别是篇章分析领域中极具挑战性的子任务,其挑战性在于难以捕捉论元之间的交互信息,并对这类交互信息进行联合的表示学习(交互信息即为论元中有益于体现关联关系及关系类型的词义和语义信息)。针对这一问题,文章提出一种基于堆叠式注意力机制的隐式篇章关系分类方法,即,将论元的自注意力分布特征应用于论元之间的交互式注意力计算,通过自注意力和交互式注意力的信息融合,加大了论元间关联信息的权重。文章利用宾州篇章树库(Penn Discourse Treebank,PDTB)语料进行实验。实验结果表明,相较于基准系统,该方法的F1值在四大类关系上分别提高了6.47%、3.94%、3.82%和6.57%,准确率分别提高了6.41%、2.68%、6.88%和3.82%。  相似文献   

3.
隐式篇章关系识别的主要挑战是如何表示两个文本单元的语义信息.由于句子的语义信息往往由语法树中的信息焦点(谓词部分)所决定,所以关注信息焦点可以提升篇章关系识别的效果.为了增强信息焦点的作用,引入树状长短时记忆(tree-structured long short-term memory,Tree-LSTM)网络,使用其遗忘门的特性区别对待不同孩子节点的信息.最后利用神经张量网络(neural tensor network,NTN)来计算两个句子语义向量之间的关系.基于PDTB2.0(Penn Discourse Treebank)语料数据进行实验,实验结果表明混合树结构神经网络比传统的RNN模型在大部分关系中的Fscore上提高了3.0%左右.  相似文献   

4.
信息抽取技术中,隐式篇章关系识别一直是研究难点.针对现有的有监督篇章关系识别方法中需要大量人工标注数据的缺点,提出了用自训练的策略实现半监督的隐式篇章关系的自动识别模型,尝试仅用少量标注样本,却获得和有监督方法相媲美的识别准确率,为未来实时大数据篇章关系识别提供了新的契机.此外,为了进一步提高识别的准确率,还针对词对特征、产生式特征、动词特征等9种篇章关系特征进行特征组合分析,构建候选篇章关系实例的知识表示,对模型进行优化.通过在Penn Discourse Treebank(PDTB2.0)语料库上的实验结果分析表明,该模型比传统有监督识别方法在准确率和F-score上分别提高了5.2%和13.5%.  相似文献   

5.
针对篇章隐式关系检测较难的问题,提出了一种基于语义场景匹配的平行推理方法。该方法利用框架语义学,将论元抽象为概念一级的语义描述(简称语义场景),实现描述形式的压缩。基于大规模静态数据,通过语义场景的匹配挖掘可比较论元辅助关系推理。该方法能够在保证检测精度的同时,提升检测效率。利用宾州篇章树库(penn discourse tree bank,PDTB)对这一检测方法进行评测,检测精度为55.26%。  相似文献   

6.
针对中文细粒度隐式篇章关系识别进行研究。考虑细粒度篇章关系的方向性特点, 提出一种基于远距离监督的特征学习算法。该算法使用远距离监督的方法, 自动标注显式篇章数据, 然后利用词与连词之间的相对位置信息, 训练各个词的词表达, 将词的修辞功能以及关系的方向性编码到密集词表达中, 将这样的词表达应用到细粒度隐式篇章关系分类器。实验结果表明, 在细粒度隐式篇章关系识别任务中, 该方法的分类准确率达到49.79%, 比未考虑篇章关系方向性的方法有较大程度的提高。  相似文献   

7.
8.
将篇章结构表示为小句关联结构,与修辞结构等层次化篇章结构模式相比,可以有效地刻画非连续和跨层级的小句之间的直接语义关联。首先,提出篇章小句关联结构的形式表示、判断准则和形式限制,并进行人工标注。然后,对汉语篇章小句关联结构进行自动识别。在自建汉语篇章小句关联结构语料库上,基于分类模型,设计连接词和词汇等分类特征,得到的最佳识别准确率达92.70%。实验结果表明,语料整体取样比独立取样取得的去环效果好;词汇、小句距离及句域等分类特征对识别的贡献较大;远距离和跨大句是小句关联识别的难点,但相邻小句和同一大句内的小句对的不相关识别难度更大。  相似文献   

9.
为解决课程评论中隐式评价对象识别问题,提出了一种基于文本分类的隐式评价对象的识别方法。首先通过word2vec 模型获得训练文本对应的词向量,获得短文本特征; 其次将短文本特征在TextCNN 中进一步提取高层次特征,通过K-max 池化操作后放入Softmax 分类器中进行训练得出分类模型; 最后利用训练好的分类器对隐式评价句进行分类,获取隐式评价句对应的评价对象。实验表明,基于卷积神经网络对隐式课程评论进行属性分类,课程评论的隐式评价对象识别正确率达到89. 9%,满足了课程评论中对隐式评价句对象识别的需求。  相似文献   

10.
针对人脸识别中存在的遮挡、阴影、反光等不同程度的数据破坏以及训练样本不充足导致识别率低的问题,提出一种基于隐式低秩表示联合稀疏表示(LatLRR_SRC,Latent Low-Rank Representation Sparse Representation Classification)的人脸识别方法.该方法首先采用隐式低秩表示(LatLRR,Latent Low-Rank Representation)算法将训练样本矩阵分解为两个低秩逼近矩阵和一个稀疏误差矩阵.然后将低秩逼近矩阵和稀疏误差矩阵联合构成完备字典,并用K-SVD算法对字典进行学习,得到测试样本在学习后字典下的稀疏表示.最后对测试样本利用上述隐式低秩表示分解的三部分的稀疏逼近计算残差,完成测试样本的分类识别.在Extend YaleB和CMU PIE人脸数据上的实验结果表明,基于LatLRR_SRC的人脸识别方法具有较高的识别率和稳定性.  相似文献   

11.
基于稀疏表示的步态识别   总被引:1,自引:0,他引:1  
提出一种基于稀疏表示的方法,采用CASIA-B和CUSD步态数据库进行步态识别.首先对步态序列中心化及归一化处理,之后提取了步态的主动能量图像(AEI),AEI很好地表达了步态中的动态信息,以此作为步态的特征图像,并对特征AEI采用两种方式稀疏表示:一是采用基于重构误差的方法建立字典、更新字典及分解系数;二是采用基于区分辨别字典的方式建立字典、更新字典及分解系数.系数分解采用的是正交匹配追踪算法.实验证明提出的方法识别准确性高,识别速度快,适合实时性要求高的场合.  相似文献   

12.
13.
为了提高跨视角下的步态识别率,分析识别率低的原因,原因之一归咎于通常采用线性降维的方法进一步提取步态特征,而实际上,特征数据之间可能存在着非线性的关系,故采用核主成分分析法对特征数据进行非线性降维处理,设计了一种核协同表示的步态识别方法。该方法获取步态能量图,采用核主成分分析法对步态能量图数据进行非线性降维处理并提取步态特征,并用协同表示的方法进行分类。实验结果表明:在90°视角下,采用多项式核函数的识别效果明显优于采用高斯径向基核函数的识别效果;该方法在跨视角下取得了显著的识别效果,与其他算法相比,识别率提高了10%以上;该方法的识别速度约是协同表示的识别速度的1~2倍。  相似文献   

14.
篇章翻译是近来兴起的研究热点,如何在翻译文档时充分利用篇章信息一直是该研究的关键点和难点.在篇章级机器翻译中,如何选取当前句的篇章上下文是非常关键的.虽然相关研究使用的篇章上下文不尽相同,但是却少有在选取之前对上下文信息进行识别筛选.本文提出了一种融合篇章上下文有效识别的篇章级翻译模型,引入判别篇章上下文是否有效的分类...  相似文献   

15.
针对基于骨架的单一特征的算法在异形纤维图像识别方面的不足,提出一种基于骨架特征并融合其他几何特征的层次化识别算法.首先采用轮廓跟踪算法将骨架信息映射到一种骨架树结构中,然后构造骨架特征邻接矩阵并求出该矩阵特征值,以特征值对异形纤维图像进行大类识别,再结合骨架周长统计特征和异形纤维图像轮廓的凹凸特征对每一大类异形纤维图像...  相似文献   

16.
通过分析基于隐马尔可夫模型(HMM)语音识别的原理,针对模板提取过程中语音信号的基音频率差别增大而出现的语音识别率下降的问题,提出分类识别的方法,通过采用基音周期(Pitch)判决方法,将特征相近的帧合并,并计算基音频率的MEL频率倒谱系数,采用隐马尔可夫模型(HMM)进行语音识别,最终通过仿真实验验证分类识别方法对语音识别率提高的影响,得出此方法的适用环境和范围.  相似文献   

17.
本文提出一种基于稀疏表示的掌纹识别新方法。该方法将测试掌纹图像表示为训练掌纹图像的线性组合,其表示的系数是稀疏的,最大系数所对应的类别即掌纹的类别。对于包含大量噪声和大面积遮挡的掌纹图像,我们把这样的掌纹图像看作是原始掌纹图像和噪声(或者遮挡物)的相加,对于原始掌纹图像和噪声(或者遮挡物)分别用不同的基来稀疏表示,这样可以有效地分离看掌纹和噪声(或者遮挡物),自然可以达到较好的识别率。  相似文献   

18.
基于八叉树的隐式曲面与隐式曲面求交   总被引:5,自引:0,他引:5  
先将隐式曲面进行多边形化,两隐式曲面的求交,采用八叉树来搜索它们相应的两组多边形面片的交线,这一方法既避免了解析法对所给定隐式曲面要有特殊的局限性,又有克服数值法遇到初始点选取和迭代收敛性问题,算法准确可靠。  相似文献   

19.
提出一种基于隐Markov模型(Hidden Markov Model,HMM)的图像方位识别方法.将待识别的目标图像进行分割,对子图像进行奇异值分解,提取奇异值向量形成观测序列,即图像奇异值向量作为HMM的观测向量.确定HMM参数并计算其最大似然概率,按待识别图像最大似然概率对应所属的聚类进行识别.实验结果表明,3类共150幅目标图像的识别率达到了85%.  相似文献   

20.
利用隐马尔可夫模型训练中不同结构的DNA序列的L值分布范围不同的特点,对传统多类投票模型进行改进,提出一种优于传统算法的快速训练算法,该算法只需训练出一类隐马尔可夫模型参数.对DNA内含子和外显子序列进行识别,平均识别率达到了90.8%.与支持向量机相比,隐马尔可夫模型在解决多分类问题方面具有优势,不但计算时间少,而且识别率高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号