首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 250 毫秒
1.
多文档自动摘要研究是自然语言处理领域的关键问题之一,为使抽取的摘要更能体现多文档主题,本文在子主题划分的基础上,提出了一种融合句义特征的句子优化选择方法.该方法基于句义结构模型,提取句义结构中的话题、谓词等特征,并融合统计特征构造特征向量计算句子权重,最后采用综合加权选取法和最大边缘相关相结合的方法抽取摘要.选取不同主题的文本集进行实验和评价,在摘要压缩比为15%情况下,系统摘要平均准确率达到66.7%,平均召回率达到65.5%.实验结果表明句义特征的引入可以有效提升多文档摘要的效果.   相似文献   

2.
BFS-CTC汉语句义结构标注语料库构建方法   总被引:7,自引:3,他引:4  
根据现代汉语语义学,构建了一种层次化的句义结构模型.基于该模型构建了汉语句义结构标注语料库(Beijing forest studio-Chinese tagged corpus,BFS-CTC).利用自行开发的标注和管理工具,对模型中各个句义成分及其组合关系进行快速标注,降低培训工作量和标注成本.BFS-CTC涵盖了6种句式类型,约1万句,提供了符合现有规范的词法和句法标注信息与自定义规范的句义结构标注信息,便于词法、句法和句义的对照分析研究,以及语料的综合使用和横向分析.此外,BFS-CTC还具有较强的可扩展性,可在核心标注库基础上扩展生成其它扩展库和标注资源.  相似文献   

3.
为了有效识别中文微博的观点句,提出了基于Hownet词典及模板的特征提取方法,并使用SVM算法对微博中的观点句进行识别。运用新设计的一个模板匹配的方法来进行特征提取,并通过计算其信息增益筛选出最后的特征模板。实验结果表明:算法具有优越性和有效性。  相似文献   

4.
汉语句义结构模型及其验证   总被引:2,自引:1,他引:1  
为解决计算机理解和表达汉语句义的问题,以现代汉语语义学理论为基础,探索和创建了一种计算机可计算、可扩展的汉语句义结构模型,该模型从句义层次上描述构成句子的词、子句、分句在句义中承担的句义任务,句子描述对象的时空特征、谓词的时态以及不同句义成分之间的组合关系等,形成了一种抽象句义的结构化表达形式;同时,提出了一种基于反向提问的句义结构模型验证方法,用疑问词替换语义格迭代构成问句,再对问句进行评价.实验结果表明,对简单句义、复杂句义和多重句义的反向提问正确率达到92.07%,充分说明句义结构模型的合理性.   相似文献   

5.
针对传统故障诊断方法耗时长、人工成本高且工作效率低以及现代故障诊断过于复杂的问题,提出了一种直接对振动信号进行关键特征筛选提取的方法,并结合经典的C4.5算法、Cart算法、BP算法和SVM算法对滚动轴承进行在线的故障诊断。研究结果表明,基于C4.5算法、Cart算法、BP算法和SVM算法模型的诊断方法均可对滚动轴承在运行过程中是否出现了故障以及出现了什么故障进行较为精准的识别和分类,且具有较高的准确率,可以达到很好的故障监测效果以及故障诊断效果。基于SVM算法的故障诊断模型诊断准确率优于其他三种算法,更加适用于滚动轴承的故障诊断。  相似文献   

6.
"偏偏+VP"格式及相关问题   总被引:2,自引:0,他引:2  
文章论述了现代汉语中的“偏偏+VP”格式在语义方面所表达两种语义:一是表背离性的“结果义”;二是表一致性的“行为义”。该格式在语用功能方面有两种:一是“凸显”的功能;二是“反驳”的功能,同时反驳具有程度差异。另外,表行为义的“偏偏+VP”格式能形成取舍句,而表结果义的“偏偏+VP”格式不都形成取舍句。  相似文献   

7.
通过对句子语义表示的深入分析,提出汉语句义的三维表示模型,并在此基础上提出一种基于句义三维表示模型的句子相似度计算方法.该方法从义面、义原、义境三个侧面来综合描述句子的语义,并通过迭代求解各方的权重,从而使计算结果达到最优.与传统的方法相比,更加全面、准确地衡量句子之间的相似度,取得了较好的实验结果.  相似文献   

8.
句子的语义是一个系统,组成句义系统的语义单位可以从小到大划分为义征、义词、义组和义句.义征规定着义词之间组合的可能性以及组合后的语义关系;义词是语义结构的最小单位;义词和义词之间通过义征匹配关系组成义组;义句是以句子的形式负载一个完整信息的语义单位,是句子语义结构的最大单位.  相似文献   

9.
为了从高光谱遥感影像中高精度提取各种线形道路,提出了基于支持向量机(SVM)的道路特征快速提取算法,首先利用PCA对高光谱影像进行合理压缩,由SVM模式识别理论推导出该算法具有快速精确提取道路网信息的能力,针对高光谱遥感影像高信息量和道路网复杂度高的特点,提出基于1Vm(一对多算法)的多种道路SVM一次性高精度提取的多分类策略,在提高精度的同时,兼顾了道路特征识别的效率。研究结果表明:SVM对线状道路模式判别能力比常规方法有更强的优势,对小样本的道路识别效果更加明显,从遥感影像中不仅能准确地辨别出道路的线形特征,还能识别出其材质和类型;该算法能同时识别出多种道路,执行效率更高。  相似文献   

10.
一种PCA和SVM多生物特征融合的视频人脸识别   总被引:1,自引:0,他引:1  
分析了视频人脸跟踪识别过程中高效特征提取、长时间人脸遮挡、光照变化及多目标跟踪识别等问题,讨论了基于PCA和SVM人脸识别优点及不足,提出了基于PCA和SVM多生物特征层融合的人脸识别模型,设计了多生物特征人脸识别算法,对实验过程进行了描述并对实验结果进行了分析.结果表明,提出的算法识别率高于任一单一算法、更适合实时视频监控取证系统使用.  相似文献   

11.
提出一种基于语义核函数的问题分类算法,该算法基于问题的语法结构构建支持向量机(SVM)核函数.首先,将给定的问题解析为语法树结构,用语法树的子树表示该问题;然后,从词法、语法、语义三个层面提取问题的特征,构成更加丰富的特征空间;接着,基于问题的语法树构建核函数;最后,使用潜在语义索引方法并结合问题的词法、语法以及语义特征,通过语义核函数将特征空间映射到更有效的空间中进行问题分类.TREC数据集上的实验结果表明,通过词法、语法以及语义增强的问题特征空间可以提高分类准确率.  相似文献   

12.
针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haar-like声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升.   相似文献   

13.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

14.
随着微机电系统(MEMS)研究的精细化,人体传感器网络(简称体感网)技术在医疗监护领域有了长足发展,而人体动作分析与识别是体感网中富有挑战性的研究课题.采用动态隐马尔可夫模型(HMMs)方法对基于用体感网技术的人体动作序列进行了分割,并且对分割精准度进行了度量分析.从实验结果可以看到,动态HMMs方法优于LIR和Top-Down方法,其分割精准度达到了80%以上.对分割后的数据提取均值、方差等特征,采用支持向量机(SVM)方法分类识别的结果表明所提分割方法具有良好的稳健性,平均识别准确率在89%左右,与手动分割接近.  相似文献   

15.
从图像中提取多种特征向量堆叠为一个高维特征向量用于图像语义分割,会导致部分特征向量的分类能力减弱或丢失。针对此问题,提出了一种结合深度卷积神经网络AlexNet和条件随机场的图像语义分割方法。利用预训练好的AlexNet模型提取图像特征,再通过条件随机场对多特征及上下文信息的有效利用来实现图像的语义分割。与利用传统经典特征的方法进行对比,实验结果表明:在利用AlexNet模型提取特征进行图像语义分割时,Conv5层为最有效的特征提取层,在Stanford background和Weizmann horse数据集下的识别准确率分别为81.0%和91.7%,均高于其他2种对比方法,说明AlexNet可以提取更有效的特征,得到更高的语义分割精度。  相似文献   

16.
当前许多领域信息都采用表格形式展现,因此,如何从表格中抽取本体逐渐引起了人们的关注.为了提高从Web表格中抽取本体实例的准确性,提出了基于语义相似度的词汇语义类的获取方法.该方法采用了基于SVM的语义相似度计算方法,提高了判断语义相似度的准确性,克服了以前依靠句法相似度分析表格结构存在的局限性.最后,根据实验结果,对该方法的性能进行评估.实验结果显示,该方法可以有效地从Web表格中抽取本体实例.  相似文献   

17.
语义关联度计算是数据科学中的一个关键性基础问题,在信息检索及自然语言处理等方面有着广泛的应用.针对ESA (Explicit Semantic Analysis)算法存在的局限性,提出一种显式语义特征选择算法,并构建低维语义空间.在此基础上,根据特征概念在Wikipedia中的映射信息,提出一种低维显式语义空间下的语义关联度计算方法.该方法解决了ESA算法在后续语义关联度计算过程中,因高维稀疏空间导致计算效果不够准确的问题.实验结果表明,与当前其他方法相比,该方法的计算结果在皮尔逊相关系数(P)及斯皮尔曼相关系数(S)上与人们的认知判断之间具有更好的一致性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号