首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
自动文本摘要生成(ATS)与计算机科学和认知心理学密切相关.提出了一个自动文本摘要生成系统(EI-ATS).该系统借助句法和词法分析,将认知心理学中的事件-索引(Event-indexing)模型运用到自动文本摘要生成.评价结果表明:该系统在多文件摘要生成方面表现良好,成为整合两个相异但相关领域知识的研究范例.  相似文献   

2.
基于分类算法的专利摘要文本分割技术   总被引:1,自引:0,他引:1  
专利摘要是对专利的浓缩表述,将专利摘要按内容分割后,能更准确地定位对应的专利。由于专利摘要长度较短,而且不同内容间没有明显标志,使其分割不能使用传统的文本分割方法。本文将专利摘要的分割问题转化为句子分类问题,并尝试采用分类算法解决该问题。通过分析不同分类算法以及不同特征对本问题的解决效果,最终验证了利用句子分类方法进行专利摘要分割的可行性。  相似文献   

3.
唐武  陈佳 《广东科技》1998,(7):19-20
一、开发背景 90年代以来,随着办公自动化和国际互联网(Internet)的迅速发展,人们日常所接触的信息量急剧增长,如何在大量的信息中择其所需已直接关系到人们的工作和生活效率。对于文字信息,通常一方面采用分类的方法,使经分类选择后的文字信息更具有针对性,从而避免无关信息的干扰;另一方  相似文献   

4.
研究了一种基于统计的Web新闻文本自动摘要生成方法.首先,根据Web新闻文本的特点,对词汇和句子赋予不同的权重,然后根据权重大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅的摘要.  相似文献   

5.
文本自动摘要提取算法   总被引:1,自引:0,他引:1  
摘要是对文本内容的概括,在信息检索中起着重要的作用,提出一种文本自动摘要提取算法:按照词语权重提取出能表征文本主要内容的特征词,根据句子的物理信息以及句子中包含的特征词情况计算出句子的权重,按照句子权重大小等提取出候选摘要句.  相似文献   

6.
随着互联网技术的发展,文本自动摘要技术的意义越来越重要,本文从句子重要性及自动摘要算法两个方面对自动摘要技术进行了分析与改进。  相似文献   

7.
王健 《科技信息》2007,(29):102-103
随着Internet的发展大量机读形式的文献潮水般涌来,自动文本摘要的意义尤为重要。本文从Web文本结构的特点入手,提出了计算主题词权重公式及句子的评价方法,并对LUHN算法进行了改进。  相似文献   

8.
现有的文本自动摘要技术大多是运用向量空间模型将文本作为一个整体进行处理,忽略了段落及段落之间的关联程度,导致提取的摘要不能够全面反映所包含的主题,针对这一问题,文章提出了基于互信息的文本自动摘要方法。该方法利用互信息对文本中词语、句子及段落之间的关联程度进行计算,依据关联程度将整个文本划分成包含不同主题的较小单元,并针对每一单元运用优化的句子权重计算方法进行主题句提取,然后利用主题句生成文本摘要。实验验证了方法的有效性,在自动摘要提取方面取得了良好效果。  相似文献   

9.
针对短篇幅文本数据稀疏的特性,提出了一种利用外部语料库知识提高短篇幅文本分割准确率的方法.该方法分2个步骤完成:①利用Gibbs采样方法估计语料库对应的潜在狄利克雷分配(LDA)模型,并利用该模型推断目标文本的潜在语义结构信息;②通过定义语义段落内凝聚性和语义段落间发散性2个目标函数,将文本分割问题转化为多目标优化问题.采用一种针对文本分割的并行遗传算法,获得全局最优解.通过实验,在文本数据稀疏的情况下,该算法在准确率方面优于多元判别分析(MDA)方法和基于LDA的文本分割方法,对于提高文本分割的准确率是可行和有效的.  相似文献   

10.
基于区域内一致性和区域间差异性的图像分割   总被引:3,自引:0,他引:3  
利用区域内方差描述区域内一致性,提出以区域间平均灰度值之差的平方来构建能量函数.运用梯度最陡下降法,推导出能量函数曲线演化方程,并应用于图像分割.研究结果表明:与仅基于区域内一致性或区域间差异性的图像分割算法相比,该算法的图像分割结果更符合实际情况;随着迭代次数增加,基于该算法的图像分割边界变得更平滑;当到达一定的迭代次数时,图像分割结果稳定.  相似文献   

11.
一种不需分词的中文文本分类方法   总被引:2,自引:1,他引:1  
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%.  相似文献   

12.
对话推荐技术旨在通过与用户的对话交互完成高质量的信息推荐.针对已有研究存在的对话目标预测准确性不高的问题,提出一种利用对话模型引导的对话生成推荐(dialogue guided recommendation of dialogue generation, DGRDG)模型.首先,利用对话模型生成对话目标,通过经典的Seq2Seq模型融合输入的对话历史、用户画像以及知识信息来生成对话目标;其次,提出目标重规划策略(goal replan policy, GRP)来修正生成的对话目标,以提高对话目标预测的准确率.在DuRecDial数据集上进行实验的结果表明,对话目标生成模块在引入目标重规划策略后,对话目标预测的准确率提高了3.93%;总体模型在BLEU,DISTINCT,F1以及人工评价指标上具有较好的效果.  相似文献   

13.
在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96.4%的切分正确率,比原算法提高5.2%.  相似文献   

14.
针对光学相干层析成像(OCT)信号中的各种噪声项的干扰和微弱散射信号提取的困难,提出基于相位差分的光学相干层析成像(PD-OCT). 首先利用相干参考臂中的纳米微调平台作为相位调制器获得相位调制参考光,然后光结合振镜扫描技术和CCD光谱采集的光谱相干层析技术(SDOCT),实现光学相干层析的相位差分成像.结果表明:相位差分技术可以准确实现青鳉鱼样品光学相干层析中的相位差分成像,弱散射信号增强337 dB,信噪比(SNR)增强58 dB,获得成像物体高信噪比的弱散射信号.  相似文献   

15.
在扫描工程图矢量化中,文字位图与图形位图分割的问题一直被广泛关注,许多现有方法根据连通区的形态特征和空间分布来分割文字和图形的位图,然后分别识别,其处理能力都局限在无粘连情况下,无法处理字线粘连及相交的情况,且难以区分尺寸范围相近或形态相似的文字与图形,提出一种基于线条识别的文字/图形分割方法,通过准确地识别线条并抽取其位图来分离文字,不仅保证了分割的正确性,而且为文字位图的字串的组织给出了依据。  相似文献   

16.
汉语分词技术研究现状与应用展望   总被引:8,自引:0,他引:8  
汉语自动分词是计算机中文信息处理系统的基础和难题,本文对近年来的汉语自动分词的研究方法与成果进行了分析综述。探讨了分词中存在的一些关键问题,同时介绍了分词技术在科研以及商用系统中的应用。并展望了未来分词技术在应用方向的发展.  相似文献   

17.
自动文摘的目的是借由计算机技术自动从原始文献中提取文摘,针对这一问题,提出了一种新的基于潜在语义分析(Latent Semantic Analysis,LSA)的中文自动摘要方法,该方法利用奇异值分解(Singular Value Decomposition,SVD)来获得文章的语义结构,以句子和全文的相似度为依据抽取一组句子作为文章的摘要,提升了自动摘要的效率和精度,并重点介绍了该方法的基本思想、特点以及实现方法。实验结果表明,该方法在实践中取得了预期的效果。  相似文献   

18.
衔接和连贯是功能语言学的两个重要的术语。Halliday和Hasan对衔接和连贯所做的研究具有开拓意义。随后语言学者对其作了进一步的研究。在对衔接和连贯的研究中,笔者发现,衔接对语篇理解有重要的影响,但是其运用尚未普及。最后本文结合实例,证明和肯定了掌握衔接和连贯的关系对理解语篇的重要作用。  相似文献   

19.
在接受语篇时,读者记忆中已有的图示对建构语篇连贯至关重要。就跨文化交际而言,由于译语读者对源语文化了解不足,原作者根据自己与源语读者的共有知识对文化图式进行的有效缺省,对译语读者常构成意义真空,因此译者须采取措施对文化图式缺省进行补偿,常用的方法主要有“归化”与“异化”两种,译者应根据具体情况选择适当的策略,重构译文连贯性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号