首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 968 毫秒
1.
句子压缩是自然语言处理领域的一个基础应用方向,是开发自动文摘生成系统和自动标题生成系统的第一步.句子压缩技术主要是以简短的形式重写句子并且保留原句中最重要的信息.好的压缩句子应该是合乎语法的和表述连贯的句子.选取Noisy-Channel Model压缩算法和Hedge Trimmer压缩算法作为两种压缩技术的代表范例进行对比研究,分析了两种方法的优势和劣势,探索了一种混合式句子压缩技术.混合式压缩技术将会改善英文句子压缩效果,相关研究将成为自然语言处理领域的一个新方向.  相似文献   

2.
基于主题词权重和句子特征的自动文摘   总被引:1,自引:1,他引:0  
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%.  相似文献   

3.
随着信息量的迅速增长,在大量的文本信息中尽快找到自己所需要的资料已经成为信息检索技术的重要目标.在分析总结前人研究成果的基础上,提出了一种压缩纯英文文本数据库正文的压缩方法以及和此压缩方法结合使用的一些查找算法和解压缩算法.  相似文献   

4.
设计了一种用于OA系统主题词提取算法,该算法包括单句聚类、抽取代表句、代表句分词和主题词提取几个步骤。采用层次凝聚法作为单句聚类算法,研究公文句子的特点,设计了代表句抽取算法,根据公文群体较为单一的特点,建立主题词词库以及主题词提取规则库,对机械分词法进行改进,设计了代表句的分词算法,实现了公文搜索主题词的自动生成。  相似文献   

5.
电磁超声是管道裂纹检测的有效手段,由于原始波形的数据量很大,而检测器存储设备的容量和存储速度相对有限,有必要研究检测数据在线压缩算法。文中分析了管道检测的特殊环境及其对数据压缩的要求,针对检测器系统的特点及检测数据的特征,提出了分段自适应压缩算法。该算法能够根据信号的幅值变化实时改变压缩比,并且可以通过改变压缩阈值的方法来调整压缩的精度。实验结果显示:该算法应用在电磁超声导波波形数据上,有着较为理想的波形保真度,同时达到了较高的压缩比。对算法优缺点的分析和对压缩质量的评估结果表明:分段自适应压缩算法在压缩效率,压缩质量和算法复杂度等多方面均满足管道电磁超声检测大量数据压缩的要求。  相似文献   

6.
文本压缩算法的比较研究   总被引:2,自引:0,他引:2  
论述了4种不同的文本压缩算法。根据压缩算法的优点和缺点,在实践中,要有针对性选择算法,用其优点,从而得到比较理想的压缩文本。  相似文献   

7.
提出一种基于句子选择的中文自动摘要抽取算法。算法思想是结合单文档的文档结构、篇章结构、句子特征,按照特征优先权过滤,同时利用进化算法良好的自适应性调节特征因子,通过打分函数自动给句子打分排名,选择得分较高的句子作为摘要句。实验采用中文文档数据集进行测试,采用标准的ROUGE-N评估方法,实验表明该算法针对中文文献取得了良好的效果。  相似文献   

8.
基于自适应比特分配的SAR复图像频域压缩算法   总被引:1,自引:1,他引:0  
研究合成孔径雷达(SAR)复图像数据的虚实部压缩算法,针对SAR复图像数据的统计特性,提出一种自适应比特分配的改进算法。首先在频域对SAR复图像数据进行自适应加权预处理,然后由香农率失真定理结合拉格朗日乘子法,推导了基于方差的块自适应虚实部最优比特分配公式,给出了整个压缩算法的流程图。根据流程图进行了多次压缩实验,并分析了算法的压缩性能。最后将改进算法与传统算法进行比较,验证了改进算法具有更优的幅度保持和相位保持的特点。  相似文献   

9.
基于小波技术的散乱点云自适应压缩算法   总被引:2,自引:0,他引:2  
提出基于小波技术的散乱点云自适应压缩算法.利用快速成型理论中的切片技术,将三维空间点云数据降为二维平面点云数据,并对排序后的点云数据进行小波变换,利用小波系数峰值,自适应地保留能够反映目标特征和细节信息的点,实现散乱点云的快速压缩.借助于实验,验证切片的分割厚度选为采样间隔的2~3倍时,可以实现快速高质量的散乱点云压缩.结果表明:算法在特征保留上具有明显的优势,能够最大限度地保留特征信息,压缩效果更为理想,且无需设置阈值,同时还具有自适应的特点,有助于实现压缩的自动化.  相似文献   

10.
通过分析传统的基于四叉树分形的压缩算法,提出将BP神经网络模型应用到基于四叉树的分形图像压缩中,同时给出这种改进压缩的基本思想,并用堆栈实现其算法的步骤。在改进压缩算法中,引入基于BP神经网络的可并行性方法,并用数学思想推导证明。在用算法加以实现时,采用了数据结构中的堆栈思想并用算法实现。通过执行时间的长短和算法复杂度来整体评价改进算法和传统算法的异同,得出结论:此种方法通过神经网络的并行性能,可获得高质量的解压缩图像,使图像的压缩和解压缩可以并行的快速的执行。  相似文献   

11.
藏语动词分类很细,准确识别和判断藏文动词的词性是藏语自然语言处理中一个基础又关键的内容,及物与不及物动词的自动识别,可以在用计算机生成自然语言句子时能很好地阻止不合法句子的生成,也能从整体上减少句子生成量,从而提高效率.提出了一种在理想环境下,通过句子中的使格助词来自动判断动词及物性的方法,这种自动识别方法是一种理性主义的判断方法,所以不需要大规模语料的支持.因为是一种理想情况,所以自动识别效率高,准确率为100%.  相似文献   

12.
英汉两种语言在句子结构方面有很大的差异。汉语是话题突出语言(topicprominentlanguage),句子的基本结构是话题+说明,而英语是主语突出的语言(subjectprominentlanguage),句子结构是主语+谓语,主语在句中处于不可或缺的地位,要求意足形完。本文通过翻译实践,讨论了汉英翻译时根据句子话题来确定英语主语的理论及操作策略,并以此实现有效再现原文语句的交际价值。  相似文献   

13.
通过对英语句子的剖析、归纳、分类,概括出英语句子的根句型,即英语5种基本句型(简单句的5种基本句型外加一些特殊句型),重点指出这几种句型基本涵盖了所有的英语句子,旨在强调其在英语学习中的重要性,帮助英语学习者在英语学习过程中,不断增强根句型概念,正确使用英语句型,使他们能够尽快掌握英语语言的核心内容,以便更好更快地学好英语。  相似文献   

14.
英汉两种语言属于不同类型的语言。英语是主语突显的语言,而汉语则是主题突显的语言。这是由于在各民族的历史长河中.原始语结的分化方式不同所造成的。就英汉翻译而言,英汉词序的相似性有时可以将汉语的主题句直接转换成典型的英语主谓(宾)结构,而在多数情况下,汉语主题句的翻译需要局部甚至全部改变原有句子结构才能完整精确地译出原句要表达的意思。根据这一指导原则,本文总结出了翻译汉语主题句的三条基本方法,即对应法、结构转换法和和语义翻译法。  相似文献   

15.
张景丰 《科技信息》2009,(31):J0112-J0113
汉语有很多无主句,这符合汉语意合的思维习惯。而英语则重形合,句子里一般都需要有主语。汉语的无主句译成英语时,往往需要确定并补出主语或改变句型,使句子结构符合英语语法的规范。本文探讨了如何理解汉语无主句、译文主语的确定及英译时可运用的几种方法。  相似文献   

16.
以认知语言学中的图形与背景理论为视角,结合语用学中的信息理论与语篇建构理论,对英语倒装句的焦点凸显功能进行了重新阐释,认为英语倒装句符合图形—背景理论中的凸显原则。在言语交际与语篇建构中,说话人将正常语序句子中的图形后移,形成句末焦点,使信息焦点落在新信息上,从而达到了最佳凸显效果。  相似文献   

17.
英语注重句子形式、结构完整,汉语注重逻辑、语义关系。因此,在英语写作中能否正确表述连动句对中国学生来说非常重要。通过对英语专业低年级学生进行访谈和测试,发现不同英语水平的学生在英语连动句的使用数量和表现类型上有较大差异,且这种差异会对英语写作质量造成一定的影响。因此,需要强化学生在此方面的练习和实践。  相似文献   

18.
法律英语句法特征研究   总被引:2,自引:0,他引:2  
法律英语作为考用公文语体的书面语,不仅大量地使用长句和被动句,而且在句型和时态使用方面大多采用陈述句、完整句、一般现时以及shall、be to结构,从而形成了法律英语独特的句法特点。  相似文献   

19.
英语中许多句子中都隐含有一个含蓄条件句,只有认真分析句子结构,全面掌握英语中表达含蓄条件的各种手段,正确理解原文中的含义,才能准确无误地翻译原文.  相似文献   

20.
将句法的认知研究和句法的语用研究结合起来,利用历时溯因和共时研究的方法,可以从认知和语用两个角度探讨英语存在句句法结构的成因:英语存在句的认知理据有视觉感知和心理感知,而句尾焦点原则和语篇连贯原则是其语用理据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号