首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
自动摘要技术用于将较长篇幅的文章压缩为一段较短的能概括原文中心内容的文本。多文档冗余度高,电子设备所展示的空间有限,成为摘要发展面临的挑战。本文提出融合图卷积特征的句子粗粒度排序方法。首先将句子之间的相似度矩阵视为拓扑关系图,对其进行图卷积计算得到图卷积特征。然后通过排序模型融合图卷积特征以及主流的抽取式多文档摘要技术对句子进行重要度排序,选取排名前四的句子作为摘要。最后提出基于Seq2seq框架的短摘要生成模型:①在Encoder部分采用基于卷积神经网络(CNN)的方法;②引入基于注意力的指针机制,并将主题向量融入其中。实验结果表明,在本文场景下,相较于循环神经网络(RNN),在Encoder部分基于CNN能够更好地进行并行化,在效果基本一致的前提下,显著提升效率。此外,相较于传统的基于抽取和压缩的模型,本文提出的模型在ROUGE指标以及可读性(信息度和流利度)方面均取得了显著的效果提升。  相似文献   

2.
摘要是论文的缩影,它以简短而易懂的文字直接陈述论文的内容,不加注释和评论,清楚而完整地显示出论文的概貌,出现在标题和作者之后,关键词之前。写得好的摘要可以让读者很快了解论文的内容和结果,从而决定是否需要通读这篇论文。摘要的另一个作用是为编制文稿的索引提供信息和依据,也为文摘报刊和资料转载论文内容带来方便,所以一般不用“本文”、“我认为”、“文章”等实为第一人称的摘要写法,而要用第三人称作客观介绍,并无须对论文作补充解释或说明,更不要作任何评价。另外,好的摘要往往能使审稿人很快抓住问题的重要性,进而仔细审查原稿,对它的质量作出实  相似文献   

3.
本文针对多文档摘要没有考虑实体、仅仅生成通用摘要的问题,提出面向实体的演化式多文档摘要生成方法。本文首先利用一个概率主题模型联合建模文档主题的演化和实体的参与情况,然后结合实体对句子进行评分和选择,针对不同的实体,同一个句子可能获得不同的评分。此外,本文在真实数据集上进行了大量的实验和分析,实验结果表明,该方法可以面向不同的实体生成关于事件发展的个性化摘要,同时与现有方法相比,该方法还得到了更好的通用摘要。  相似文献   

4.
摘要是科技论文的重要组成部分,是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。其基本要素包括研究的目的、方法、结果和结论。摘要应具有独立性和自明性,并拥有与文献同等量的主要信息,即不阅读全文,就能获得必要的信息。  相似文献   

5.
在搜索引擎中对用户问题直接给出简要的答案(即答案摘要)可以帮助用户更快捷的获取信息。针对这一任务,设计一种基于特征的答案摘要抽取方法。为了进行句子相似性的计算,提出通过使用卷积神经网络表示句子语义和计算相似性,同时给出基于最大间隔学习的网络训练方法。在百度知道问答语料上的实验结果表明,所提出的答案摘要抽取方法能够生成质量良好的简短回答。与基于词袋的相似性计算相比,使用卷积神经网络能够更好地描述句子语义,计算问题和句子之间的相似性,有效地改善答案摘要的质量。  相似文献   

6.
段雪莹  王阳 《科技信息》2010,(35):J0079-J0079,J0045
本文研究的重点是中文多文档自动的几个关键技术:包括子主题划分、基于子主题的句子抽取等。在传统的基于子主题的句子抽取方法的基础上提出一种基于子主题的遗传算法句子抽取方法,并对形成摘要的句子采用新的排序方法。所实现的中文多文档摘要系统具有重点突出,可读性强等特点。  相似文献   

7.
改进了传统的VSM文档分类方法,提出了一种改进的基于VSM的文档快速分类方法。它考虑了禁用词的排除、近义词和同义词的合并以及特征项在文档中不同位置对文档分类的贡献不同,并提出了训练文档分层的方式来减少分类计算量的方法。  相似文献   

8.
视频摘要以简短的内容概括原始视频,是对原始视频的浓缩或者总结.传统的视频摘要方法有基于聚类的方法,通过视频帧的局部或全局特征将视频帧分成多个有代表性的集群,在每个集群中提取关键帧,最后去除冗余生成摘要;也有基于图模型的方法,将视频帧作为顶点,连接顶点的边表示帧间的关系,通过图的模块化信息提取关键帧.文章将聚类方法和图模...  相似文献   

9.
由于用户查询信息不足而导致传统向量空间模型检索结果不够准确,针对此问题,提出了一种基于文档关系改进的向量空间模型.改进模型将初始检索结果中排名靠前的高相关文档组成基准集,通过计算初始检索结果集中每篇文档与基准集的相似度,来修正原模型中文档与查询的相似度,实现对检索结果的重排序,从而实现对向量空间模型的改进.实验结果表明:与传统向量空间模型相比,改进模型使得相关文档排名更合理,在保证召回率的条件下提高了准确率.  相似文献   

10.
一种改进的朴素贝叶斯文本分类方法   总被引:1,自引:0,他引:1  
针对网络中所存在的大量以网页等非结构化形式存在的文本资源,提出一种改进的朴素贝叶斯分类方法.首先,通过卡方检验方法求文档特征并对文档降维,提高特征词区分性信息;然后,以文本特征来代替原始词条进行朴素贝叶斯对类.实验表明,该方法不仅理论上易于建立和更新,而且分类的精确率也得到提高.  相似文献   

11.
12.
尽管Linux的ext2文件系统在处理较小文件时有很高的效率,但对大文件的读写却并不理想,在分析了ext2内部实现的基础之上,指出了ext2采用的inode结构及块分配策略在处理大文件上的不足,为了提高其处理大文件的效率,通过以下两种方法来加以改进:a.利用B^ 树来组织文件数据块和空闲数据块;b.利用连续块分配策略来进行文件的扩展,最后,从理论上论述了改进后的ext2在处理大文件上比原有的文件系统有着较好的读写效率,并给出实验数据加以佐证。  相似文献   

13.
一种频率域提高Radon变换分辨率的方法   总被引:1,自引:0,他引:1  
Radon变换是压制相干噪音,波场分离的重要方法之一。算子假频和端点效应是该方法在数值计算中需要始终关注的两个重要问题,不断地改进和完善变换的具体算法,抑制和最大化地减少算子假频和端点效应,才能不断地提高变换的分辨率和质量,促进和发展Radon变换的有效应用。针对在数值计算中应该关注解决的问题,在用反演理论对变换的非唯一性进行分析的基础上,对常规的最小平方Radon变换方法做了改进,给出一种频率域Radon变换方法,可有效地压制端点效应,提高了变换域的分辨率。数值计算试验表明了该方法的有效性。  相似文献   

14.
Realistic approach to virus classification and nomenclature   总被引:1,自引:0,他引:1  
A J Gibbs  B D Harrison 《Nature》1968,218(5145):927-929
  相似文献   

15.
吴继娟  孙媛媛  刘岩 《应用科技》2004,31(6):31-33,37
给出了一种基于BIST技术测试FPGA逻辑单元CLB的方法.利用本文给出的0RCA结构对CLB进行测试,可以尽可能地对CLB中的故障进行完全测试,提高测试效率,减少了测试成本.文章给出了应用这种方法进行测试的配置结构、故障覆盖率和测试中出现的问题及其解决办法.实验结果表明,文中的方法是可行的.  相似文献   

16.
耕地质量定级方法改进研究:以农安县为例   总被引:3,自引:0,他引:3  
耕地质量定级是全面掌握耕地质量状况,实现数量、质量和生态协调管理的重要手段.该文以农安县为例,梳理修正法的技术路线,针对修正法的不足提出2种改进办法.通过确定定级指标体系、计算定级指数、划分级别,从级别面积分布、空间重叠度、定级指数与土地纯收益相关性3个角度,比较修正法和改进法的评价结果.结果显示:修正法的定级指数跨度明显高于改进法的定级指数;修正法与改进法空间分布差异较大,2个改进法之间的空间分布差异较小;改进法各级别变异系数均低于修正法;改进法定级指数与土地纯收益相关性系数高于修正法.该研究提出了2种新的定级方法,并验证了方法的可行性,可以为耕地质量定级及相关研究提供新的思路.  相似文献   

17.
阐述了球首的主要类型、几何特征及其减阻原理。提出了具有协调性和光顺性的首变换方法,并在Holtrop船体阻力预报的基础上,建立了船体阻力和推进效率的加权函数作为首优化设计的目标函数,在给定的球首几何特征和船形参数的约束下,计算并设计出最佳的球首,通过对实船的设计结果分析,证明了该方法的先进性和工程实用性。  相似文献   

18.
混合核函数对支持向量机分类性能的改进   总被引:1,自引:0,他引:1  
通过对核矩阵的计算和研究,从理论上对常用的核函数进行了评估.在此基础上,通过实验仿真证实了通过优选后的核函数所组成的混合核函数对支持向量机分类性能的改善,为核函数的选择提供了参考.  相似文献   

19.
对云计算海量数据下的资源调度的研究过程中,进行资源调度时资源分配无法到达合理化调度,存在资源调度效率低的问题。提出分类思维的云计算海量数据资源优化调度方法。该方法引入膜计算概念,将云计算下的海量资源调度的总任务划分为多个子任务,并详细计算每个子任务的资源调度任务量。将优化调度系统内部分解为主膜和辅助膜,利用蝙蝠算法在辅助膜内进行资源分配个体寻优,并将优化后的资源分配最优个体传送到主膜间进行云计算海量数据下的资源分配优化。实验仿真证明,基于改进膜计算蝙蝠算法的云计算海量数据下的资源优化调度方法调度效率高,分配较为均衡。  相似文献   

20.
In the study of brain-computer interfaces,a method of feature extraction and classification used for two kinds of imaginations is proposed.It considers Euclidean distance between mean traces recorded from the channels with two kinds of imaginations as a feature,and determines imagination classes using thresh- old value.It analyzed the background of experiment and theoretical foundation referring to the data sets of BCI 2003,and compared the classification precision with the best result of the competition.Th...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号