首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
提出一种基于句子选择的中文自动摘要抽取算法。算法思想是结合单文档的文档结构、篇章结构、句子特征,按照特征优先权过滤,同时利用进化算法良好的自适应性调节特征因子,通过打分函数自动给句子打分排名,选择得分较高的句子作为摘要句。实验采用中文文档数据集进行测试,采用标准的ROUGE-N评估方法,实验表明该算法针对中文文献取得了良好的效果。  相似文献   

2.
针对事件时间关系不对称的问题,采用将事件表示映射到双曲空间的方法,进行事件时序关系抽取。通过简单的运算,用预训练的词向量与外部知识构建事件的词嵌入表示。在公开发布的数据集上的实验结果表明,模型的F1值比基线模型普遍高2%,能够提升事件时序关系抽取的效果。  相似文献   

3.
随着互联网技术的发展,文本自动摘要技术的意义越来越重要,本文从句子重要性及自动摘要算法两个方面对自动摘要技术进行了分析与改进。  相似文献   

4.
王健 《科技信息》2007,(29):102-103
随着Internet的发展大量机读形式的文献潮水般涌来,自动文本摘要的意义尤为重要。本文从Web文本结构的特点入手,提出了计算主题词权重公式及句子的评价方法,并对LUHN算法进行了改进。  相似文献   

5.
TextRank算法及SWTextRank等改进算法在抽取式摘要生成中得到了广泛的应用,但它们都没有有效地解决抽取式摘要所存在的冗余性问题。为此,提出一种基于子句抽取的文本摘要自动提取算法(PTextRank)。首先,使用Sinica Treebank(STB)对每个句子进行语法标记,进而基于子句设置抽取单元;接着,使用BERT(Bidirectional Encoder Representation from Transformers)构建标题和每个子句的特征向量,并计算子句特征向量间的相似性,将其存放在相似度矩阵中;最后结合子句位置、子句与标题的相似度等调整子句相似度矩阵,迭代计算直至收敛,进而选取得分最高的子句作为最终摘要。实验分析表明,PTextRank算法有效地避免了多个句子中存在的冗余信息,且相比于TextRank和SWTextRank,PTextRank生成摘要的准确率至少提高6%,同时生成的摘要质量更好。  相似文献   

6.
基于领域本体的文档自动摘要算法   总被引:1,自引:0,他引:1  
介绍了一种以潜语义分析模型为基础,辅之以领域本体的文档自动摘要算法.该方法在传统的基于统计的奇异值分解算法基础上,通过领域本体引入了文档主题识别以及概念相似度计算,更好地用形式化的方式描述了文档的主要内容;在文档主题和概念相似度的指导下,使用统计方法和启发式规则抽取文档中的关键句子作为摘要,并通过实验证明提高了摘要的质量.  相似文献   

7.
基于监督学习的同义关系自动抽取方法   总被引:1,自引:0,他引:1  
目的 解决从大规模文本中自动获取同义关系.方法 将同义关系抽任务取看成一个二值分类问题,将其分为训练阶段和抽取阶段,共4个处理模块:预处理、特征生成、模型训练和分类.结果 提出并建立了一种新的同义关系抽取模型,并给出了该模型的关键实现算法.结论 提出的方法 比基于模板方法 的F1值高出了24.4%,大幅度提高了同义关系抽取结果 的精度.同时提出的方法 有效地改善了基于模板方法 领域自适应性差的缺点,所定义的特征和特征的权重计算更适合于判定学习算法.  相似文献   

8.
自动文本摘要生成(ATS)与计算机科学和认知心理学密切相关.提出了一个自动文本摘要生成系统(EI-ATS).该系统借助句法和词法分析,将认知心理学中的事件-索引(Event-indexing)模型运用到自动文本摘要生成.评价结果表明:该系统在多文件摘要生成方面表现良好,成为整合两个相异但相关领域知识的研究范例.  相似文献   

9.
时序网络中关键节点的挖掘引起了社会广泛的关注。针对时序网络建模中存在忽略时间信息、未考虑时间切片间的交互关系进而影响关键节点识别的准确性和科学性的问题,构建了多层时序网络模型,并提出了一种基于节点相似性有偏游走的关键节点识别算法:多层时序有偏PageRank(MTB-PR)。本文中网络模型的构建引入多层网络分析方法,完整涵盖了时序网络的结构演变。同时,基于所构建的网络模型,综合层内相邻节点间相互作用及其层间影响的双重因素来区分节点的不同影响力;通过数据分析,探讨了一些偏差参数变化对节点重要性能指标的影响。最后,将模型和算法应用于真实网络中,通过实验数据验证了该方法的合理性和有效性。  相似文献   

10.
时序动作定位因其广泛的实际应用成为重要且具有挑战性的方向.由于全监督定位方法需要大量的人力对长视频进行视频帧或视频片段级别的细腻标注,近些年来,弱监督学习受到了越来越多的关注.弱监督动作定位在训练阶段只需提供视频级别类别标签,即可定位出视频中动作的区间位置.然而,大多数现存的方法往往只对独立的视频片段进行分类损失约束,...  相似文献   

11.
基于模糊集的不精确时态关系建模   总被引:3,自引:0,他引:3  
基于模糊集理论,建立了一种扩展Allen时态关系模糊时态区间模型.在经典时态关系的基础上,讨论了模糊时态区间关系,提出了时间点的模糊时态序列概念,并定义了模糊时态关系属性,同时用模糊时态序列定义了模糊时态区间的边界关系.最后结合时序测度公式对13种模糊时态定性关系给出了精确的表达.能精确表达模糊事件的精确和不精确关系,也为模糊推理提供了理论基础.  相似文献   

12.
在遗传算法的基础上,给出了一种能够自动获取模糊规则的剪枝算法,并以此建立了新的网络模型.模拟结果验证了该模型的有效性。  相似文献   

13.
目前局域网规模不断扩大、结构日趋复杂,网络速度及网络管理成为网络系统正常运行的主要指标及关键,其中网络拓扑自动发现是网管系统的基本要求和重要功能.要求网络拓扑发现速度快并可反映使用权级而决定服务内容、服务器、路由器和交换机的布局状况,提供可视化管理界面,如系统配置、节点状态和流量监控、异常告警等,对网络系统正常运行、防范网络攻击具有重要意义.本文提出一种基于移动Agent的网络拓扑发现改进算法(广度优先搜索算法),降低了拓扑生成的复杂度,从而提高了系统速度.  相似文献   

14.
根据当前时态数据模型的理论,为儿童保健管理信息系统建立了一个可行的时态关系模型,并对系统中的查询做了简单的描述,最后分析了这种建模方法的优缺点.  相似文献   

15.
在文档词汇衔接评价LC方法的基础上, 提出基于权重的LC, 即WLC, 该方法通过在文档词图上运行PageRank算法获得词汇权重。根据词性信息使得PageRank算法偏向特定的词汇, 并提出PWLC方法。实验表明, 在文档级别上, 所提出的两种方法与人工评价的相关度都优于LC; 融合两种方法后, BLEU和TER在文档级别上的评价性能有显著提高。  相似文献   

16.
针对传统Otsu算法在藻类养殖区分布信息的自动化提取过程中存在欠/过分割、计算量大和运算效率低等问题,提出一种优化的藻类养殖区自动化提取Otsu算法(GA-Otsu).GA-Otsu算法在最大类间方差的基础上,引入类内方差,共同参与阈值选取,提高藻类阈值选取的准确性,并用遗传算法代替遍历法快速搜索最优解,实现藻类养殖区...  相似文献   

17.
大城市交通问题迫切需要高效率的交通系统,这就要求在交通系统的控制中引入智能控制技术。本文介绍了模糊神经网络与遗传算法的特点, 分析了他们之间相互结合的可能性,并提出了基于遗传算法的模糊神经网络控制算法。该算法使模糊神经网络和遗传算法的优点很好地结合起来。本文还介绍了列车自动驾驶系统的概况,并将新算法用于此系统中。  相似文献   

18.
为解决受限领域统计型文摘对文档中心内容理解不足的缺陷,研究了结合领域知识生成单文档文摘的方法;论述了构建受限领域的语料库和知识库的方法;提出对粗文摘进行文摘句概化和在其中加入领域知识的文摘后处理方法. 在所提出理论基础上开发了文摘系统软件. 通过和MS Word 2003中的文摘工具进行实验对比,表明提出的方法切实可行,可以推广到其它领域.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号