共查询到20条相似文献,搜索用时 109 毫秒
1.
本文引用语言学及符号学理论,综合自然语言文本生成所涉及的知识,构造了计算机文本生成的理论模型;探讨文本句法中的微观整合性和宏观整合性以及它们对文本生成的作用。这个以文本结构模型和文本意义模型为主体的文本生成理论框架,为进一步的计算机语言生成研究提供了方法依据。 相似文献
2.
提出和实现了一套基于自然语言理解的军用文书到标绘图智能转换的解决方案。文本标图系统通过标绘信息提取模块和军标标绘模块,针对军事文本标图的需求和汉语的特点,由计算机在自然语言理解的基础上对作战文书文本进行分析、理解、提取标绘信息、自动标图作业,最后生成战场态势图。该系统完成了军事标图作业和文书处理的手工作业向机器作业的转换,提高了指挥作业的速度和效率。 相似文献
3.
提出一种基于层叠有限状态自动机(CFSA)的中文军事文本时间表达式识别与规范化算法C-TERN。C-TERN首先利用成熟的分词工具识别出文本中的时间词, 然后将从通用语言和军事语言中提取的时间表达式规则分成多层, 逐层进行时间信息的精细识别。在规范化过程中, 通过4个步骤分别对特殊时间表达式、简单时间表达式、时间段表达式和绝对/相对时间表达式进行推理计算和规范化。算法考虑了规则集提取的正确性、规则之间冲突的消解以及匹配方式的合理性。在多个数据集上的实验结果显示, C-TERN不但能有效地识别标准时间、偏移时间和不确定性时间表达式, 而且能完成对简单、特殊以及隐含的时间点、时间段和偏移时间的推理与规范化, 能够满足军事文本时间信息处理的需要。 相似文献
4.
5.
针对当前自动文摘方法的缺陷,提出了基于文本聚类和自然语言理解的自动文摘实现方法.将文本聚类引入自动文摘中,实现多文档的自动文摘.提出了基于标题和段首句的二次自动分词算法.实验结果表明,分词正确率和召回率均在95%以上.实现了面向塑料行业的基于文本聚类和自然语言理解的自动文摘系统,其多文档自动文摘的正确率和召回率都在75%以上.实验表明该方法可行,对自动文摘系统的设计具有借鉴意义和深入研究价值. 相似文献
6.
军事文本标图的概念,指由机器对指挥人员口授生成的文本进行分析,在相关地理信息平台上自动生成军事标图的过程。针对军事文本标图的需求和汉语语言的特点,提出了一套综合利用多种自然语言处理技术和机器翻译方法的完整的面向受限领域的“类”机器翻译解决方案,设计出一个受限领城内的军事文本标图系统。 相似文献
7.
8.
为了从多时间序列之间发现的定性的时态相关模式可而更全面的理解和把握系统的演化特性,提出了一种基于时态逻辑的多时间序列挖掘模型.它首先将多时间序列转化为多事件序列,然后将预处理后的多事件序列利用区间时态逻辑(ITL)关系子集来定义多事件序列中事件间的时态相关模式.其次进行多状态序列融合和局部时态观测序列的生成,之后采用频繁模式挖掘算法发现多时间序列的频繁时序模式.该模型有助于解决时间序列挖掘所面临的若干挑战和难题,有助于扩展现有时间序列挖掘系统的功能,从而指导时间序列等复杂类型数据的知识发现过程.实验结果表明了该模型及算法的有效性和优越性. 相似文献
9.
目前,传统文本分类算法都是脱离自然语言语意的.该文使用信息抽取进行了中文文本分类的研究,提出了补偿式信息抽取的主题文本分类算法(CIETC),通过分类补偿文档属性,达到行业文档分类的目的.实验中,以将关于一个人名的所有网络文档自动分类为例,验证了这种面向行业的CIETC分类器的分类性能.结果表明该方法的分类准确率要优于Bayes方法,与KNN方法相当;该方法是一种可行的面向行业细分文本分类方法. 相似文献
10.
本文探讨基于自然语言理解对Web信息进行数据挖掘的方法。对敏感信息监控的有效方法应将传统的Web数据挖掘的方法和自然语言理解方法相结合,寻求一种对Web页面进行更高精度的信息分析和数据挖掘,在此基础上实现对敏感信息监控的目的。 相似文献
11.
12.
采用平均特征词频率策略计算特征词权重,用快速n-grims算法对各特征词所处的概念体进行加权,用一种改进的K-means聚类算法进行段落聚类,提出一种基于局部与全局信息的自动文摘算法并给出算法评估.该算法不仅能够自适应获得k值,而且有效防止了初始点的随机选择对聚类结果的影响.评测结果表明该算法对经济类和科技类文章的准确率和召回率都明显高于新闻类和文学类文章,利用机器文摘进行分类的准确率明显高于使用原文本进行分类.该算法所得到的文摘,在各项指标上都优于传统方法生成的文摘. 相似文献
13.
一种基于NA假设的训练数据自动构造方法 总被引:1,自引:0,他引:1
为减轻人工标注训练语料库面临的瓶颈问题,提出了一种基于NA假设带标训练语料库的自动构造方法·为了检验该方法的有效性,将自动获取的带标训练语料库用于词性标注应用中,2万词次的开放性测试结果的准确率为93.1%,其中词性兼类消歧准确率为79.3%,未登录词词性确定准确率为88%· 相似文献
14.
随着近年来网络协议的不安全性,对安全协议进行形式化分析与检测则显的非常重要。而基于行为时序逻辑TLA的模型检测是形式化分析检测方法中重要的一种。本文主要采用基于TLA的HLPSL语言形式化分析与检测H.530协议。 相似文献
15.
刘清 《复旦学报(自然科学版)》2004,43(5):852-855
提出一种时序Rough逻辑,定义了时序算子及其作用于Rough逻辑公式上的意义.描述了这种逻辑的语法和语义.论述了时序Rough逻辑中的语义模型是一个无限状态序列,其中每一状态都描述了当前时刻和场景点上信息系统的信息.从当前状态到下一状态的变换是遵循时序Rough逻辑演算的,它必须保持知识不变,也就是属性和讨论的对象不变,而属性关于对象的特征值,即属性值随着时间和场景变化而可以变化.因此。在信息系统上作决策、数据约简和信息粒化等都将产生影响,由此可见时序Rough逻辑将是动态地处理信息系统的理论工具,也将是合理地解决和处理不一致信息表的较好方法. 相似文献
16.
XYZ/E是世界上第一个可执行的时序逻辑语言,它既能描述抽象静态语义,又能表示程序的动态语义,这一特征恰好适合分层描述软件体系结构,本文采用XYZ/E语言刻画了软件体系结构的基本组件与连接件,并通过对这些组件及连接件进行特定的组合,来表示几种重要的软件体系结构风格. 相似文献
17.
王路帮 《浙江万里学院学报》2006,19(2):32-36
时态信息和时态信息管理是数据库技术和信息管理技术的一种新的研究领域,对于信息的时态要求是信息应用需求多元化的必然.本文概括了时态信息管理中的经典模型,研究了时态信息管理的常用软件,并对其相关的时态支持进行了分析归纳. 相似文献
18.
IntroductionMuch recent research on statistical parsers hasfocused on English.English has a large syntacticcorpus,the English UPenn Treebank.Everysentence in this corpus corresponds to a syntacticstructure[1] .Many kinds of parsers for Englishhave been developed based on this corpus[2 4 ] .Thestructure of the Chinese language is quite differentfrom English and there have been only a fewefforts to build syntactic corpora in recent years.Two syntactic corpora were just announced in2 0 0 0 ,t… 相似文献
19.
20.
自然语言理解新思路-HNC 总被引:4,自引:0,他引:4
HNC是Hierarchial Network of Conecpts(概念层次网络)的简称,是关于处然语言理解处理的一个理论体系,这个理论体系的基本思路与传统计算语言理论有本质的不同,它展示了自然语言理解的突破性进展,其三大理论要点集中体现了HNC理论在自然语言表述和处理模式的突破,本文描述了笔者对HNC理论这种“突破”的认识。 相似文献