首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 968 毫秒
1.
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.  相似文献   

2.
最大熵和Brill方法结合识别英语BaseNPs   总被引:1,自引:0,他引:1  
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比.  相似文献   

3.
通过本项研究,我们对100万词级现代蒙古语语料库做了短语标注,建立了现代蒙古语基本短语库。这一成果。对今后建立一个面向信息处理的、具有较强通用性的蒙古语语义分类和描述体系,提供了必要的前提条件。局部测试结果表明,标注软件对简单句子标注基本短语的召回率和准确率分别达到了92.93%和86.79%。今后有必要深入研究语义信息的获取、语法信息的细化以及蒙古语短语的歧义结构种类、产生歧义结构的原因等问题。  相似文献   

4.
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.  相似文献   

5.
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.  相似文献   

6.
蒙古语短语标注是蒙古语语料库语言学研究的进一步深化。它既要包含语言学需要深入研究的内容.又要解决形式化描述处理的一系列问题。从整体上讲,规则与统计方法相结合,是实现短语自动划分和标注的最佳途径。但是,蒙古语作为一种黏着性语言,其短语结构具有自己独特的一面。我们将立足蒙古语本身,建立适合于蒙古语短语规律的规则集,采取规则和统计相结合,循环渐进的策略。本项目的主要创新点是信息处理用蒙古语短语分类体系、形式化描述及其标记、边界划分规则和知识库。其中,知识库对解决短语歧义划分问题起到决定性的作用。  相似文献   

7.
用光杆短语结构理论分析英语和汉语中的生成性名词短语,认为汉语中的一部分"的"字结构、"者"字结构和英语中的"the+形容词"、"the+分词"以及"通过词缀名词化的短语"都是生成性的名词短语,它们都可以被描述为限定词短语,限定词短语具有名词性。在这项研究中英语与汉语呈现共性,名词短语与句子也呈现共性。  相似文献   

8.
中文时间信息的TIMEX2自动标注   总被引:5,自引:0,他引:5  
为了完善中文时间信息标注规范,实现中文时间短语的自动标注,该文研究并修改国际通用的时间短语标注规范TIMEX2的中文标注草案,以此为基础开发一个基于正则表达式的中文TIMEX2自动标注系统(CTAT).该系统采用3层候选确定参考时间,并行使用多个模块识别输入句子中的时间短语,通过排序冲突消解确定最终结果.经测试,该系统识别时间短语和将时间信息值解析为标准格式的F-measure分别达到了90.15%和83.27%, 与其他语言同类系统性能相当.应用该系统标注的语料,为时间信息处理方面的后续研究提供了重要资源.  相似文献   

9.
该文提出了一种基于Viterbi解码的中文合成音库韵律短语边界自动标注方法,以降低大语料库单元拼接合成系统的构建成本。该方法分为模型训练和韵律标注两阶段:模型训练阶段得到频谱、基频和音素时长的上下文相关隐Markov模型(hidden Markov model,HMM);标注阶段借助训练得到的模型采用Viterbi解码完成韵律短语自动标注。实验结果表明:该方法进行韵律短语边界标注时的F-score值达到77.64%,超过了人工标注时不同标注人员之间的一致性水平;另外该方法可以方便地增加待标注韵律属性,具有良好的扩展性。  相似文献   

10.
文章对藏文中的"名词+名词"(N1+N2)短语的直接成分和语法功能进行了分析,并详细阐述了"名词+名词"(N1+N2)短语的语法组合关系和语义结构、性质、功能及其词义的联想和搭配等,实例分析了藏文名词性短语的韵律特征。  相似文献   

11.
理论上已证明组播QoS(Quality of Service)路由问题是一NP完全问题。集群智能算法为此类问题的求解提出了新的思路。在进行基于粒子群优化(PSO)的QoS组播路由算法研究的基础上,分析了基本粒子群易陷入局部最优路由而导致停滞的现象,通过引入变异算子,阶段变异的机制,克服了标准PSO算法的缺点。仿真结果显示了算法的可行性和有效性。  相似文献   

12.
基于人工标引的中文学术期刊文献自动分类算法   总被引:3,自引:0,他引:3  
为了解决期刊电子化的自动分类问题 ,提出了一种基于中文学术期刊人工标引的自动分类算法。这种算法主要利用自动分词得到各文献的特征词向量空间 ,并考虑到人工标引在分类中的关键作用 ,得到综合了特征词 TF和 IDF权重的分类准则。通过适当训练建立分类库 ,计算待分类样本与已知分类的相似性 ,判别各分类。实验表明 :该分类算法可以获得 85 %的分类识别率  相似文献   

13.
A new model for the well-known problem, the satisfiablility problem of boolean formula (SAT), is introduced. Based on this model, some variants of SAT and their properties are presented. Denote by NP the class of all languages which can be decided by a non-deterministic polynomial Turing machine and by P the class of all languages which can be decided by a deterministic polynomial-time Turing machine. This model also allows us to give another candidate for the natural problems in ((NP-NPC)-P), denoted as NPI, under the assumption P≠NP, where NPC represents NP-complete. It is proven that this candidate is not in NPC under P≠NP. While, it is indeed in NPI under some stronger but reasonable assumption, specifically, under the Exponential-Time Hypothesis (ETH). Thus we can partially solve this long standing important open problem.  相似文献   

14.
频率作为结构损伤特征参数,在实际工程中容易测得且具有较高的测量精度,但同时也常常受到外界环境和运营条件变化的影响,导致在时间序列上的非平稳,给实际工程的健康监测和损伤判别带来了干扰.为解决此问题,引入计量经济学的协整概念,通过非平稳序列的线性组合得到平稳序列,将因环境因素变化导致的结构特征参数非平稳问题转化为平稳问题.首先,详细介绍了ADF(augmented Dickey-Fuller)检验和EG(Engle-Granger)两步法检验,检验结构特征参数的非平稳阶数并计算协整系数;然后,以一个简支梁为例验证了结构频率序列之间的协整关系,给出了环境温度影响下基于频率协整的在线损伤识别步骤;最后,用预应力钢筋混凝土梁与钢桁架简支桥的算例验证了所提方法的有效性和鲁棒性.  相似文献   

15.
提出一种基于条件随机域模型的方法用于中文文本组块分析. 该方法将中文组块分析转化为对每个词语赋予一个组块标注符号, 再根据条件随机域对标注好的训练语料建立模型, 从而预测测试语料中每个词语的组块标注符号. 使用北京大学中文树库的测试结果为F1=85.5%, 高于隐马尔可夫模型和最大熵马尔可夫模型. 实验结果表明, 条件随机域在中文组块识别方面有效, 并避免了严格的独立性假设和数据归纳偏 置问题.  相似文献   

16.
17.
为了求解联合作战中的武器目标分配问题(WTA),在简要介绍WTA模型的基础上,根据WTA模型特征,利用松驰理论和方法,先将模型松弛为混合整数线性规划问题,然后利用Lagrange松弛,将模型分解为2个子问题:线性规划子问题和整数规划子问题,利用全单模矩阵特性求解整数规划子问题,并根据2个子问题的关系调整参数范围。理论证明该方法可以快速有效地给出改善的WTA问题的可行解。数值实验结果表明该方法对不同规模的WTA问题都有较好效果,适合不同战场环境下联合作战对WTA问题求解的实时性要求。  相似文献   

18.
物流配送车辆优化调度的综述   总被引:17,自引:0,他引:17  
物流配送车辆优化调度问题是一类具有广泛应用的强NP难题,本文综合国内外多种参考文献,阐述了该问题的定义和分类,具体介绍了不同情况下的常见模型和主要算法,并就目前该问题的研究发展情况做了简要分析和进一步的展望.  相似文献   

19.
为了提高实体关系联合抽取的效果, 提出一种端到端的联合抽取模型(HSL)。HSL模型采取一种新的标记方案, 将实体和关系的联合抽取转化成序列标注问题, 同时采用分层的序列标注方式来解决三元组重叠问题。实验证明, HSL模型能有效地解决三元组重叠问题, 在军事语料数据集上F1值达到80.84%, 在公开的WebNLG数据集上F1值达到86.4%, 均超过目前主流的三元组抽取模型, 提升了三元组抽取的效果。  相似文献   

20.
The extension of Minimum Spanning Tree (MST) problem is an NP hard problem which does not exit a polynomial time algorithm. In this paper, a fast optimization method on MST problem—the Gradient Gene Algorithm is introduced. Compared with other evolutionary algorithms on MST problem, it is more advanced: firstly, very simple and easy to realize; then, efficient and accurate; finally general on other combination optimization problems.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号