共查询到19条相似文献,搜索用时 847 毫秒
1.
篇章分析是自然语言处理中一个重要的研究方向。连接词的识别作为篇章分析中的一个基本任务,对后续的篇章分析起到关键作用。针对连接词识别方法中的高维度特征空间问题,提出了基于特征提取的连接词识别方法。具体来讲,引用多种特征提取方法(IG、MI、DF、CHI、WLLR)对连接词识别中所用的所有特征进行打分排序,提取排在前面的一定数量的特征用于分类。实验结果表明特征提取方法能够有效降低特征维度,在仅仅使用50%的特征的情况下能够获得类似甚至更佳的识别性能。 相似文献
2.
本研究旨在揭示中国非英语专业学生对比连接词的使用特点。本文对中国学习者语料库的子库St3,St4和本族语语料库BROWN中出现的对比连接词的使用上进行量化分析及对比研究,结果发现在对比连接词的使用上中国学生使用对比连接词的使用频率较高,但使用种类较少,过度使用一些简单的对比连接词而忽略了许多应在正式文体中出现的连接词。 相似文献
3.
连接关系构建句子、段落、乃至整个语篇的逻辑语义关系,如果使用得当,连接词在行文的清晰程度和理解上具有积极的作用。本文针对中国英语学习者在连接词使用方面进行语料库研究,分析对比和英语母语学习者之间的差异,用于指导写作课堂教学。 相似文献
4.
从不同语义连接词在两个语料库中出现的次数上来看,中国学者与英语本族语学者使用情况基本相同,这说明中国学者已经掌握英语学术论文的写作特征。由于母语迁移的影响和回避策略的使用,中国学者在连接词的使用上仍存在不足,如他们使用连接词的总频率低于英语本族语者,用词局限在少数简单的连接词上以及正式文体中出现口语化倾向等。 相似文献
5.
基于语料库的英语写作连接词分析研究 总被引:1,自引:0,他引:1
本研究旨在揭示中国英语学习者英语写作中连词的使用特点。通过采用定性和定量的研究方法,对比研究我校自建语料库SEC与英语本族语者笔语库NWC和中国学习者英语语料库CLEC,结果发现中国英语学习者连接词的使用频率较高,但使用种类单一,缺乏多样性。为提高中国英语学习者的写作能力,笔者也对今后的写作教学提出了一些建议。 相似文献
6.
Chanqin Gao 《科技信息》2008,(17)
本文通过语料库分析了中国大学生在英语写作中使用过多的两个连接词,"what is more"与"that is to say",并把中国大学生使用该两个词的情况与本族语者使用该两个词的情况进行对比研究。 相似文献
7.
将篇章结构表示为小句关联结构, 与修辞结构等层次化篇章结构模式相比, 可以有效地刻画非连续和跨层级的小句之间的直接语义关联。首先, 提出篇章小句关联结构的形式表示、判断准则和形式限制, 并进行人工标注。然后, 对汉语篇章小句关联结构进行自动识别。在自建汉语篇章小句关联结构语料库上, 基于分类模型, 设计连接词和词汇等分类特征, 得到的最佳识别准确率达92.70%。实验结果表明, 语料整体取样比独立取样取得的去环效果好; 词汇、小句距离及句域等分类特征对识别的贡献较大; 远距离和跨大句是小句关联识别的难点, 但相邻小句和同一大句内的小句对的不相关识别难度更大。 相似文献
8.
李华 《大连民族学院学报》2003,5(2):55-56,63
俄语中无连接词复合句是一个相当复杂和难以掌握的句法结构,它与有连接词的复合句相对应,有其独特的联系手段,通过论述标点符号在无连接词复合句中的句法作用,分析其意义。 相似文献
9.
根据清华汉语树库的标注方法, 利用规则从中提取复句关系词并标注其类别, 然后分别抽取带功能标记和不带功能标记的自动句法树的句法、词法、位置特征, 进行复句关系词的识别和分类。实验结果表明, 复句关系词判断准确率达95.7%, 复句关系词类别判断F1值为77.2%。 相似文献
10.
11.
针对医学文本缺乏可量化数据结构,基于关键词模型的文本处理方法不适用的问题,在研究词之间潜在语义关联和关键词树结构的基础上,构造了一种基于潜在语义树的语义分析模型用于医学文本的数据挖掘。进一步地将隐含主题与潜在语义的研究相关联,设计出一种基于潜在狄利克雷分配和潜在语义树模型的文本处理方法,可针对不同类型的医学文本生成有一定可读性的自动批注。该方法形成的自动批注主观性低,其准确度和可读性均高于关键词模型的处理结果,可辅助医生进行医学文本的批注和分类,从而减轻其工作量。程序结果表明,该方法目前可应用于对医学图像所见形成诊断意见、对病人病历进行摘要形成和对病症描述给出对症处方等方面,批注的语义匹配度可达67.7%,文本的平均可读性为60.02%。 相似文献
12.
提出了一种消除抽象语法树文本中冗余的方法,借助Knuth-Morris-Pratt(KMP)算法,设计核心算法,对抽象语法树进行简化,并选出几个经典的代码片段进行实验,对算法的性能做了相应验证.实验结果表明,算法在消除冗余方面的简化率达到90%以上. 相似文献
13.
属性是语义分析中非常重要的一个概念,因为它使得语法符号和结构有了意义,而这种意义最终将被计算机接收。属性计算是一个复杂的过程,原因在于属性间的依赖关系的紧密性以及存储结构的复杂性。抽象语法树是语法树的简化,是属性计算中很有效的一种存储结构。本文首先阐述抽象语法树的意义、结构及构造,然后对属性及相关问题作了介绍,最后根据属性文法的种类,给出相应语法结构的属性计算算法。 相似文献
14.
针对代码抄袭及软件盗版现象, 研究了3种传统基于程序结构相似性检测方法, 并提出一种基于语法树的程序相似度检测方法。该方法先对源程序进行语法分析得到其语法树, 然后基于语法树重点分析源程序的语法结构并计算其相似度, 从语法结构的角度消除高级抄袭手段所带来的干扰。实验结果表明, 基于语法树的程序相似度检测方法可以较好地检测增加冗余语句、 控制结构的等价替换等10种抄袭手段。 相似文献
15.
Snort规则及规则处理模块分析 总被引:3,自引:0,他引:3
当前,入侵检测已成为网络安全技术的重要组成部分,开放源代码入侵检测系统Snort是研究入侵检测系统很好的原型。分析了Snort规则语法和规则处理模块,剖析了规则语法树的生成及根据规则语法树进行遍历、查找匹配项的过程,总结了Snort的一些特点。 相似文献
16.
中国英语专业学生笔语中话语联系语的使用 总被引:1,自引:0,他引:1
从认知语言学的角度,依据关联原则,对英语话语联系语的意义与功能作出解释,并基于WECCL与WBNC两个语料库的对比结果,统计分析中国英语专业大学生的英语笔语中话语联系语的使用特征。结果显示:中国二语习得者在话语联系语使用的总体数量分布上与本族语者大致相同,但在联系语类型的选择上有所不同,以添加、选择、转折、推论、列举、对比方式为主;某些联系语出现过度使用或过少使用的现象。 相似文献
17.
18.
软件测试是软件工程的重要组成部分,程序静态分析技术是软件测试中静态测试的基础,该技术通过对程序源代码进行分析以发现其中的错误.文章提出了一种程序静态分析方法,建立了一个树形结构的模型PAT(Program Analysis Tree)形式化描述了Java程序,准确地描述了Java程序的逻辑结构.最后给出了一个基于此模型的程序分析方法. 相似文献
19.
金慧婷 《长春师范学院学报》2011,(1):90-93
"后来"是一个使用频率高、内容形式多样的连接词。它可以单用,也可以与其他成分配合使用,并具有很强的衔接功能。"后来"所衔接的语义关系也是多样的,既可以表示时间的顺序,又可以出现承接、因果、转折的语义。 相似文献