首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 62 毫秒
1.
李芳  盛焕烨 《上海交通大学学报》2001,35(9):1386-1389,1394
介绍了一个基于Internet的双语词汇获取系统,提出了根据文本结构信息和内容信息进行对齐的方法,该方法的实现不依赖于任何语言的特点,从对齐结果中自动抽取双语词汇,系统最终的结果词汇又被用作鉴定未知词汇的依据,所提取出的词汇反映了大量的新词、专有名词和在不同上下文里的各种译文,可以应用在机器翻译呼多语种信息检索中。  相似文献   

2.
为了从大规模标注语料库和词汇知识库支持下自动获取分层次、多粒度的规则描述知识,从汉语多词语基本块入手,提出一套完整处理方案.该方案从标注语料库中自动获取所有基于词类的基本块规则,通过设置规则置信度自动排除大量低可靠和无效规则.针对其中的高频低可靠规则,不断引入更多的内部词汇约束和外部语境限制知识,使之逐步进化为描述能力更强的结构化规则.同时提出一种预期精度指标对自动习得规则的描述能力进行了客观评价.实验结果表明: 现有算法以16%的有效扩展规则覆盖了93%的标注正例,并使预期精度从51%提高到81%, 显示了这套规则学习和评价方法的有效性.  相似文献   

3.
关联规则算法在中文文本挖掘中的应用研究   总被引:4,自引:0,他引:4  
本文介绍了关联规则的主要概念及关联规则的经典算法,并将关联规则算法应用于中文文本挖掘中,目的是通过计算文本特征词间的支持度、可信度关系了解文本间的关联关系.  相似文献   

4.
在虚拟犯罪现场搜索案件相关的电子证据是侦查取证的重要需求,在证据量日益增大的今天,这个需求已显得尤为重要。在法学领域,为了证明案件事实,关联证据具有特定的法学涵义,因此在搜索相关证据时应遵循这些法学规则。然而在侦查取证的过程中,技术专家经常会忽略这些法学需求。结合法学和技术两个角度,对电子证据的关联获取问题进行分析,并对现有的获取方法进行比较和评价,总结了各种方法的应用范围和领域。  相似文献   

5.
互联网中的信息良莠不齐,因此必须对信息的发布、传播和访问进行有效的监控。离题文档检测指通过主题相关性来界定访问文档的合法性。超团模式是一种附加了整体相似度约束的特殊频繁项集。利用超团这种特性,提出了基于关联分析的离题文档检测方法,并介绍了原型系统的实现及应用。  相似文献   

6.
此论文旨在考察出国班学生7种不同词汇动机与词汇广度知识之间的关联。研究发现,出国班学生的词汇动机和词汇习得呈现正相关,其中出国动机对于词汇广度习得都有显著影响。因此对于词汇教学,教师应重视动机差异,有意识运用各种手段促进学生出国或个人发展动机强度,努力营造词汇运用环境,指导学生建立多维词汇网,以便学生能更好地习得词汇广度知识。  相似文献   

7.
主要针对基于规则的汉语词性自动标注问题,引入了关联规则挖掘的概念和方法,给出了一种汉语词性标注规则的获取算法,并对试验结果进行分析,从而提出一些改进思路。  相似文献   

8.
关联理论是Sperber和Wilson继Grice的会话理论之后提出来的,已发展成为西方具有深刻影响力的认知语用学理论。词汇记忆时二语习的影响至关重要,历来国内外学者对词汇记忆策略探讨的文章汗牛充栋,但都众说纷纭,难形成清晰统一的系统。本文旨在通过具有生命力的关联理论来统摄指导词汇记忆策略,可以将词汇学习看成学习者与词汇之间的对话,通过认知推理找出词汇与词汇之间或词汇与认知知识之间的联系,试图得出清晰明了统一的记忆策略系统,突破以往支离无序的记忆策略。  相似文献   

9.
汉语单句谓语中心词识别知识的获取及应用   总被引:13,自引:0,他引:13  
在基于实例的机器翻译(EBMT)的语句相似度研究中,确定谓语中心词以把握句子的整体结构是至关重要的。以标注了谓语中心词的3000句汉语单句作为训练集,将候选词本身的语法属性以及上下文环境作为该候选词的归类特征,通过建立统计决策树模型获取谓语中心词的识别知识。应用统计决策树进行了谓语中心词的自动识别,并获得了较为满意的测试结果。  相似文献   

10.
11.
浅析英语语篇的词汇衔接   总被引:1,自引:0,他引:1  
衔接和连贯是语篇语言学的焦点问题,而词汇衔接是实现语义连贯的重要手段。在简要评述了韩礼德,哈桑,侯易和胡壮麟的相关理论的基础上,本文重点讨论了重复、同义词(近义词)、反义词、泛指词、上下义关系和搭配这六种词汇衔接手段。  相似文献   

12.
以韩礼德和哈桑的衔接理论为基础,分析了唐宋词中重复、泛指词、相似性、分类关系以及组合搭配五种词汇衔接手段的使用。指出了该理论在分析唐宋词词汇衔接中的局限性。局限性主要表现为忽略了句内的词汇衔接、词汇重复的变异及其美学功能以及词汇搭配的文化制约因素。  相似文献   

13.
语篇衔接系统一般分为语法衔接和词汇衔接。英汉语篇的衔接系统有异有同,其中包括照应、省略、替代和连接在内的语法衔接差异较大。英汉语篇语法衔接手段的差异表明:英语看重语法,汉语善用词汇;英语重视形合,汉语注重意合;英语是主语语言,汉语是主题语言。语篇意识对提高翻译质量有举足轻重的作用,同时对翻译实践、翻译理论和翻译教学等也具有一定的启发。  相似文献   

14.
针对面向中文网络百科条目文章的属性和属性值抽取, 提出一种无监督方法。此方法将属性值看做命名实体, 利用频繁模式挖掘和关联分析, 从文本中抽取类别属性; 采用自扩展方法为属性建立触发词表; 基于属性触发词和属性值实体标注挖掘属性值抽取模式, 利用层次聚类算法获取高质量的模式。在互动百科中采集的数据集上进行实验, 结果表明所提方法行之有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号