首页 | 本学科首页   官方微博 | 高级检索  
     

双语词汇自动获取系统
引用本文:李芳,盛焕烨. 双语词汇自动获取系统[J]. 上海交通大学学报, 2001, 35(9): 1386-1389,1394
作者姓名:李芳  盛焕烨
作者单位:上海交通大学计算机科学与工程系,
基金项目:国家自然科学基金资助项目(60083003)
摘    要:介绍了一个基于Internet的双语词汇获取系统,提出了根据文本结构信息和内容信息进行对齐的方法,该方法的实现不依赖于任何语言的特点,从对齐结果中自动抽取双语词汇,系统最终的结果词汇又被用作鉴定未知词汇的依据,所提取出的词汇反映了大量的新词、专有名词和在不同上下文里的各种译文,可以应用在机器翻译呼多语种信息检索中。

关 键 词:词汇获取 自然语言处理 Internet 双语词汇 文本结构信息 内容信息 对齐方法
文章编号:1006-2467(2001)09-1386-04

Bilingual Lexicon Acquisition System
LI Fang,SHENG Huan ye. Bilingual Lexicon Acquisition System[J]. Journal of Shanghai Jiaotong University, 2001, 35(9): 1386-1389,1394
Authors:LI Fang  SHENG Huan ye
Abstract:This paper presented a system to extract bilingual lexicons from the Internet. It uses a new alignment method based on both structural and lexical information. The bilingual lexicons are extracted from scratch, augmented incrementally and fed back as a lexical resource for alignment. The result shows a lot of new words, context translations and some proper names, which can be used in machine translation and cross language information retrieval. The method has been applied in German, English and Chinese languages, but the realization is independent of any markup, natural language or domain.
Keywords:bilingual lexicon acquisition  natural language processing  Internet application
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号