基于网络蜘蛛的新词自动发现算法研究 |
| |
引用本文: | 潘欣,吕静波,张素莉.基于网络蜘蛛的新词自动发现算法研究[J].长春工程学院学报(自然科学版),2011(3):83-85. |
| |
作者姓名: | 潘欣 吕静波 张素莉 |
| |
作者单位: | 1. 长春工程学院电气与信息工程学院,长春,130012 2. 长春高新区长东北核心区管理委员会,长春,130016 |
| |
基金项目: | 吉林省科技厅青年基金的资助(20100190);吉林省教育厅基金项目资助(2010No.422) |
| |
摘 要: | 提出了一种基于网络蜘蛛的新词发现算法,通过该算法可以快速有效地搜集互联网资料,并从中自动发现新词。实验表明,该方法可以从网上快速搜集新词,获得的词典在分词能力上较传统方法有很大提高。
|
关 键 词: | 中文分词 词典 新词发现 网络蜘蛛 |
Automatic extracting algorithm of new words based on web spider |
| |
Institution: | PAN Xin,etc.(Faculty of Electrical & Information Engineering,Changchun Institute of Technology,Changchun 130012,China) |
| |
Abstract: | |
| |
Keywords: | Chinese word segmentation lexicon-based new word extraction web spider |
本文献已被 CNKI 万方数据 等数据库收录! |
|