首页 | 本学科首页   官方微博 | 高级检索  
     

PHP+MYSQL环境下的中文分词技术研究
引用本文:徐殿军,崔宝华. PHP+MYSQL环境下的中文分词技术研究[J]. 辽宁师范大学学报(自然科学版), 2008, 31(1): 57-59
作者姓名:徐殿军  崔宝华
作者单位:渤海大学,图书馆,辽宁,锦州,121000;辽宁师范大学,学生处,辽宁,大连,116029
摘    要:要想在上百亿的网页中找到有意义结果,最重要的是把最相关的结果显示出来,而且要排在最前面,这也称为相关度排序.中文分词的准确与否,常常直接影响到对搜索结果的相关度排序.对PHP编写模拟分词函数进行了研究和分析.给出了PHP MYSQL环境下实现传统分词的实现过程.并在此基础上引入了字典的概念,因其在分词之前已提前调入内存,从而大大提高了分词的效率和准确性.在PHP MYSQL环境下为中文的分词过程实现提供了良好的平台基础,丰富的PHP函数为实现精确的分词提供了语言和语法的支持,MYSQL轻型数据库为字典提供快速的存取.

关 键 词:全文检索  中文分词  相关度排序  PHP  MYSQL
文章编号:1000-1735(2008)01-0057-03
收稿时间:2007-11-22
修稿时间:2007-11-22

Research of chinese word automatic segmentation based on PHP and MYSQL
X Dian-jun,CUI Bao-hua. Research of chinese word automatic segmentation based on PHP and MYSQL[J]. Journal of Liaoning Normal University(Natural Science Edition), 2008, 31(1): 57-59
Authors:X Dian-jun  CUI Bao-hua
Affiliation:X(U) Dian-jun,CUI Bao-hua
Abstract:
Keywords:PHP  MYSQL
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号