首页 | 本学科首页   官方微博 | 高级检索  
     检索      

PostgreSQL中文全文索引技术研究与实现
引用本文:战疆,冯月利,王珊.PostgreSQL中文全文索引技术研究与实现[J].华中科技大学学报(自然科学版),2005,33(Z1):213-216.
作者姓名:战疆  冯月利  王珊
作者单位:中国人民大学,信息学院,北京,100872
基金项目:国家自然科学基金资助项目(60473069).
摘    要:开放源码关系数据库PostgreSQL目前还不支持对中文的全文索引.文章研究和分析了PostgreSQL的全文索引技术(TSearch2),通过对其核心函数的重写和配置文件的修改,将中文分词技术引入到了Post-greSQL的全文索引技术中,并加入了去除中文无用词的功能,从而首先实现了PostgreSQL的中文全文索引.

关 键 词:中文全文索引  中文分词  PostgreSQL  TSearch2
文章编号:1671-4512(2005)S1-0213-04
修稿时间:2005年7月10日

Research and implementation of full text index on Chinese in PostgreSQL
Zhan Jiang,Feng Yueli,Wang Shan.Research and implementation of full text index on Chinese in PostgreSQL[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2005,33(Z1):213-216.
Authors:Zhan Jiang  Feng Yueli  Wang Shan
Institution:Zhan Jiang Feng Yueli Wang Shan Doctoral Candidate,School of Information,Renmin University of China,Beijing 100872,China.
Abstract:Open-source RDBMS PostgreSQL does not support Full Text Index(FTI) on Chinese at present.The FTI technology(TSearch2) in PostgreSQL is analyzed in this paper.Further,the Chinese Word Segmentation technology is merged into TSearch2 by rewriting its key functions and modifying its configuration files.Also the function of omitting frequent and content-free Chinese stop words is implemented.The Full Text Index on Chinese in PostgreSQL is firstly implemented.
Keywords:full text index  Chinese word segmentation  PostgreSQL  TSeaech2
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号