首页 | 本学科首页   官方微博 | 高级检索  
     

基于频率共现熵的跨语言网页自动分类研究
引用本文:柯丽,王明文,何世柱,黎佳,罗远胜. 基于频率共现熵的跨语言网页自动分类研究[J]. 江西师范大学学报(自然科学版), 2011, 35(3): 240-245
作者姓名:柯丽  王明文  何世柱  黎佳  罗远胜
作者单位:1. 江西师范大学计算机信息工程学院,江西南昌,330022
2. 江西财经大学现代教育技术中心,江西南昌,330013
基金项目:国家自然科学基金,江西省教育厅青年科学基金,江西省自然科学基金,江西省科技攻关项目,江西省教育厅科技课题
摘    要:研究了基于频率共现熵的跨语言网页自动分类问题,使用翻译软件将所有中文网页翻译为英文,计算中文和英文网页的共现特征频率共现熵值,确定中文和英文网页的共现知识,并与英文网页相结合训练中文分类模型.实验结果表明,该方法与贝叶斯分类模型、向量空间分类模型和信息瓶颈模型相比体现出良好的性能.

关 键 词:跨语言  网页分类  频率共现熵  贝叶斯分类  自适应贝叶斯分类

Web Pages Auto Classification Based on Frequently Co-Occurring Entropy
KE Li,WANG Mlng-wen,HE Shi-zhu,LI Jia,LUO Yuan-sheng. Web Pages Auto Classification Based on Frequently Co-Occurring Entropy[J]. Journal of Jiangxi Normal University (Natural Sciences Edition), 2011, 35(3): 240-245
Authors:KE Li  WANG Mlng-wen  HE Shi-zhu  LI Jia  LUO Yuan-sheng
Affiliation:1.College of Computer Information Engineering,Jiangxi Normal University,Nanchang Jiangxi 330027,China;2.Modern Education Technology Center,Jiangxi University of Finance and Economics,Nanchang Jiangxi 330027,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号