首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于MapReduce的中文词性标注CRF模型并行化训练研究
引用本文:刘滔,雷霖,陈荦,熊伟.基于MapReduce的中文词性标注CRF模型并行化训练研究[J].北京大学学报(自然科学版),2013,49(1):147-152.
作者姓名:刘滔  雷霖  陈荦  熊伟
作者单位:国防科学技术大学电子科学与工程学院,长沙,410073;国防科学技术大学电子科学与工程学院,长沙,410073;国防科学技术大学电子科学与工程学院,长沙,410073;国防科学技术大学电子科学与工程学院,长沙,410073
基金项目:新闻出版重大科技工程项目(1041STC40889/01-2);863计划(2011AA120300)资助
摘    要:针对条件随机场模型面对大规模数据传统训练算法单机处理性能不高的问题,提出一种基于MapReduce框架的条件随机场模型训练并行化方法,设计了条件随机场模型特征提取及参数估计的并行算法,实现了迭代缩放算法的并行.实验表明,所提出的并行化方法在保证训练结果正确性的同时,大大减少了训练时间,效率得到较大提升.

关 键 词:词性标注  条件随机场  MapReduce  并行

A Parallel Training Research of Chinese Part-of-Speech Tagging CRF Model Based on MapReduce
LIU Tao,LEI Lin,CHEN Luo,XIONG Wei.A Parallel Training Research of Chinese Part-of-Speech Tagging CRF Model Based on MapReduce[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2013,49(1):147-152.
Authors:LIU Tao  LEI Lin  CHEN Luo  XIONG Wei
Institution:College of Electronic Science and Engineering,National University of Defense Technology,Changsha 410073
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号