首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Choquet积分的HMM商品信息抽取方法
引用本文:邓斌,邵培基,夏国恩.基于Choquet积分的HMM商品信息抽取方法[J].系统工程,2008,26(12):110-114.
作者姓名:邓斌  邵培基  夏国恩
作者单位:邓斌,邵培基,DENG Bin,SHAO Pei-ji(电子科技大学,经济与管理学院,四川,成都,610054);夏国恩,XIA Guo-en(电子科技大学,经济与管理学院,四川,成都,610054;广西财经学院,工商管理系,广西,南宁,530003) 
基金项目:国家自然科学基金,四川省科技厅软科学项目 
摘    要:电子商务网站使用不同的网页编码技术和页面布局为比较购物信息获取带来了很大的难度.基于隐马尔可夫模型(HMM)的信息抽取模型有着易于建立、适应性强等优点,被视为一种有效的信息抽取方法.但是这种算法存在状态序列计算复杂、难以训练优化抽取模型等缺点.本文应用模糊积分单调性建立基于Choquet积分的隐马尔可夫模型(CI-HMM),解决HMM观察序列概率计算所需的条件独立性假设,优化HMM观察序列的计算.本文以网上书店商品数据进行实证,实验证明CI-HMM比HMM有更好适用性和精确度.

关 键 词:信息抽取  比较购物  隐马尔可夫模型  Choquet积分

A Method for Commodity Information Extraction Based on Choquet Integral Hidden Markov Model
DENG Bin,SHAO Pei-ji,XIA Guo-en.A Method for Commodity Information Extraction Based on Choquet Integral Hidden Markov Model[J].Systems Engineering,2008,26(12):110-114.
Authors:DENG Bin  SHAO Pei-ji  XIA Guo-en
Institution:DENG Bin1,SHAO Pei-ji1,XIA Guo-en1,2 (1.School of Management , Economics,University of Electronic Science & Technology of China,Chengdu 610054,2.China,Department of Business Management,Guangxi University of Finance , Economics,Nanning 530003,China)
Abstract:E-commerce website applies different coding technology of webpage and webpage layout which brings great difficulty to access to information about comparison shopping.The model of information extraction based on Hidden Markov Model(HMM) is an effective method because HMM have many merits,for example,it is easy to set up and adaptable.But algorithm of HMM is difficult to optimize extraction model and to compute state sequence.This paper presents a Choquet integral Hidden Markov Model(CI-HMM),which applies fuz...
Keywords:Information Extraction  Comparing Shopping  Hidden Markov Model  Choquet Integral  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号