首页 | 本学科首页   官方微博 | 高级检索  
     

基于朴素贝叶斯的文化旅游文本分类技术研究
作者姓名:王祥翔  方荟  陈崇成
作者单位:福州大学福建省空间信息工程研究中心,数据挖掘与信息共享教育部重点实验室,福建 福州 350116,福州大学福建省空间信息工程研究中心,数据挖掘与信息共享教育部重点实验室,福建 福州 350116 闽江学院福建省信息处理与智能控制重点实验室,福建 福州 350108,福州大学福建省空间信息工程研究中心,数据挖掘与信息共享教育部重点实验室,福建 福州 350116
摘    要:将文本分类技术引入文化旅游文本研究,根据文化旅游文本的特点,提出一种基于朴素贝叶斯的文化旅游文本分类模型. 首先构建文化专题词库,采用向量空间模型将景点描述文本转换为向量,通过信息增益进行词汇特征选择,利用词频-逆文档频率进行权重的赋值,构建分类器模型,实现旅游文本的自动分类. 实验选取了1447个景点描述文本,按照闽南文化、客家文化、红色文化和生态文化进行分类,取得较好的分类效果.

关 键 词:文化旅游  文本分类  朴素贝叶斯  信息增益
点击此处可从《福州大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《福州大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号