基于朴素贝叶斯的文化旅游文本分类技术研究 |
| |
作者姓名: | 王祥翔 方荟 陈崇成 |
| |
作者单位: | 福州大学福建省空间信息工程研究中心,数据挖掘与信息共享教育部重点实验室,福建 福州 350116,福州大学福建省空间信息工程研究中心,数据挖掘与信息共享教育部重点实验室,福建 福州 350116
闽江学院福建省信息处理与智能控制重点实验室,福建 福州 350108,福州大学福建省空间信息工程研究中心,数据挖掘与信息共享教育部重点实验室,福建 福州 350116 |
| |
摘 要: | 将文本分类技术引入文化旅游文本研究,根据文化旅游文本的特点,提出一种基于朴素贝叶斯的文化旅游文本分类模型. 首先构建文化专题词库,采用向量空间模型将景点描述文本转换为向量,通过信息增益进行词汇特征选择,利用词频-逆文档频率进行权重的赋值,构建分类器模型,实现旅游文本的自动分类. 实验选取了1447个景点描述文本,按照闽南文化、客家文化、红色文化和生态文化进行分类,取得较好的分类效果.
|
关 键 词: | 文化旅游 文本分类 朴素贝叶斯 信息增益 |
|
| 点击此处可从《福州大学学报(自然科学版)》浏览原始摘要信息 |
|
点击此处可从《福州大学学报(自然科学版)》下载免费的PDF全文 |
|