首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于频繁关键字共现的诗词风格分类模型研究
引用本文:吴春龙,周昌乐.基于频繁关键字共现的诗词风格分类模型研究[J].厦门大学学报(自然科学版),2008,47(1):41-44.
作者姓名:吴春龙  周昌乐
作者单位:厦门大学信息科学与技术学院,艺术认知与计算实验室,福建,厦门,361005
摘    要:为了提高宋词文档分类的精确性,本文在广泛采用的向量空间模型(Vector space model,VSM)的基础上,对分类算法中使用的特征项做了相应的修改,提出了频繁关键字共现的概念.在实验过程中,首先提取了宋词语料库中的关键字,再利用发现关联规则的Apriori算法发现分类时所需要的频繁关键字共现,最后结合关键字和频繁关键字共现,利用最邻近算法(KNN)对宋词文档进行风格分类.实验结果发现,结合了频繁关键字共现的VSM可以提高对宋词风格分类的准确度.可见,频繁关键字共现确实提供了风格分类中所需的更多信息.

关 键 词:文本分类  向量空间模型  FKC-VSM  最邻近算法  Apriori算法  频繁关键字共现  关键字  诗词风格  分类模型  研究  Analysis  Style  Poetry  Chinese  Vector  Space  Model  多信息  结果  实验过程  格分类  行风  文档  最邻近算法  再利用  结合  类时  Apriori
文章编号:0438-0479(2008)01-0041-04
修稿时间:2007年5月5日

Frequent Keyword Concurrence-Based Vector Space Model for Chinese Poetry Style Analysis
WU Chun-long,ZHOU Chang-le.Frequent Keyword Concurrence-Based Vector Space Model for Chinese Poetry Style Analysis[J].Journal of Xiamen University(Natural Science),2008,47(1):41-44.
Authors:WU Chun-long  ZHOU Chang-le
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号