首页 | 本学科首页   官方微博 | 高级检索  
     

基于Web的新闻文本分类技术的研究
引用本文:胡凌云,胡桂兰,徐勇,李龙澍. 基于Web的新闻文本分类技术的研究[J]. 安徽大学学报(自然科学版), 2010, 34(6)
作者姓名:胡凌云  胡桂兰  徐勇  李龙澍
基金项目:安徽省高等学校自然科学研究基金,教育部人文社会科学研究青年基金
摘    要:从Web新闻网页中挖掘出有用的知识是当前研究的热点问题,将Web新闻网页进行解析,在此基础上进行Web新闻文本分类处理,可在一定程度上解决此问题.针对Web新闻网页的结构特点,提出了基于Web的新闻文本分类系统的实现框架.实验结果表明,基于KNN算法的分类系统具有较好的分类效果.

关 键 词:网页解析  文本  分类

Research of text classification technology based on Web news pages
HU Ling-yun,HU Gui-lan,XU Yong,LI Long-shu. Research of text classification technology based on Web news pages[J]. Journal of Anhui University(Natural Sciences), 2010, 34(6)
Authors:HU Ling-yun  HU Gui-lan  XU Yong  LI Long-shu
Abstract:It's a very hot research issue for knowledge mining from the internet news Web pages currently.Based on the Web page parsing and news Web text classification,the issue will be solved effectively.On the basis of structure character of Web news page,the realizing outline of Web news text classification system was established.The experiment results showed that the classification system based on KNN method was effective.
Keywords:web page parsing  text  classification
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号