首页 | 本学科首页   官方微博 | 高级检索  
     

基于文本挖掘的互联网教育课程主题发现与聚类研究
引用本文:李梦杰,刘建国,郭强,李仁德,汤晓雷. 基于文本挖掘的互联网教育课程主题发现与聚类研究[J]. 上海理工大学学报, 2018, 40(3): 259-266
作者姓名:李梦杰  刘建国  郭强  李仁德  汤晓雷
作者单位:上海理工大学复杂系统科学研究中心;上海财经大学科研实验中心;沪江教育科技股份有限公司
基金项目:国家自然科学基金资助项目(61773248,71771152)
摘    要:如何通过有效的数据挖掘对互联网教育平台中的课程主题进行挖掘、聚类是当前互联网教育亟待解决的问题之一。实验基于文本信息对某互联网教育平台的1 472门课程体系的主题分布及类别进行了分析。采集了某平台1 472门课程的描述信息,进而通过自建词典和停用词库对文本进行切词分词,并通过TF-IDF对词频权重进行处理。利用LDA主题模型对课程的主题分布进行识别,发现了230个主题,并得到了每门课程在这230个主题下的文档–主题分布以及主题–词分布。进一步基于分布相似性函数对课程进行层次聚类,发现基于不同抽象层次主题的课程相互关联。最后将16个主题信息进行了可视化,这些主题分别从内容和数量两个角度反映出了课程的主题特征以及课程的聚合分布情况。

关 键 词:主题发现  层次聚类  互联网教育  文本挖掘
收稿时间:2017-09-05

Topic Discovery and Clustering Research for Online Courses Based on Text Mining
LI Mengjie,LIU Jianguo,GUO Qiang,LI Rende and TANG Xiaolei. Topic Discovery and Clustering Research for Online Courses Based on Text Mining[J]. Journal of University of Shanghai For Science and Technology, 2018, 40(3): 259-266
Authors:LI Mengjie  LIU Jianguo  GUO Qiang  LI Rende  TANG Xiaolei
Affiliation:Research Center of Complex Systems Science, University of Shanghai for Science and Technology, Shanghai 200093, China,Laboratory Center, Shanghai University of Finance and Economics, Shanghai 200433, China,Research Center of Complex Systems Science, University of Shanghai for Science and Technology, Shanghai 200093, China,Research Center of Complex Systems Science, University of Shanghai for Science and Technology, Shanghai 200093, China and Hujiang Education & Technology Co., Ltd., Shanghai 201203, China
Abstract:
Keywords:topic discovery  hierarchical clustering  online education  text mining
本文献已被 CNKI 等数据库收录!
点击此处可从《上海理工大学学报》浏览原始摘要信息
点击此处可从《上海理工大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号