基于多标签分类的学术文献潜在时间意图识别研究 |
| |
引用本文: | 沈思,吴玺煜.基于多标签分类的学术文献潜在时间意图识别研究[J].湖南大学学报(自然科学版),2017,44(10):158-165. |
| |
作者姓名: | 沈思 吴玺煜 |
| |
作者单位: | (1.南京理工大学 经济管理学院,江苏 南京 210094; 2.华南师范大学 计算机学院,广东 广州 510631) |
| |
摘 要: | 为了提高检索结果的时间相关性,将文本特征抽取和多标签分类算法应用于文献检索的潜在时间意图分类研究之中.从检索潜在时间意图分类的角度出发,提出一种基于文本时间信息抽取和Labeled LDA(标签主题模型)的文献潜在时间意图自动分类算法.首先,在获取的文献时间信息基础上,将文献检索潜在时间意图映射至具体时间类别.其次,为了减少时间信息的稀疏性对分类特征学习过程的影响,利用交叉学科中时间短语分布特征优化Labeled LDA分类模型的标签选择过程.最后,将所提算法与其他多标签分类算法进行对比实验,分析和评估文献检索潜在时间意图自动分类的准确率.结果表明,所提算法的AUC的值达到79.6%,较同类基准算法ECC(整体分类链)提高约10.9%,且针对不同学科均取得了较好的分类效果,是一种有效的文献检索潜在时间意图学习方法.
|
关 键 词: | 多标签分类 主题模型 潜在时间意图 文本特征抽取 文本分类 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《湖南大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《湖南大学学报(自然科学版)》下载免费的PDF全文 |
|