首页 | 本学科首页   官方微博 | 高级检索  
     检索      

无关语获取与语料聚类方法研究
引用本文:周峰,朱俊武,童林,陈伟聪,陈波.无关语获取与语料聚类方法研究[J].南京师大学报,2014(4):150-157.
作者姓名:周峰  朱俊武  童林  陈伟聪  陈波
作者单位:1. 扬州大学信息工程学院,扬州,225127
2. 扬州大学信息工程学院,扬州225127; 中科院计算技术研究所智能信息处理开放实验室,北京100190
3. 伊凡斯维尔大学计算机科学和应用数学系,印弟安纳州 美国47722
基金项目:国家自然科学基金,江苏省高校自然科学基金
摘    要:剔除无关语及语料聚类对提高自然语言理解的质量具有重要意义,也是自然语言理解的预处理关键技术.鉴于无关语在语料中存在明显的特性,本文通过种子无关语推导出强无关语,并依据强无关语识别并导出新的无关语;然后,基于2-gram构建句子之间的相似性,利用层次法对语料进行聚类对QA语料进行问题相似的聚类.最后,通过识别的新无关语实验及语料聚类实验,验证本文提出方法的有效性.

关 键 词:无关语  获取  识别  算法

Research on Method for Independent Languages Acquisition and Clustering Corpus
Zhou Feng,Zhu Junwu,Tong Lin,Chen Weicong,Chen Bo.Research on Method for Independent Languages Acquisition and Clustering Corpus[J].Journal of Nanjing Normal University(Natural Science Edition),2014(4):150-157.
Authors:Zhou Feng  Zhu Junwu  Tong Lin  Chen Weicong  Chen Bo
Institution:Zhou Feng;Zhu Junwu;Tong Lin;Chen Weicong;Chen Bo;College of Information Engineering,Yangzhou University;Institute of Computing Technology Chinese Academy of Sciences,Laboratory of Intelligent Information Processing;Department of Computer Science and Applied Mathematics,University of Evansville;
Abstract:
Keywords:independent languages  acquisition  recognition  algorithm
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号