首页 | 本学科首页   官方微博 | 高级检索  
     检索      

大规模中文具体度词典的构建及推理技术
引用本文:谢志鹏,毕冉.大规模中文具体度词典的构建及推理技术[J].北京大学学报(自然科学版),2022,58(1):1-6.
作者姓名:谢志鹏  毕冉
作者单位:复旦大学计算机科学技术学院, 上海 200433
基金项目:国家重点研发计划(2018YFB1005100);;国家自然科学基金(62076072)资助;
摘    要:针对中文词语具体度资源的匮乏,提出一种自动的中文词语具体度词典构造方法.该方法充分利用已有的英文词语具体度资源,基于在线翻译工具和预训练词向量,训练出中文词语具体度的多层感知器回归模型,构造大规模的中文词语具体度词典.为了评估该中文词语具体度词典的性能,设计两项基本的具体度推理任务:词语级具体度推理和句子级具体度推理,...

关 键 词:词语具体度  具体度推理  多层感知器  自然语言处理
收稿时间:2021-06-08

Construction and Inference Technique of Large-ScaleChinese Concreteness Lexicon
XIE Zhipeng,BI Ran.Construction and Inference Technique of Large-ScaleChinese Concreteness Lexicon[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2022,58(1):1-6.
Authors:XIE Zhipeng  BI Ran
Institution:School of Computer Science, Fudan University, Shanghai 200433
Abstract:To solve the resource-lack problem of Chinese word concreteness, this paper designs and implements an automatic method to construct Chinese concreteness lexicon. By making full use of the existing resource of English word concreteness, it builds up a large-scale Chinese concreteness lexicon based on pretrained word embeddings and an MLP concreteness regression model. In addition, it proposes the concreteness inference tasks on the word level and on the sentence level, and manually constructs the corresponding datasets for evaluation the performance of the Chinese concreteness lexicon on these tasks. Experimental results show that the constructed concreteness lexicon can perform the two inference tasks effectively.
Keywords:word concreteness  concreteness inference  multi-layer perceptron  natural language processing  
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号