首页 | 本学科首页   官方微博 | 高级检索  
     

基于BERT的百科知识库实体对齐
作者姓名:高茂  张丽萍  侯敏  闫盛  赵宇博
作者单位:内蒙古师范大学计算机科学技术学院
基金项目:内蒙古自治区自然科学基金资助项目(2018MS06009,2021LHMS06012);;内蒙古自治区哲学社会科学研究专项资助项目(ZSZX21102);
摘    要:基于微调BERT(bidirectional encoder representation from transformers)模型的实体对齐方法,对齐百度百科、互动百科的多模态资源。首先,通过下游的分类任务微调BERT模型,提升模型预测正确结果的能力;其次,针对数据集正负样本比例不均衡的问题,提出负采样策略,提升模型的准确程度与泛化性能,实验结果证明分类任务性能明显提升,AUC(area under the curve)值提升0.29;最后,将优化后的模型应用于实体对齐任务中,利用输出概率进行排序并预测最终对齐的实体对,实验结果优于基于相似度计算的实体对齐方法,F1值达到95.9%。

关 键 词:BERT  课程资源融合  实体对齐  负采样
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号