摘 要: | 社交媒体的快速发展导致了虚假新闻的广泛传播,这不仅影响了人们的生活,也损害了社交媒体平台的可信度。因此,中文假新闻检测是一项具有挑战性且意义重大的任务。然而,现有的中国社交媒体平台的假新闻数据集数据量相对较少,该领域的数据收集相对陈旧,不能满足进一步研究的要求。考虑到这一背景,本文提出了一个最新的中文微博假新闻数据集,其中包含从微博收集的26320条假新闻数据。此外,还提出了一种基于数据增强的假新闻检测模型,可以有效解决假新闻数据缺乏的问题,提高模型的泛化能力和鲁棒性。对从微博收集的假新闻数据集进行了大量实验,并成功将模型部署在网页上。实验结果证明了所提出的端到端模型在检测社交媒体平台上的虚假新闻方面的有效性。
|