首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
与服药相关的社交文本中隐藏着更具时效和更广泛的药物不良反应信息,但是从相对短小、稀疏的社交短文本中提取药物不良反应非常困难。基于此,本文提出一种双向语言预训练模型和注意力机制相结合的神经网络识别方法。该方法利用双向字符级语言预训练模型提取特定字符级特征,而且在提取药物不良反应的同时,通过注意力机制捕获局部和全局语义上下文信息。此外,为了提高该方法的效率,将字符级特征与词级特征相结合,并采用词级预训练和字符级预训练模型代替协同训练。在PSB 2016社交媒体挖掘共享任务2中的实验结果表明,字符特征在形态学上有助于区分药物不良反应,而注意力机制通过捕获局部和全局语义信息提高了对药物不良反应的识别性能,宏平均F1值为82.2%。  相似文献   

2.
与服药相关的社交文本中隐藏着更具时效和更广泛的药物不良反应信息,但是从相对短小、稀疏的社交短文本中提取药物不良反应非常困难。基于此,本文提出一种双向语言预训练模型和注意力机制相结合的神经网络识别方法。该方法利用双向字符级语言预训练模型提取特定字符级特征,而且在提取药物不良反应的同时,通过注意力机制捕获局部和全局语义上下文信息。此外,为了提高该方法的效率,将字符级特征与词级特征相结合,并采用词级预训练和字符级预训练模型代替协同训练。在PSB 2016社交媒体挖掘共享任务2中的实验结果表明,字符特征在形态学上有助于区分药物不良反应,而注意力机制通过捕获局部和全局语义信息提高了对药物不良反应的识别性能,宏平均F1值为82.2%。  相似文献   

3.
近十年来,通过社交网络(如微博、推特)分享信息已经成为人们日常生活中不可缺少的一个环节,如何有效地预测信息传播的影响力成为社交网络研究中的重要课题,不论是识别病毒式营销和虚假新闻还是精确推荐和在线广告都有许多应用.目前,一些应用深度学习进行社交网络影响力预测的方法已经取得了一定进展,但在进行深度学习时仍会面临以下难点:用户通常具有不同的行为和兴趣并且他们同时通过不同的渠道进行互动;用户之间的关系难以检测和形式化表达.传统的社交网络影响力预测方法通过设计复杂的规则来手动提取用户及其所处网络的特征信息,这一方法的有效性严重依赖于设置规则的专业性,所以很难将某一领域的规则推广到其他领域的应用中去.基于深度神经网络模型,设计一种端到端的神经网络来学习用户的隐藏特征信息以预测其社交网络影响力.首先通过图嵌入的方式对用户的局部网络进行特征提取,然后将特征向量作为输入对图神经网络进行训练,从而对用户的社会表征进行预测.该方法的创新之处:运用图卷积和图关注方法,将社交网络中用户的特征属性和其所处局域网络特征相结合,大大提高了模型预测的精度.通过在推特、微博、开放知识图谱等数据集上的大量实验,证明该方法...  相似文献   

4.
针对社交媒体数据感知成本高、数据感知效率低等问题,提出了社交媒体嵌入关系多阶段数据感知方法(online social media-multi stage data aware,OSM-MSDA)。该方法以数据感知对象内部关系的分布特征为基础,构造一个具有偏好特征的种子网络;采用Metropolis-Hastings方法优先选取数据感知对象中高度节点的邻接关系,快速填充特征网络,实现网络轮廓探测;使用基于马尔可夫生灭机制的延迟拒绝方法控制概率转移核,对局部耦合关系进行修剪,确保连通关系疏密的合理分布。实验结果表明:OSM-MSDA建立的多阶段渐进数据抽样方法,能够克服已有数据感知方法采集样本的盲目性,在宏观尺度准确、高效的感知社交媒体嵌入关系的社会资本特征,确保特征网络与数据感知对象的结构更具有一致性,同时还能降低数据的使用成本,将数据处理效率提高32%~63%。  相似文献   

5.
网络社交媒体的快速发展提供了便捷的信息获取方式,但也滋生了谣言和虚假新闻,现有的谣言检测模型在有标注数据充足时能有效解决分类问题,然而谣言可用的标注数据有限,各种针对谣言特点精心设计的模型倾向于过拟合,同时,现有模型的鲁棒性不足,谣言传播者恶意破坏谣言传播结构会使模型出现分类错误.针对以上问题,采用自监督的图对比学习方法,对原始谣言传播图进行不同方式的数据增强来模拟对原图的扰动,建立自监督对比学习任务,使图编码器捕获谣言更趋本质的特征,缓解了过拟合,提高了模型的鲁棒性与泛化性能.在来源于主流社交媒体平台的三个公开数据集Twitter15,Twitter16和PHEME上进行了对比实验,实验结果显示,提出的模型的准确率比基准模型分别提高3.4%,1.8%和1.2%,证实了图自监督对比学习方法在谣言检测任务上的有效性.  相似文献   

6.
针对基于图神经网络的谣言检测方法在聚合邻居节点信息生成谣言表示过程中存在的噪声干扰问题,充分利用社交媒体源帖包含的丰富语义和结构信息对谣言检测的重要影响,提出一种基于门控图神经网络的谣言检测模型,该模型根据信息传播过程建模谣言的传播图和扩散图,基于门控图神经网络聚合邻居信息生成节点表示,利用门控机制去除邻居节点噪声,同时引入根节点语义增强方法提升表征节点的能力。此外,利用注意力机制融合局部结构和全局结构信息学习更加全面的谣言表示用于谣言检测任务。在公开数据集上的实验结果证明,提出的模型在谣言检测性能和早期检测能力方面均优于基线方法。  相似文献   

7.
随着互联网的飞速发展,人们都在用社交媒体来作为知识分享、传播以及情感交流的主要平台,因此在社交媒体的药物不良反应检测将会是关注当前人们用药情况的重要渠道。与此同时,传统的机器学习在构建特征时较为困难并且有着较弱的迁移性,而卷积神经网络,即CNN,在进行空间信息建模时又存在效率低和空间不敏感的缺点。针对以上问题,文章基于通用文本处理特征和生物医学的专属特征等,提出一种基于胶囊网络和长短时记忆神经网络结合的方法来检测在社交媒体中的药物不良反应事件,使用的语料集是2017年The Social Media Mining for Health (SMM4H)共享任务语料集中的数据,对语料进行预处理后对药物不良反应进行标记,并且构造了分布式词向量特征、词性标记、字符级向量特征以及每句话中药物名和情感词作为模型的特征输入,形成对比实验。解决了在分类过程中特征之间空间关系缺失和构建模型效率低的问题,该实验结果与此前先进的结果相比F1值升高了4.2%,证明该方法在检测社交媒体的药物不良反应事件中是有效的并且具有良好的性能。  相似文献   

8.
脚本事件预测是指在给定现有上下文事件链的情况下预测后续事件.在现实世界中,不同事件的关系可以自然地表示为图结构,以事件为节点,以时间或因果关系为边.由于语料库规模有限和信息提取工具的能力不足,先前工作中自动构建的事件图会存在稀疏性问题,并且无法集成来自高阶节点的信息以支持多步推理.为了解决这个问题,本文提出使用可学习的多维加权邻接矩阵的稠密事件图(DEG)来解决之前事件图存在的稀疏性问题并表征事件之间的关系强度.为了实现DEG的嵌入表示,本文同时提出了一个通用框架,该框架能够将高阶事件演化信息组合到事件表示中.在多选叙事完形填空(multiple choice narrative cloze,MCNC)和连贯多选叙事完形填空(coherent multiple choice narrative cloze ,CMCNC) 数据集上进行了实验,结果证明了此框架的有效性.  相似文献   

9.
针对网络环境中出现的以服务为聚合的通信行为和以分布式攻击为典型的新型协同攻击模式,提出了基于图演化事件的主机群异常检测模型。分析了行为主体潜在的社会化关系、聚集成簇的主机群及其群体行为的动态特性,该模型具有无参数、数据量级可扩展的特点。定义并提出了图动态演化事件及检测算法,实现异常主机群检测。本模型在Spark上实现和部署,还从实际计算机和网络环境提取数据进行分析和验证。实验结果表明,该模型能够有效刻画群体行为,揭露重要的图演化事件,准确定位异常发生的主机群,其群成员主机的检测率达到95.09%。  相似文献   

10.
为了预防新冠肺炎的传播,在佩戴口罩的同时,保持一定的社交安全距离是必要的。为解决现有的目标检测算法在社交距离检测中无法同时满足检测的实时性、准确性以及在复杂场景中存在遮挡、小尺度目标等问题,提出基于YOLOv3的改进算法DPPY(Dilated Pyramid-Pooling with YOLOv3)。首先使用空洞卷积参与到YOLOv3的核心图像处理结构中,然后引入密集型连接网络进一步融合不同层之间的连接,并且在这基础上还模仿了空间金字塔结构处理输入数据的尺寸问题,最后将这些处理结果一起与待追踪物体与彼此间的前后位置进行更好的关联并选用卡尔曼滤波器这个工具来更好地处理。若行人彼此间靠的过于紧密,则标红发出警报,以便更好地提醒相关人员注意。结果表明:与传统的YOLOv3算法相比,DPPY算法检测速度更快,检测精度更高。检测速度达到了34帧/s,平均准确率(Average Precision, AP)提高了9.1 %,并且在大、中、小目标检测中平均准确率均值(mean Average Precision, mAP)分别提高了7.8 %、8.2 %、8.9 %。  相似文献   

11.
12.
事件检测是自然语言处理领域的重要任务之一,其结果可以有效支撑信息抽取、文本分类和事件推理等下游任务. 预训练语言模型BERT在事件检测任务上取得了显著的成绩,然而该类方法无法有效获取长距离和结构化的文本信息. 为了缓解该问题,本文提出基于反馈网络的图卷积神经网络模型进行文本结构信息捕获,同时这种新方法能够有效解决图卷积神经网络带来的语义信息衰减性问题. 本文首先使用BERT预训练模型获取文本的语义特征,然后使用融入反馈网络的图卷积神经网络提取文本的句法结构特征,最终使用多分类器实现对事件触发词的识别和分类.公开数据集ACE 2005上的实验结果表明,本文提出的事件检测方法在事件触发词识别和分类任务上的F1值分别达到了74.46%和79.49%,较现有工作平均提高了4.13%和4.79%.  相似文献   

13.
社交媒体的快速发展导致了虚假新闻的广泛传播,这不仅影响了人们的生活,也损害了社交媒体平台的可信度。因此,中文假新闻检测是一项具有挑战性且意义重大的任务。然而,现有的中国社交媒体平台的假新闻数据集数据量相对较少,该领域的数据收集相对陈旧,不能满足进一步研究的要求。考虑到这一背景,本文提出了一个最新的中文微博假新闻数据集,其中包含从微博收集的26320条假新闻数据。此外,还提出了一种基于数据增强的假新闻检测模型,可以有效解决假新闻数据缺乏的问题,提高模型的泛化能力和鲁棒性。对从微博收集的假新闻数据集进行了大量实验,并成功将模型部署在网页上。实验结果证明了所提出的端到端模型在检测社交媒体平台上的虚假新闻方面的有效性。  相似文献   

14.
声音事件检测技术能够识别出一个音频段中存在的事件类别并标注出各事件的起止时间,在智能城市、医疗监控、野生动物保护等应用场景有巨大潜力,是机器听觉领域的一个重要研究课题。本文从监督学习和半监督学习2个方面对声音事件检测方法进行综述,汇总和分析现有研究中使用的特征、检测模型及其性能。对于监督学习,重点介绍机器学习方法和深度学习方法。对于半监督学习,总结基于均值教师、协同训练、多尺度卷积和注意力机制等4种有效方法。最后,介绍常用数据集和评价指标,并讨论未来可能的研究方向,包括声音分离预处理、合成数据和真实数据域适应、自注意力模型优化、特征选择和融合、流式系统建模等问题。  相似文献   

15.
各个社交平台的作弊问题日趋严重,欺诈检测工作越来越有必要.现有在该场景的解决办法没有同时利用用户特征和关联关系两方面重要信息或者不能应用于现实上亿规模的数据量.针对这个问题,开创性地将GraphSAGE算法应用于社交平台的反作弊场景并进行改进,提出带权采样GraphSAGE算法.改进后算法根据节点之间特征相似程度进行采样.在真实大数据集上进行了实验,线下实验中,相较于基准模型和现有主流模型,性能上有了较明显的提升,且加快了模型的收敛过程.在线上结合基础规则,达到了极高的精确率,并召回之前未察觉的两个作弊团伙.  相似文献   

16.
针对自动编码器仅对单个数据所包含的内容信息进行特征提取,忽略了数据之间结构信息的问题,提出一种基于异构融合和判别损失的深度图聚类网络.首先,将两个自动编码器获取的异质信息进行融合,解决了采用单一自动编码器提取特征时的信息丢失问题;其次,在聚类训练模块基于类内分布一致性设计判别损失函数,使模型可以端到端地训练,避免了两阶段训练方法中出现特征提取与聚类算法提前假设不匹配的情况;最后,在6个常用数据集上进行实验并验证了该方法的有效性.实验结果表明,与现有的大多数深度图聚类模型相比,该方法在非图数据集和图数据集上的聚类性能有明显提升.  相似文献   

17.
全色锐化旨在将低空间分辨率的多光谱图像和高空间分辨率的全色图像进行融合,生成一幅高空间分辨率的多光谱图像.伴随卷积神经网络的发展,涌现出很多基于CNN的全色锐化方法.这些用于全色锐化的CNN模型大都未考虑不同通道特征和不同空间位置特征对最终锐化结果的影响.并且仅使用基于像素的1-范数或2-范数作为损失函数对锐化结果与参考图像进行评估,易导致锐化结果过于平滑,空间细节缺失.为了解决上述问题,本文提出一种嵌入注意力机制,并辅以空间结构信息对抗损失的生成对抗网络模型.该网络模型由2个部分组成:一个生成器网络模型和一个判别器网络模型.嵌入通道注意力机制和空间注意力机制的生成器将低分辨多光谱图像和全色图像融合为高质量的高分辨多光谱图像.判别器以patch-wise判别的方式对锐化结果与参考图像的梯度进行一致性检验,以确保锐化结果的空间细节信息.最后,在3种典型数据集上的对比实验验证了所提出方法的有效性.  相似文献   

18.
祝洁 《创新科技》2015,(8):94-96
社交媒体的应用是档案机构开展档案信息传播的必然趋势。本文首先对社交媒体的类型和特征进行阐述,并在分析档案信息传播微观模式的基础上,结合社交媒体信息传播的特点,提出提升档案机构社交媒体应用效果的策略。  相似文献   

19.
针对智能制造中表面缺陷检测数据集不足问题,提出基于M-DCGAN的数据集增广方法。首先,向判别器添加上采样模块,搭建类U-Net结构并提升判别器与生成器的网络深度;设计基于Canny边缘检测的缺陷位置二值化掩膜提取方法;定义图像掩膜依赖的损失函数,建立缺陷目标位置关注引导机制;插入谱归一化层和Dropout层以提高训练稳定性,保持生成图像数据多样性。带钢缺陷数据集实验结果表明,该模型生成图片质量高于DCGAN、WGAN-GP和InfoGAN。采用本文M-DCGAN算法增广训练数据,能够显著提升并超过传统增广算法在YOLOv5、SSD、Faster R-CNN、YOLOv3等八种经典方法中的缺陷检测精度,验证了本文算法的有效性。  相似文献   

20.
为了实现对于微博长文本谣言的检测,使用ERNIE模型对微博长文本数据使用词嵌入技术实现对文本的向量化,将这些词向量作为BiLSTM-DPCNN模型的输入,利用BiLSTM-DPCNN模型的特性,捕捉句子中的上下文信息和长期依赖关系,最终高效地提取特征并进行分类.数据集通过五折交叉验证方法划分,通过设置多组对比实验,实验结果显示:ERNIE-BiLSTM-DPCNN模型的准确率达到98.52%,高于在同一数据集下的其他同组实验,证明该模型对于微博长文本谣言检测具有较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号