首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为了更有效地检测微博垃圾用户,提出了一种新的基于多视图融合的方法。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、微博内容3个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环境的不足,引入粉丝比率、粉丝平均双向连接率、基于社区的双向连接率、基于社区的集群系数等新特征。然后,构建基于线性加权函数的多视图融合决策模型,将来自各视图的分类结果进行线性加权融合,并通过最小化近似误差求得最优融合系数,进而得到最终的分类结果。在微博真实数据集上的测试结果表明,该方法能够有效检测垃圾用户,精确率和F1值较现有方法有明显提高,且在应对不平衡数据时表现出了更强的稳定性。文中还分析了不同视图对最终检测效果的影响,结果表明用户社交关系视图的作用最显著。  相似文献   

2.
文本分类是垃圾短信过滤的核心技术,为了在文本分类时实现特征提取,就需要在不影响分类准确性的前提下,减少原始空间的维数.文档频率、信息增益、互信息、统计、期望交叉熵法、文本证据权和主成分分析是目前采用的主要的特征降维方法,通过实验数据对六种方法的性能做比较分析后发现,对于垃圾短信过滤系统而言,信息增益是最优的特征选择方法.  相似文献   

3.
提出了一种基于变换器的多视角医学图像融合分割框架,通过采用一种发散融合的注意力模型来建模跨视图信息,充分挖掘语义之间的相互依赖,解决了不同视图之间的数据不对齐以及难以捕捉长距离相关性等关键问题。同时使用多尺度注意力机制来提取多尺度的全局特征。在Cardiac MRI数据集上分别评估了多疾病、多视角和多中心的右心室分割任务,验证了该方法具有更优的分割性能。  相似文献   

4.
垃圾短信已日益成为影响人们日常生活的严重问题,由于短信属于短文本,长度较短,特征稀疏,尤其是垃圾短信为逃避过滤机制,其结构和内容常常不规范,所以传统的文本特征提取方法并不能完全适用于短信分类。从短信的结构及语义两个角度提取特征项,并建立语义特征词表,采用基于多特征融合的方法来向量化表示短信文本。针对短信数据集中存在的噪声及数据不平衡问题,分别比较了NB、SVM、DT、LR、MLP、RF分类器的性能差别。实验表明,采用RF分类算法,能有效减弱噪声干扰及数据不平衡性所带来的影响。通过在CCF 2015中国好创意竞赛题目“垃圾短信基于文本内容识别”所提供的数据集上进行验证,取得了很好的效果。  相似文献   

5.
利用微博数据检测突发事件具有重要意义.针对以往检测方法特征不够丰富、准确率不高等问题,提出了一种基于多种特征融合的微博突发事件检测方法.该方法根据情感符号构建情感特征模型,对微博数据进行情感分类,并采用Kleinberg算法对情感特征进行突发期检测;在突发期内根据词频特征、词频增长特征和话题标签特征融合加权提取突发词,...  相似文献   

6.
在神经生成式摘要任务中,由于输入文档与参考摘要之间不存在显式的对齐关系,通常会导致重复生成相同单词的问题以及生成的摘要与输入文档语义不相关、准确性低的问题.为更好解决该问题,提出了混合过滤编码网络(HFEN)并在HFEN中集成混合过滤编码机制(HFEM)、注意力机制、指针生成器.HFEM分为管道过滤编码机制(PFEM)...  相似文献   

7.
情感倾向性分析是情感分析的重要组成部分,是一种按照情感倾向对文本进行分类的任务。微博与传统的评论文本相比更加口语化与符号化,因此对微博进行情感倾向性分析是一个非常有挑战性的任务。基于机器学习的方法是情感倾向性分析最经典的算法,核心是要进行特征的分析和选择,例如词袋特征等。然而,由于中文语言的独特性,前人很多有效的特征都是语言相关的,将其直接用于中文微博效果不佳。在中文微博语料上,还没有学者进行细致的特征工程建设。基于此,文章综合国内外诸多特征,并考虑到中文的独特性,对中文微博的褒贬中倾向性判别特征工程的词、词组、数值和句法特征分别进行了研究,并提出了基于词典规则的情感评分的新特征。最后经过大量实验与分析,得出了可靠的特征组合。实验结果表明,此方法能够明显提高情感倾向性分析的结果。  相似文献   

8.
针对发表在微博上评论信息的特点,尤其是那些广大网民用户不愿看到的垃圾评论信息进行了深入研究.归纳了网络上垃圾评论的存在形式和类型,将垃圾评论分为社会网络垃圾评论和普通垃圾评论.为了有效地检测与过滤微博中评论垃圾,提出了一种微博垃圾评论数据预处理的过程和方法,将预处理后的评论信息作为分类和检测的基础.  相似文献   

9.
微博作为近年来用户数量较多的社交应用,其用户的信息压力也相对较大,推荐技术对于微博用户的体验和推广有很明显的帮助.本文将针对微博平台的好友推荐进行研究,分别采用基于社交网络分析和基于协同过滤技术的推荐算法.经过两种算法的实验对比得出结论:基于协同过滤的好友推荐算法具有较好的性能,在推荐好友数量较多的情况下依然具有较高的综合评价指标,提高了好友推荐的质量.  相似文献   

10.
提出一种过滤垃圾电子邮件的方法.通过tf-idf特征提取方法提取邮件的词汇特征,采用χ2特征选择方法选取有效的特征,并抽取几个具有明显区分能力的结构方面的特征,利用支持向量机算法对垃圾电子邮件进行自动过滤.对中科院中文垃圾邮件语料库(Cspam)的实验,识别正确率达到82%以上,另外,tf-idf词汇特征和结构特征搭配使用可以提高分类的正确率,表明此种方法能提高垃圾电子邮件过滤的准确性.  相似文献   

11.
日益泛滥的图像垃圾邮件给互联网用户带来极大的不便,如何对其实施有效过滤成为亟待解决的问题.分析图像垃圾邮件过滤中的关键问题邮件图像的特征提取.利用垃圾邮件重复发送、内容高度相似的特点,提出一种过滤图像垃圾邮件的新方法:提取邮件图像的综合特征值,以此作为目标邮件图像与垃圾邮件图像样本库相似性度量的依据,通过检测其是否相似来实现垃圾邮件图像的过滤.实验中,提取邮件图像的颜色、纹理和形状3种底层特征,其描述方法分别为颜色矩、共生矩阵统计量和不变矩.结果表明该方法对图像垃圾邮件的召回率达到95%以上.  相似文献   

12.
基于贝叶斯理论的垃圾邮件算法研究   总被引:1,自引:0,他引:1  
为减少垃圾邮件在服务器端的出现,以贝叶斯理论为基础,探讨了可在邮件服务器端实现过滤和自我升级的系统;以合法和非法两类邮件的分析为基础,采用贝叶斯模型生成过滤器,用真实邮件进行仿真操作,验证了模型的可行性。  相似文献   

13.
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。  相似文献   

14.
信息传播和用户影响力度量是目前微博研究的基础和热点方向。为了定量地研究用户影响力,提出基于用户消息传播范围的用户影响力量化定义,并给出用户影响力的计算方法。在真实数据集上对算法的验证结果显示,与其他用户影响力度量方法相比,本文提出的方法计算复杂性低、指标稳定性高,尤其适合于需要限定数据集、限定时间段的具体应用场景。  相似文献   

15.
基于改进的并行特征融合人脸表情识别   总被引:1,自引:1,他引:1  
基于信息融合理论和线性鉴别分析,提出了一种改进的并行特征融合人脸表情识别方法.该方法首先将不同表征下的人脸表情特征利用复向量组合起来,构成复特征向量,然后利用具有不同权重的最大散度差鉴别分析方法进行进一步的复特征提取.在不同样本库、不同类型特征融合下的实验结果表明,该方法在优化投影轴和避免小样本问题的同时得到了满意的识别结果.  相似文献   

16.
以监控系统为研究背景,充分利用场景中视听媒体间存在的天然时空相关性,将视觉信息和听觉信息有效地融合从而实现对目标的快速跟踪.利用机器视觉相关理论提取视觉运动特征,利用计算听觉场景分析技术抽取音频场景特征,建立视听信息特征级融合模型并进行联合场景事件判断.仿真结果表明,应用视听信息融合对目标进行跟踪,预测误差小于单独基于视觉的目标跟踪,同时听觉信息的引入有助于克服图像噪声.  相似文献   

17.
垃圾邮件过滤中特征选择方法研究   总被引:2,自引:0,他引:2  
文章对垃圾邮件过滤中的特征选择问题进行了研究,引入词共现模型考虑词语之间的语义联系信息,和传统的信息增益特征选择方法结合表示邮件,采用神经网络方法对邮件进行分类得到垃圾邮件过滤器.实验表明,文章提出的将词共现对和信息增益结合的特征选择方法能够提高垃圾邮件过滤的精确度.  相似文献   

18.
基于视频多特征融合的列车车厢烟雾检测方法   总被引:1,自引:0,他引:1  
列车车厢中环境相对复杂且遮挡物较多,为了提高视频烟雾检测的准确性,剔除场景中疑似烟雾的干扰物,降低由于环境中光照变化导致的误检情况,提出了基于运动、颜色及衰减等多特征融合的烟雾检测算法.该算法能有效克服背景复杂、光照变化大,以及阴影问题带来的干扰.算法主要由3部分构成:烟雾运动检测、颜色特征分析提取和多特征融合.该算法通过背景建模方法分割出运动的区域,引入归一化RGB空间烟雾颜色基础模型及衰减模型,以剔除疑似烟雾区域的干扰,同时可以有效地降低光照影响.  相似文献   

19.
提出了图像特征塔集的概念,给出了一种基于特征塔集的融合方法.算法主要包含两部分,子图像的融合及对应残差图像的融合.图像的大部分能量和信息包含在子图像中,因此,在图像金字塔的子图像融合过程中,特征塔集的构造由局部能量和局部熵组成.考虑到残差金字塔包含了原始图像的边缘或高频成分,因此采用梯度作为其融合特征.最终的融合结果,可利用金字塔反变换获得.由于将残差金字塔也引入到融合算法的设计过程中,因此融合的精度得到一定的提高,另外,采取简单的金字塔可以有效地控制算法的复杂度.实验结果表明了算法的合理性和有效性.  相似文献   

20.
提出了基于多代理决策融合的电机状态识别系统.以电机的振动信号和电流信号为输入,六种分类器用来识别其状态.每个分类器视为一个代理,独立完成模式识别工作后,同其他分类器交换信息从而提高识别率.本文还将传感器融合和分类器选择融入系统,同单源数据和无分类器选择相比具有更大的优势,使最终电机状态识别率达到98.9%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号