首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 187 毫秒
1.
基于模糊聚类的网络论坛热点话题挖掘   总被引:3,自引:0,他引:3  
为解决单个帖子线索的多话题性问题,识别聚类中的孤立点,提出一种基于模糊聚类的网络论坛(BBS)热点话题挖掘算法.采用模糊聚类进行话题识别,使得一个帖子线索可以隶属于多个话题,而对于隶属度远小于类内平均隶属度的帖子线索,则当作孤立点来处理.此外,还给出了一种面向BBS文本的特征表示方法,并结合隶属度给出基于模糊划分的话题热度评分公式.实验结果验证了该算法的有效性.  相似文献   

2.
社交网络中的用户领导者挖掘是用户影响力分析的重要问题.提出一种基于用户影响力评估的社交网络用户领导者挖掘算法.首先,描述问题模型以及模型相关定义;其次,提出了基于用户影响力和用户活跃度计算的用户领导力评估方法;最后,依据用户领导力和用户中心度计算实现用户领导者的挖掘.实验印证了该方法对于社交网络挖掘用户领导者的可行性和有效性.  相似文献   

3.
信息获取已成为药商经营活动的重要组成部分和市场判断依据,网络大量非结构化、半结构化信息的出现为药商个性化服务提供了技术空间和实证依据.文章通过对个性化服务中文本挖掘的关键技术进行设计,并应用了中药材信息网站文本挖掘流程,把文本挖掘技术应用于中药材信息网站的用户兴趣获取实例中,实现用户兴趣的自动获取功能.  相似文献   

4.
通过主题模型与语义网络对旅游电商中的评论文本进行挖掘,从而引导消费者与商家对评论信息作出重要决策;提出一种基于LDA(Latent Dirichlet Allocation,LDA)主题聚类与语义网络模型(LDA topic clustering and semantic network model,LTC-SNM)的方法对酒店在线评论文本进行研究;获取在线评论文本进行数据预处理,使用Word2vec生成词向量,利用机器学习算法对评论文本进行情感分类;通过LDA主题模型对分类后的文本进行聚类,生成酒店的特征主题词;通过ROSTCM将特征主题词与所修饰的情感词生成语义网络,缓解了挖掘文本信息的复杂性;实验结果表明:提出的LTC-SNM文本挖掘方法使得在线用户评价的主题更具表达性。  相似文献   

5.
网络信息挖掘系统IDGS的实现   总被引:3,自引:0,他引:3  
网络信息挖掘是网络信息处理领域中的一项新课题。介绍一个基于WWW的信息挖掘系统IDGS的设计与实现,并讨论了基于统计的文本信息特征提取技术和BP神经网络模型在网络信息挖掘中的应用,及在WWW上进行信息挖掘所需采用的方法和策略。  相似文献   

6.
以安徽城市管理职业学院的网络用户为例,通过校园网管理平台获取的大量网络用户行为数据,采用K-means算法建立用户行为数据挖掘模型,挖掘得出聚类结果,然后基于分析结果,对校园网的管理平台进行新的配置,使校园网运行更加合理,从而提供更加快捷平衡的网络服务。  相似文献   

7.
结合复杂网络理论,首先利用获取的真实BBS论坛数据信息构建有向BBS用户回复网络,并分析日增节点数、日增边数、新用户发表原帖数、新用户获得回帖数、节点择优选择概率等的演化规律.其次,提出新的网络构造模型,并进行数据仿真.仿真结果表明,仿真网络的网络结构熵、度分布的演化规律与真实网络基本吻合,在一定程度上能够证明研究方法的正确性,也能解释真实BBS网络的演化规律,具有一定的现实意义.  相似文献   

8.
Web文本分类是Web文本挖掘的一项重要技术,它是一种基于主题分类的指导,能够使用户在快速地找到想要的资源和知识。文本分类过程中,首先采用向量空间模型对Web文本进行特征提取,然后将得到的数据集分成样本数据集和测试数据集,将样本数据集输入BP神经元网络进行分类,网络经过训练后,输入测试数据集进行验证。实验结果证明BP神经元网络在文本分类领域有着较好的实用价值。  相似文献   

9.
文本挖掘综述   总被引:1,自引:0,他引:1  
杨霞  黄陈英 《科技信息》2009,(33):82-82,99
文本挖掘是对一个非结构化文本信息进行分析从而获取用户关心或感兴趣,有潜在实用价值知识的过程。本文首先介绍了文本挖掘的定义和研究现状,之后文本挖掘一般处理过程,着力于文本分类和文本聚类的一般过程,最后展望了今后的研究目标。  相似文献   

10.
基于多特征融合的聊天室社会网络挖掘方法   总被引:2,自引:0,他引:2  
聊天室社会网络挖掘是网络舆情分析与预警研究的一个主要任务,其目的是挖掘出聊天室用户之间的本质关联.为此将多特征融合引入聊天室社会网络的挖掘,提出了一种基于AdaBoost的聊天室社会网络挖掘方法.论文的主要工作包括两部分:对目前相对有效的基于时序挖掘的方法进行了改进,新增加了启发式规则;利用AdaBoost进行时序特征和内容相关性特征的多特征融合,综合决策出聊天室用户之间的本质关联.对比实验表明,基于多特征融合的方法可以获得比基于时序挖掘方法及其改进方法更好的误报率和漏报率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号