排序方式: 共有72条查询结果,搜索用时 0 毫秒
71.
目的自动从新浪微博中抓取含指定关键词的相关微博,通过对抓取的微博进行分析,得到相关舆情热点。方法首先通过多线程爬虫,自动爬取含有指定关键字的微博,将其保存于数据库中,再采用基于字符串匹配的逆向最大匹配法对微博进行分词,计算各分词项的TF-IDF权重作为文本聚类的输入数据,最后用k-means算法进行聚类分析,得出舆情热点。结果与结论这种方法能自动从新浪微博中抓取含指定关键词的相关微博,通过聚类分析,每一族的微博内容具有较高的一致性和共同的主题,由此可迅速找出热点舆情,对及时了解和引导舆情具有积极的意义。 相似文献
72.
P2P网络由于缺乏统一的国际标准和固定的网络拓扑模型,一直都处在混乱的无标准状态.以Chord系统为例,结合无结构P2P系统中的缓存技术,将其引入到结构化的系统中,其应用为路径缓存,把数据缓存到查询路径上,以提高定位速度和数据获取速度. 相似文献