排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
对近邻传播聚类算法进行了详细的研究。提出用波动率来衡量数据震荡的剧烈程度,分析了收敛迭代次数和最大迭代次数两个参数的合适设置;重点研究了倾向度和阻尼因子两个参数与聚类数、波动率的关系,研究发现通过增大倾向度和阻尼因子都能减少波动率。 相似文献
2.
3.
4.
基于微博表情符号,提出一种自动构建情感词典的方法。 从微博平台抓取大量带有表情符号的微博文本,并依据表情符号对微博文本进行情感倾向标注,生成情感语料库。 对语料库进行分词、去重等预处理工作,根据词性规则抽取微博文本中情感词,统计每个情感词在正向和负向语料库中出现的次数,计算情感词的卡方统计值获得情感强度,根据情感词在正负微博文本中出现的概率判定情感词的倾向性,进而生成情感词典。 这是一种全新的思路。 以人工标注的情感词典为基准数据,实验结果表明,本文方法标注情感词的准确率在80%左右,在情绪词强度阈值θ为20、30时,生成情感词典综合F值最好,达到了82%以上。 相似文献
1