排序方式: 共有2条查询结果,搜索用时 31 毫秒
1
1.
中文微博具有更新快、时效性强等特点,产生的热点话题均具有一定的突发性,与此同时文本中有代表性的特征词也会随之激增。利用这一特性,在传统的TF-IDF(term frequency-inverse document frequency)基础上提出一种改进的特征权重算法,称之为TF-IDF-KE(term frequency-inverse document frequency-kinetic energy),用以解决突发性热点话题在聚类时特征不明显的问题。该算法结合物体的动能原理,将特征项的突发值用动能的概念进行描述,加入权值计算,提高突发性特征项的权重,最后使用CURE(clustering using representatives)算法,实现微博的话题检测。该方法描述了文本和特征项所具有的动态属性,实验结果表明,该方法能够有效地提高话题检测的效果。 相似文献
2.
应用脱氧核糖核苷酸末端转移酶 (TDT)在cDNA 5′末端加同聚物尾的方法 ,通过延长加尾时间、改变加尾步骤 ,大大加强了加尾效率 ,使得在cDNA末端快速扩增技术 (RACE)中应用TDT加尾法进一步获得mRNA的 5′端成为一种行之有效的方法 . 相似文献
1