排序方式: 共有2条查询结果,搜索用时 0 毫秒
1
1.
龚笔宏 《广西师范大学学报(自然科学版)》2007,25(2):115-118
分类算法的现有评价指标存在一些问题,主要是评测数值在不同的数据集上呈现剧烈波动。为解决这一问题,通过考察数据集对分类结果的影响,提出了一种对分类算法的新评测指标new-macro-F1。这一新评测指标将数据集的因素从评测过程中独立了出来,使得new-macro-F1表示的仅仅是分类算法本身。实验结果表明使用新评测指标,同一分类器在不同数据集上的表现波动较小;通过分类器在一个数据集上的表现,可以近似的估计该分类器在另一数据集上的分类质量。 相似文献
2.
龚笔宏 《清华大学学报(自然科学版)》2005,45(9):1806-1809
搜索引擎返回结果的摘要的特点在于文档长度短,大部分关键字最多只出现一次,因此传统文档比较方法所使用的TF-IDF、夹角余弦等方法对摘要比较失去了作用.为了改进传统文档比较方法,该文利用分类技术对短摘要信息进行扩充,以改进摘要比较.将两个摘要分别与参照物进行比较,在较大的一个文档集合中找到与摘要相近的文档集合.用这些文档集合扩充短摘要的含义,以替代短摘要来衡量摘要相似度.实验结果表明,使用改进后的摘要比较算法,相关集合的DCG指标有了明显改进. 相似文献
1