排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
针对现有非平衡数据处理方法存在的局限性,提出一种考虑边界4稀疏样本的混合采样方法(considering boundary sparse samples-hybrid sampling,CBSS-HS)。通过计算每个样本的边界因子识别边界点,将样本空间划分为边界域和非边界域,对非边界域内的负类样本进行欠采样,而由于边界域上样本的稀疏性,对其上正类样本使用基于最大距离的合成少数类过采样技术(max distance-synthetic minority oversampling technique,MD-SMOTE)进行过采样,最大限度地保留正类样本的信息,最终达到2类样本基本平衡。将Recall,F1-value,G-mean和AUC(area under the curve)值作为评价指标,使用CBSS-HS+支持向量机(support vector machines,SVM)算法在5个不同平衡度的数据集上验证其有效性,并与其他4种组合模型的分类效果做对比。结果表明,提出的CBSS-HS算法在不同数据集上各个评价指标都有良好的表现,平均提高了4.6%。因此,该方法可以作为处理非平衡数据的一种有效手段。 相似文献
2.
李玉惠 《西安联合大学学报》2010,13(2)
幽默存在于人们日常生活中的每一个角落,有许多的哲学家,心理学家和语言学家都对幽默进行过研究。从语用学的角度出发,以Grice的合作原则为依据,通过对美国情景喜剧《Seinfeld》中的会话幽默进行分析,探讨幽默与合作原则的关系,即在实际交际中,人们可以通过违反合作原则而使谈话产生幽默效果。 相似文献
1