期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

蔡金凤白清源《南京大学学报(自然科学版)》2011,(5):544-550

针对在关联规则分类算法的构造分类器阶段中只考虑特征词是否存在,忽略了文本特征权重的问题,基于关联规则的文本分类方法（ARC-BC）的基础上提出一种可以提高关联文本分类准确率的ISARC（ItemSet Significance-based ARC）算法.该算法利用特征项权重定义了k-项集重要度,通过挖掘重要项集来产生关... 相似文献

2.

基于词向量空间模型的中文文本分类方法 总被引：4，自引：0，他引：4

胡学钢董学春谢飞《合肥工业大学学报(自然科学版)》2007,30(10)

大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。相似文献

3.

提取有效规则的关联分类算法

武建华沈钧毅方加沛《西安交通大学学报》2009,43(4)

针对关联分类算法产生的规则普遍存在分类器分类精度、效率低的问题,提出了一种提取有效规则的关联分类算法--ACDER算法.首先定义了剩余支持度和剩余置信度,然后通过计算规则剩余支持度和剩余置信度建立了分类器并进行剪枝,以达成对分类尽量少且最有效的规则构成分类器,确保分类器中不存在任何冗余规则和冲突规则.在8个数据集上的测试结果表明,所提算法的平均分类精度比关联规则算法提高了4.15%,而在所有数据源分类器上的规则数却减少了54%. 相似文献

4.

基于特征项聚合的古典诗歌分类模型

黄永锋李奇《东华大学学报(自然科学版)》2014,40(5):599-604

为提高计算机对古典诗歌自动分类的准确性,提出一种基于特征项聚合的分类方法.首先从文本中提取特征项并用向量表示,向量的每一分量表示该特征项在不同类别中的比重;然后通过聚类算法把相似的特征项聚合为一组,从而形成特征项聚合的诗歌模型;最后利用分类器对诗歌进行分类.《全唐诗》语料库的实验结果表明,利用该模型及算法可明显提高诗歌分类的准确率. 相似文献

5.

一种基于贝叶斯方法的多分类器组合优化算法

裴亚辉张兵利《河南科技大学学报(自然科学版)》2010,31(1):34-37

提出了一种基于贝叶斯方法的多分类器组合优化算法和阈值改进方法。首先,计算分类器对各个类别的置信度。然后,以各分类器的置信度为先验概率,采用向量求和将各分类器的先验概率向量进行组合,得出最终输出向量,最后通过优化阈值提高综合分类器识别精度。在此后的实验数据表明:该算法具有方法简单、运算速度快、分类精度高等优点。相似文献

6.

基于特征词匹配的政策文本分类算法研究与实现

王丽鹏张鹏云和志强《河北省科学院学报》2017,34(3):1-6

在基于特征词遍历匹配的文本分类算法中,字符串匹配算法的选取及相似度阈值控制对文本分类结果起着决定性的作用。针对三种常用的字符串匹配算法做了分析及对比实验,选取了最适合政策文本分类的一种字符串匹配算法。并通过研究政策文本具有的特征提出了一种基于特征词加权的相似度阈值计算方法,经实验证明相似度阈值符合分类要求。相似文献

7.

云计算环境下分布式语义文本自适应分类方法研究

王刚《科学技术与工程》2018,18(7)

传统分布式语义文本分类方法难以高效地在云计算环境下实现文本快速准确分类,为此,提出一种新的云计算环境下分布式语义文本自适应分类方法。通过期望交叉熵对分布式语义文本特征进行选择,针对任意类别中的词,按照权重值从大到小的顺序对其进行排列,将排在前面的若干词看作特征词,针对分布式语义文本集中的所有类别进行同样的操作,将获取的所有类别特征词结合在一起,建立特征词典。针对主题引入加权策略,通过权重值对不同主题针对不同类别的判断能力进行描述,以获取最佳主题,给出新文本特征产生过程。依据提取的分布式语义文本特征,通过朴素贝叶斯分类器实现分布式语义文本的自适应分类。实验结果表明,所提方法分类精度和效率高。相似文献

8.

基于词条聚合和决策树的文本分类方法

王煜张明马力《河北大学学报(自然科学版)》2005,25(3):338-342

根据词条聚合和决策树原理,提出了一种文本分类的新方法.决策树分类方法具有出色的数据分析效率和容易抽取易于理解的分类规则等优势,但只能应用于维数较低的特征空间.本方法将与各个类别相关程度相似的词条聚合为一个特征,有效地降低了向量空间的维数,然后再使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取分类规则的优势. 相似文献

9.

基于多分类器的牌照字符识别算法

侯海滨沈希忠孙林《华东理工大学学报(自然科学版)》2010,36(2)

通过对牌照特征及已有识别算法进行分析,提出了基于多分类器-模板匹配与支持向量机相结合的牌照字符识别算法。首先利用模板匹配进行粗分类,将多类问题转化成两类问题,再利用支持向量机进行精确分类。在模板匹配环节,使用灰度分布标准化,增加字符与模板的相似度。在Virtual Studio环境下进行测试,结果表明:与单一分类器相比较,该方法的识别精度与识别速度都有了很大的提高。相似文献

10.

一种基于类别核心词的概念映射方法 总被引：1，自引：0，他引：1

苑俊英袁方刘博《广西师范大学学报(自然科学版)》2007,25(2):140-144

由于同义词和多义词的存在,使得基于特征词的文本分类方法分类精度不高.近几年,基于概念的文本分类方法得到人们的重视.在此提出一种基于类别核心词的概念映射方法,首先从文本中抽取类别核心词,借助<知网>将特征词映射到基于类别核心词的概念空间,然后在概念空间上完成文本分类工作.实验结果表明,基于类别核心词的概念映射方法及相应的基于概念的文本分类能够有效提高文本分类的精度. 相似文献