期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王潇胡鑫《石河子大学学报(自然科学版)》2005,23(6):769-771

介绍了一种基于贝叶斯定理的文本分类模型“树桩网络（stump network）”。将该方法与朴素贝叶斯文本分类器和TAN（tree augmented naive bayes）文本分类器进行实验比较。结果表明,在大多数数据集上该文本分类方法具有较好的分类正确率。相似文献

2.

文本分类技术研究

台德艺谢飞胡学钢《合肥学院学报(自然科学版)》2007,17(3):61-64

通过介绍文本分类的过程及其关键技术,讨论了文本表示、分类算法、分类器性能评价原理和方法;最后,指出了当前文本分类过程中存在的问题,并对今后的发展进行了展望. 相似文献

3.

改进的TAN构造算法及其文本分类

石洪波黄厚宽景丽萍《太原师范学院学报(自然科学版)》2002,1(1):20-26

朴素贝叶斯分类器是当前流行的一种文本分类算法，但是它的属性独立性假设使其无法表达文本词语之间的依赖关系，TAN(Tree Augmented NaIeve Bayes)在许多情况下优于朴素贝叶斯分类器。然而，由于学习TAN所需的空间是数据属性个数的二次项级，限制了TAN对高维数据(如：文本数据)的分类，本文介绍了TAN模型及其一般的构造算法，提出一种新的TAN构造算法ITAN，该算法的空间复杂度是数据属性个数的线性级，最后将该算法用于文本分类，实验比较了朴素贝叶斯分类器和TAN分类器，实验结果表明：该方法具有较好的分类性能。相似文献

4.

中文文本的特征抽取和分类算法

《科技信息》2007,(28)

文本分类是根据文本内容自动确定文本类型的过程。介绍现有特征抽取和分类算法,提出用模糊聚类算法FCM确定文本类标签,Boosting算法构造分类器的方法,使文本分类具有更好的分类精度和时效性,以及对未知类标签语料库中文本的自适应性。相似文献

5.

基于结果修剪法解决文本分类中属性重叠问题

李敏沈翔邵栋高阳《扬州大学学报(自然科学版)》2006,9(3):63-66

在文本分类中,当两个多属性类别发生属性重叠时,采用传统的文本分类算法m acro F1值仅为45%左右.为了提高文本分类算法的m acro F1值,提出了基于结果修剪的方法.在该方法中,分类器由多个子分类器组成.每个子分类器对应于类别中的一个属性;在每一个阶段中,每一个子分类器将不属于该属性的文本剔出.当所有子分类器运行结束后,留下的文本即属于该分类的文本.实验数据表明,基于结果修剪的文本分类方法在解决属性重叠问题时能够将m acro F1值提高到65%左右. 相似文献

6.

基于两步策略的文本分类方法实验研究

何泉昊樊兴华周鹏《广西师范大学学报(自然科学版)》2011,29(4):35-38

已知朴素贝叶斯分类器使用两步策略的分类方法提高了两类中文文本分类的效率,本文在此基础上,研究3个问题:①可以使用两步策略分类方法的分类器须满足的条件;②3种理论上可用两步策略进行文本分类的分类器;③实验比较Rocchio、朴素贝叶斯、KNN 3种分类器两两组合后应用于多类英语文本分类的效果.实验结果表明:Rocchio... 相似文献

7.

一种基于TAN的文本分类方法 总被引：1，自引：3，他引：1

石洪波王志海黄厚宽《广西师范大学学报(自然科学版)》2003,21(1):81-85

提出了一种基于TAN模型的文本分类方法，朴素贝叶斯分类器是当前流行的一种文本分类算法，但是它的属性独立性假设使其无法表达文本词语之间的依赖关系，TAN（Tree Augmented Naive Bayes）是综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力，其分类性能可与当前流行的一些分类器相竞争，介绍了TAN模型，将其引入到文本分类中，并用实验比较了朴素贝叶斯和TAN，实验结果表明：该方法具有较好的分类性能。相似文献

8.

基于信息融合算法的暴力视频内容识别

谷学汇《济南大学学报(自然科学版)》2019,(3)

针对暴力视频的检测方法均是单一模态的且效率相对较低等问题,提出文本、视频以及音频3种模态的信息融合算法,构建网络暴力视频识别系统,设计文本以及视音频分类器;将文本分类器当做预分类器完成视频的分类操作,从而获得候选暴力影视,随之运用视音频分类器完成对其的进一步分类;开展实验分析,并与单一模态的分类算法进行对比。结果表明,该信息融合算法显著提升了识别精度,缩减了计算量,改善了分类效果。相似文献

9.

基于概念语义相关性和LDA的文本标记算法

周春蒋运承《华南师范大学学报(自然科学版)》2018,50(4):121-128

为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记. 该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表示,通过计算文本主题从属于各分类目录的期望从而实现文本自动标记. 为验证TML算法的效果,在标准文本分类数据集上使用文本分类器进行有监督文本分类实验. 为对比数据集和分类器对分类效果的影响,在3个数据集（WebKB、Reuters-21578、20-NewsGroup）上分别使用3种不同的分类器（Rocchio、KNN、SVM）进行实验. 实验结果表明:TML算法有效地提高了文本分类效率及文本标记效率. 相似文献

10.

基于人工免疫系统的网络文本分类研究

张伟刚谭建豪《科学技术与工程》2006,6(22):3621-3623

在简单介绍自然免疫系统功能和特性的基础上,依据生物免疫系统免疫记忆特性,提出一种人工免疫网络记忆分类器。实验证明,该分类器能够快速准确地对文本进行分类。相似文献