首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 265 毫秒
1.
为提高计算机对古典诗歌自动分类的准确性,提出一种基于特征项聚合的分类方法.首先从文本中提取特征项并用向量表示,向量的每一分量表示该特征项在不同类别中的比重;然后通过聚类算法把相似的特征项聚合为一组,从而形成特征项聚合的诗歌模型;最后利用分类器对诗歌进行分类.《全唐诗》语料库的实验结果表明,利用该模型及算法可明显提高诗歌分类的准确率.  相似文献   

2.
通过推导H-SVMs推广能力的模型,得出H-SVMs的推广能力与样本类别数、空间分布、容量、树结构等有关,且保证高优先级结点的推广性能是提高H-SVMs性能的有效途径。根据分析结果,提出了一种基于SVM最大间隔分类、最小间隔聚类构造H-SVMs的新方法。利用SVM的分类间隔作为分类、聚类指标,通过Top-down和Bottom-up两种途径混合构造H-SVMs,其中,最大间隔分类采用Top-down策略,在各结点依次选择最大间隔的SVM,将输入样本按类别分为2类;最小间隔聚类采用Bottom-up策略,在各结点依次选择最小间隔的SVM,将输入样本按类别两两聚类。从UCI数据库中选取多类数据进行测试,实验结果验证了该方法的有效性,说明所构造的H-SVMs具有较好的、稳定的推广性能。  相似文献   

3.
提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段待分类文本特别是中文文本的分词,模糊了词的多义问题,且在文本分类的实验中能够达到86%以上的查全率和查准率;随着语料库的不断训练和调整,分类性能还可以进一步提高,具有简单实现的特点.  相似文献   

4.
针对传统重采样方法大多使用固定采样策略,无法根据模型的优化需求改变采样策略的问题,提出一种基于自适应采样的不平衡分类方法(ASIC)。该方法根据分类模型在验证集上的表现动态调整训练集上不同类别样本的采样概率,使不同类别的采样概率由当前分类模型的需求动态决定;同时,该方法对少数类给予额外的关注,在其余条件相同的情况下为少数类赋予更大的采样概率,以弥补少数类本身样本数量不足对分类模型造成的不良影响,从而提高分类模型对少数类的识别能力。实验结果表明,使用ASIC方法训练的分类模型的平均类准确率和召回率的几何平均值均比对比方法更好,且数据分布越不平衡,ASIC方法的优势越明显。  相似文献   

5.
为了提高稀疏表示分类算法对属于同一方向不同类别样本的分类准确率,提出了一种基于Volterra核优化的稀疏表示分类算法.该算法首先将原始的人脸图像分成不重叠的小块,并利用Volterra核映射到高维空间.在训练阶段遵循费舍尔标准,根据最大化类间距离和最小化类内距离来定义目标函数,从而获得优化Volterra核.与其他方...  相似文献   

6.
在实时文本分类任务中经常会有新类别出现,传统的文本分类方法通常难以利用实时的小规模样本学习新类别的模型。提出了一种基于迁移学习的新类别模型训练方法。首先将迁移学习技术和LS -SVM 算法结合,设计正则化项以控制源模型的迁移量及新模型与源模型的相似度,达到增量迁移。其次具体讨论了正则化项的学习方法。实验结果显示该方法相对同类算法有更好的分类性能,可以更高效地完成各种实时文本分类任务。  相似文献   

7.
针对当前电力文本分类方法中因忽视类别标签之间潜在语义关联关系而导致分类性能低效的问题,提出一种基于层次化分类模型的电力文本分类方法.首先,利用采集的电力成果非结构化文档,采用自动化信息提取技术和标注技术,构建电力文本多标签分类训练集,并结合领域知识分析,构建类别标签之间的层次化关系.然后,提出基于类别结构和标签语义混合...  相似文献   

8.
中文新闻信息分类的类别数量大,难以一次性获取均衡的分类性能。针对这一问题,提出了一种基于差错网络的文本分类反馈校正方法。首先对文本进行一次分类,^根据分类结果生成有向差错网络,得到标注类别与真实类别的候选映射规则。然后计算差错网络的类别关联度参数,再对候选映射规则进行筛选,得到标注类别与真实类别的映射规则。最后根据映射规则进行二次分类,实现分类反馈校正。实验表明,差错网络清晰地反映了类 别的相关度。通过映射关系进行反馈校正,比普通文本分类的F值提高了6.2%。在NLP&CC2014评测中,基于差错网络的方法平均正确率达到73% ,证明了该方法的有效性。  相似文献   

9.
针对云分类问题提出一种新的云团分类方法.该方法先利用风云二号静止气象卫星实时云图图像资料建立多种云和地表类型的样本库,提取分析已知样本的光谱特征和纹理特征;再使用中值滤波器对云图进行预处理,并采用具有噪声的基于密度的聚类算法对云区聚类;最后对聚类得到的云团光谱特征和纹理特征进行匹配,确定云团所属的云类别.实验结果表明,该方法以云团为单位进行划分,易实现云团分类自动化.  相似文献   

10.
庞雅丽 《科技信息》2008,(15):19-19
本文给出了一种基于目标迁移学习的文本分类方法,用于解决在分类目标发生变化时的训练集重复标注和分类模型重复训练的问题。该方法通过引入一个中间类别体系层作为桥接,首先在中间层类别和目标类别之间建立映射关系,分类时将文本分到中间层类别上,然后根据中间层和目标层的映射来确定目标类别。  相似文献   

11.
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.  相似文献   

12.
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.  相似文献   

13.
采集142份主题句作业自然语言语料数据,利用中文自然语言处理平台构造自然语言的词性序列;经过语言结构粗粒化处理,建构由名词、动词、形容词和代词等4种实词构成的词性序列分类模型.研究结果显示,基于词性含量的自然语言词性序列分类模型的准确率达到90%;基于词序位置的自然语言词性序列的分类模型的准确率达到了95%.研究结论表明,自然语言的词性序列分类模型在语言认知领域具有较好的应用价值,不仅可以揭示和证实语言与心理信息之间存在的相关关系,而且可以通过客观的语言符号对内隐的心理信息做出科学的评估.  相似文献   

14.
基于LSTM的中文文本分类方法能够正确地识别文本所属类别,但是其主要关注于学习与主题相关的文本片段,往往缺乏利用词语其他方面的信息,特别是词性之间的隐含的特征信息。为了有效地利用词语的词性信息以便学习大量的上下文依赖特征信息并提升文本分类效果,提出了一种结合词性信息的中文文本分类方法,其能够方便地从词语及其词性中学习隐式特征信息。利用开源数据并设计一系列对比实验用于验证方法的有效性。实验结果表明,结合词性信息的基于注意力机制的双向LSTM模型,在中文文本分类方面的分类效果优于常见的一些算法。因此识别文本的类别不仅与词语语义信息高度相关,而且与词语的词性信息有很大关系。  相似文献   

15.
李忠  杨百一  李莹  李晓丽 《科学技术与工程》2021,21(35):15284-15289
针对灾害求助信息辨识不准确、响应能力不足的问题,本文提出了基于ALBERT和双向GRU的文本多标签分类模型。首先利用ALBERT预处理语言模型对文本信息进行编码,获取文本的动态词特征向量,并送入双向GRU神经网络进行训练,根据不同的单词赋予不同的权重,应用Attention机制进行解码。利用模拟退火算法求解最优阈值,以微平均值作为评价函数,确定样本的标签类别归属。与逻辑回归、朴素贝叶斯和LSTM长短期记忆神经网络等模型进行比较,结果显示,多标签分类模型具有更高的准确率,达到95%,汉明损失仅到0.05,能够更好地辨别灾情求助信息,提高救援效率。  相似文献   

16.
杨蕊  赵颖博  杨婷 《科学技术与工程》2023,23(19):8236-8242
雷达组网协同探测中,受不同探测精度、观测维度及环境噪声影响,信息系统获取的传感数据包含一定不精确、不确定信息,导致无法对目标点迹准确分类识别。为此提出了一种基于置信函数的分类器自优化雷达点迹识别算法。首先,基于置信函数理论创建目标、杂波、不确定数据的证据识别框架,并设计可实时给定目标数据类别隶属度的深度神经网络模型分类器。然后,依托当前迭代轮次分类结果进行辅助决策证据构建,并根据点迹分布特性进行证据修正融合。最后,基于全局融合结果进行点迹类别标签更新,并重新驱动网络模型分类器进行在线学习与更新,如此迭代循环直至所有的雷达点迹数据类别标签不再发生改变。基于雷达实测数据集对算法性能进行验证分析,结果表明与传统算法相比新算法能够有效提升雷达点迹的分类正确率,而且随着样本数据的丰富算法收敛时间可急速减少,便于在后续工程中推广应用。  相似文献   

17.
现有的电商垃圾评价检测方法大多基于对评价文本信息进行分析,难以有效检测带有图片的多模态垃圾评价,为充分利用评价的图片和文本内容,提出了基于Transformer双向编码表示(bidirectional encoder representa-tions from transformer,BERT)和宽残差网络(wide residual networks,WRN)的图文融合决策检测方法.该方法利用评价文本对经过预训练的BERT模型进行微调训练,经过表示学习分类得到文本评价类别向量,使用宽残差网络对评价图片进行特征提取和分类并输出图片类别向量,将得到的对应评价图文类别向量共同输入启发式决策融合分类器,对多模态评价整体进行预测分类.使用真实电商评价数据集进行实验表明,相比面向评价文本的分类方法,图文融合决策检测方法对多模态评价分类的精准率提高4.44%,召回率提高2.12%,Micro-F1提高3.67%,结果证实该方法能够对多模态垃圾评价进行有效检测.  相似文献   

18.
为提升变电站巡检机器人的导航避障能力,将深度学习技术应用于变电站场景识别中,提出了一种基于深度卷积神经网络的避障方法.该方法联合图像分类和语义分割两个分支来共同辅助机器人导航避障,分类分支通过获取图像全局信息,保证机器人正确行驶方向;而语义分割支路则根据图像局部信息以及机器人前方目标类别,指导机器人准确避障.实验结果表明,避障方法可以高效地对图像进行分类和分割,同时,在实际变电站环境中,该方法也能为巡检机器人提供有效的避障信息,实现实时自主避障.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号