首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文介绍了分类主题一体化词表——《中国分类主题词表》的结构与功能,结合我国图书馆界、信息界过去对文献标引的实际情况,探讨“两卷结合”使用该词表,完成分类与主题同步标引的可行方案。文章还介绍了主题标引工作程序和主题分面公式,可供文献标引工作人员参考。  相似文献   

2.
文本分类是指按照预先定义的主题类别,为文档集合中的每个文档确定一个类别,文本分类是文本挖掘的一个重要内容。本文分别介绍了文本分类技术和支持向量机的概念,并阐述了支持向量机(SVM)在文本分类中的应用及其发展趋势。  相似文献   

3.
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作. 但网页可以划分成不同的块,对分类 而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法.  相似文献   

4.
本文介绍了分类监管的具体含义,结合国际保险监管发展趋势和我国财产保险业发展特点阐述了实行分类监管的必要性。并结合我国财产保险业运行特点,通过考察美国财产保险企业破产原因,分析财产保险分公司经营的主要风险点,为确定我国财产保险分类监管的具体形式和指标体系提供科学依据。  相似文献   

5.
LDA可以实现大量数据集合中潜在主题的挖掘与文本信息的分类,模型假设,如果文档与某主题相关,那么文档中的所有单词都与该主题相关.然而,在面对实际环境中大规模的数据,这会导致主题范围的扩大,不能对主题单词的潜在语义进行准确定位,限制了模型的鲁棒性和有效性.本文针对LDA的这一弊端提出了新的文档主题分类算法gLDA,该模型通过增加主题类别分布参数确定主题的产生范围,提高分类的准确性.Reuters-21578数据集与复旦大学文本语料库中的数据结果证明,相对于传统的主题分类模型,该模型的分类效果得到了一定程度的提高.  相似文献   

6.
三种分类算法的实验比较   总被引:1,自引:0,他引:1  
对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究、实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析.  相似文献   

7.
阐述了单主题图书、多主题图书分类的基本原则,论述了丛书、多卷书的分类原则及具体做法,分析了产生同书异号的主要原因,并提出了解决问题的办法。  相似文献   

8.
当今世界菌物的多相分类将促使菌物分类趋向于自然,对菌物的形态分类、电镜技术分类、色谱分类、数值分类、化学分类与分子分类作了一简要概述。  相似文献   

9.
在ISO9223金属和合金-大气腐蚀性分类标准的基础上,针对我国大气环境的具体情况,提出了适合我国大气环境腐蚀性分类的技术指标,并对我国典型地区的大气环境的腐蚀性进行了分类,得到了既符合ISO分类原则又更适合我国实际情况的结果。  相似文献   

10.
介绍了分类词的定义和分类词库的结构,阐述了分类词库中的词生成的一般方法和分类词库的几种方法。  相似文献   

11.
本文研究的是电信行业中客户分类的问题,通过调研和开发实践,使用了统计分析和数据挖掘的技术,对电信客户分类主题进行了较为完善、深入的分析与研究。使用大量相关技术和统计方法,最终确定了逻辑回归模型作为电信客户分类的预测模型,为电信经营分析系统作了有益的尝试与探索。  相似文献   

12.
分类主题目录是指根据信息资源的内容属性(即主题)对其进行分类而形成的一整套目录体系,主要包括信息分类系统以及内容概述规范。分类体系能够根据政府信息的各方面(包括主题、生成机构、日期和体裁等)属性和特征,对公开信息进行标引和著录,达到对信息有效组织和管理的目的。主题角度进行的分类是其中最主要的信息分类方式。  相似文献   

13.
维特藓类植物分类系统评介   总被引:1,自引:0,他引:1  
本文对1982年发表的Vitt藓类植物分类系统及其所依据的基本原理进行了简要评论与介绍。有关藓类植物的分类原则,演化关系等在此也一并作了讨论。  相似文献   

14.
针对中文新闻主题因缺乏上下文信息而造成语义模糊和用词规范性不高的问题,提出一种基于RoBERTa-RCNN和多头注意力池化机制的新闻主题文本分类方法。利用数据增强技术对部分训练数据进行回译处理,再通过自编码预训练模型和RCNN对文本进行初步和深度的特征提取,并结合多头注意力思想改进最大池化层。该方法采用融合机制,改善了RCNN中最大池化策略单一和无法进行动态优化的缺陷。在三个新闻主题数据集上进行实验,使用更适用于新闻主题分类的Mish函数代替ReLU函数,并利用标签平滑来解决过拟合问题。结果表明,所提方法相比传统分类方法效果突出,并通过消融实验验证了模型在分类任务上的可行性。  相似文献   

15.
介绍了综合文摘类期刊的分类情况,分析了综合文摘类期刊的基本特点,结合读者的阅读习惯,提出了此类期刊较为适用的分类方法。  相似文献   

16.
介绍了图书分类的概念及意义,解释了图书分类的基本原则和种类,探讨了图书分类与编目的关系。  相似文献   

17.
简单介绍了SVM的理论背景,详细介绍了基于SVM的分类预测方法。给出了基于SVM的分类预测技术的性能测试结果。指出该分类预测技术可将实际问题通过非线性变换转换到高维的特征空间,在高维空间中构造线性辨别函数来实现原空间中非线性辨别函数。  相似文献   

18.
山西民居分类初探   总被引:2,自引:0,他引:2  
分析了民居常见分类方法及其局限性,介绍了山西自然气候条件及区域民情,提出了根据地理分布不同对山西民居进行分类的主张。  相似文献   

19.
葛忠军 《科技信息》2010,(24):I0279-I0279
地理信息是与人们生活、工作息息相关的真实世界的现象,它的分类对地理信息系统的信息共享、查询统计和空间分析都有着十分重要的意义,直接影响地理信息系统的经济效益和社会效益。本文归纳了地理信息的概念化方法以及在此基础上对信息分类,作为信息编码的基础。并介绍了结合地理信息对计算机存储和处理的要求等特点,提出的较新的基于本体的分类方法。  相似文献   

20.
针对基于词语特征的Email分类综合性能(F-score)较低的问题,提出一种基于主题特征的Email分类方法.该方法利用领域知识及统计信息,从Email的词语特征空间中提取主题特征,并利用提取出的主题特征实现Email分类.通过对1080封Email进行分类测试,结果表明,由于主题特征能够更加准确地表达Email的主题思想,因此,与基于词语特征的分类方法相比,该方法在针对Email的全文及标题实现分类时,将平均F-score分别提高了13.16%和17.16%,从而使平均F-score提高到72.37%,基本可以满足实际应用的需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号