首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 74 毫秒
1.
罗宇化 《广东科技》1998,(A04):55-58
本文介绍了分类主题一体化词表--《中国分类主题词表》的结构与功能,结合我国图书馆界、信息界过去对文献标引的实际情况,探讨“两卷结合”使用该词表,完成分类与主题同步标引的可行方案。文章还介绍了主题标引工作程序和主题分面公式,可供文献标引工作人员参考。  相似文献   

2.
叙词标引中切题性的思考与处理   总被引:1,自引:0,他引:1  
叙词法是以经规范化处理后的叙词作为文献标引识的一种文献处理方法。七十年代以后,随着各专业叙词表的问世,以及计算机在文献存储、检索系统的应用,叙词法作为文献标引的一种方法已愈来愈广泛的得到推广和应用。叙词法和分类法不同,叙词法不是从文献资料内容的学科性质着眼,而是以规范化词语为基础,运用叙词以及相关语的语义关系来表达文献资料的主题内容。因此,叙词法在揭示文献资料内容方面比现行分类法更为先进。又由于叙词法是通过叙词组配实现文献标引,因此,  相似文献   

3.
本论述采用藏语三级切分体系对藏文文本进行分词和词性标注,并借助手工建立的藏文情感分析用词表,与已有的特征选择方法相结合提取情感特征,用相似度分类算法进行藏文文本的情感分类,达到了较好的分类效果.  相似文献   

4.
阐述了文献标引的内涵,论述了文献标引的作用、意义以及文献主题分析在文献标引工作中的重要性,着重对文献标引在手工检索系统和计算机检索系统中的应用进行了比较。  相似文献   

5.
也谈分类主题一体化   总被引:1,自引:0,他引:1  
分类法和主题法是情报检索语言的两种方法,这两种方法各有所长,各有所短,为此,国内外图书情报界经过长期研究探索,认为充分发挥分类法与主题法的优点,使之结合起来,扬长避短,融为一体,实现分类主题一体化,是情报检索语言的发展方向。所谓分类主题一体化是指分类...  相似文献   

6.
LDA可以实现大量数据集合中潜在主题的挖掘与文本信息的分类,模型假设,如果文档与某主题相关,那么文档中的所有单词都与该主题相关.然而,在面对实际环境中大规模的数据,这会导致主题范围的扩大,不能对主题单词的潜在语义进行准确定位,限制了模型的鲁棒性和有效性.本文针对LDA的这一弊端提出了新的文档主题分类算法gLDA,该模型通过增加主题类别分布参数确定主题的产生范围,提高分类的准确性.Reuters-21578数据集与复旦大学文本语料库中的数据结果证明,相对于传统的主题分类模型,该模型的分类效果得到了一定程度的提高.  相似文献   

7.
为了全面了解Taxonomy的发展现状,从TaxonomyWarehouse中抽取了119个英文分类词表,从主题范围、编制语种、应用形式、应用范畴等方面分析了其构建现状及应用特点。  相似文献   

8.
使用JST模型对中文新闻文本进行情感分析,相对于评论文本,新闻文本主观性比较弱,而且大多是长文本,会影响JST模型的分类性能.给出一种抽取情感主题句的方法,将抽取得到的情感主题句结合现有的JST模型对新闻文本的情感倾向进行了分析.实验表明,使用情感主题句进行情感分析,避免了与主题情感无关的句子对分析结果的影响,提高了分类准确率.  相似文献   

9.
依据CALIS联合目录提出的文献标引宗旨和方式,对西文文献书目数据主题标引中的标目顺序、检索点设置、复分顺序和相关主题概念、各类文献主题标引规则等进行了探讨,并结合实例加以分析。  相似文献   

10.
本文根据高校资料室文献标引存在的问题,提出资料室文献标引规范措施,特别是针对工具书的不同类型特征,分别探讨了对它们进行分类标引的不同方法。以求迅速、准确、方便、多途径地为读者提供文献检索和参考咨询服务。  相似文献   

11.
文本分类是指按照预先定义的主题类别,为文档集合中的每个文档确定一个类别,文本分类是文本挖掘的一个重要内容。本文分别介绍了文本分类技术和支持向量机的概念,并阐述了支持向量机(SVM)在文本分类中的应用及其发展趋势。  相似文献   

12.
从微博的内容属性和社交网络的信息传播规律特征出发,将微博文本与用户关注关系结合作为用户兴趣分类的标准,从而使提取的用户兴趣的更加准确、有效。借助建立的用户兴趣分类模型解决用户兴趣分类问题,选取新浪微博作为研究对象,应用LDA算法进行主题提取,应用LibSVM算法进行分类。实验证明,该方法分类时增加了对用户信息的全面性应用,而且与其他方法相比有更高的分类准确率。  相似文献   

13.
由于网页中存在着许多“噪声”信息,所以相对于传统的纯文本分类来说,中文主题网页分类是一项更为困难的工作. 但网页可以划分成不同的块,对分类 而言每个块的重要度是不同的,可以利用分块的重要度提高网页分类的质量.介绍了几种流行的网页分块技术,并通过实验验证了基于分块重要度的主题网页分类法的分类质量优于传统的主题网页分类法.  相似文献   

14.
针对消费者网上购物时选择商品的用户体验不足等问题,设计了产品评论情感倾向性分类系统。系统首先对评论进行了分词,然后根据停用词表去停用词,分别采用CHI、IG进行特征选择,最后比较了使用不同的特征选择算法对文本情感分类结果产生的影响。系统采用了Java Web相关技术实现了可视化,并对产品评论的分类过程进行了展示。实验结果表明,有效的特征选择方法有助于提升推荐系统的性能。  相似文献   

15.
阐述了单主题图书、多主题图书分类的基本原则,论述了丛书、多卷书的分类原则及具体做法,分析了产生同书异号的主要原因,并提出了解决问题的办法。  相似文献   

16.
提出一种结合LDA及语义相似度的商品评论情感分类方法。该方法首先使用LDA对商品语料库建模,获取文档-主题矩阵;人工选择k对褒义词、贬义词,基于HowNet语义相似度计算主题(评价对象+观点内容)与各个褒义词和贬义词的相似度,达到对观点词极性判断,计算文本观点词情感极性的加权和作为文本的情感极性。实验表明,与基于向量空间的SVM分类方法相比,该情感分类方法在分类指标上表现更好。  相似文献   

17.
针对基于词语特征的Email分类综合性能(F-score)较低的问题,提出一种基于主题特征的Email分类方法.该方法利用领域知识及统计信息,从Email的词语特征空间中提取主题特征,并利用提取出的主题特征实现Email分类.通过对1080封Email进行分类测试,结果表明,由于主题特征能够更加准确地表达Email的主题思想,因此,与基于词语特征的分类方法相比,该方法在针对Email的全文及标题实现分类时,将平均F-score分别提高了13.16%和17.16%,从而使平均F-score提高到72.37%,基本可以满足实际应用的需求.  相似文献   

18.
为有效地分类出多个热门主题兴趣的作者群体,提出了一种基于综合特征和最大二元组的文本分类框架,该分类框架针对DBLP数据集.分类框架的核心是构建双边图和对标题进行准确分类.第一阶段从DBLP数据集中提取标题,为保证提取的标题和主题的正确映射,采用综合特征进行分类,即辨识特征和语义特征的结合;第二阶段构建双边图,生成多个"主题—作者"的最大二元组聚类,获得作者集合.与其他类似方法相比,本文的分类框架在准确率、召回率和F1测度方面具有更好的优势,能以较高精度识别出相似热门主题的最大聚类.  相似文献   

19.
三种分类算法的实验比较   总被引:1,自引:0,他引:1  
对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究、实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析.  相似文献   

20.
针对LDA(Latent Dirichlet Allocation)主题模型生成的大量topic,很大部分topic内部词语相关度很低,可解释性差,对语言模型后的应用效果带来一定的影响.针对这一问题,该文提出了一种基于主题加权LDA模型的情感分类方法,该模型实现不同主题中内部相关的词语特征加权计算,能够消除不同主题内具有相关度词语的相互影响.实验结果表明,与传统LDA模型分类方法对比,该文提出的基于主题加权LDA模型的情感分类方法平均F1值提高了6.7%~8.1%,验证了该文提出的方法是有效的,提高了分类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号