首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
<正> 本刊从1992年第2期起,将原来使用的“关键词”改用“主题词”,这是根据有关部门的要求和为加快、准确的进行信息的传播而采取的一项重要措施.主题词应从《汉语主题词表》(自然科学部分)中选用.《汉语主题词表》是一部显示主题词与词间意义关系的规范化动态性的检索语言词表.它是沟通情报文献工作者与情报用户之间的思维桥梁,是自然语言与情报系统语言之间的媒介,同时又是人与计算机之间在进行情报存储与检索方面的联系工具. 《汉语主题词表》中的主题词主要是各学科领域文献中经常出现、在情报检索中有使用价值和一定的使用频率、能作为主题汇集一定量文献或具有叙词组配功能的名词术语;主题  相似文献   

2.
介绍了集合论的基本概念,阐述了分类法和主题词的集合分析与运算,论述了分类法、非控主题词和主题词的集间关系。  相似文献   

3.
基于《中图法》的图书文献分类系统的设计与实现   总被引:1,自引:0,他引:1  
高原  王保栋 《科技信息》2009,(28):120-121
本文设计实现了基于《中图法》的图书文献分类系统:以中文文献资料的题名、内容提(摘)要和正文作为信息获取的对象。以《中图法》类名、《中国分类主题词表》的主题词和从已有的标引经验中获得关键词作秀词表的主干词汇,并辅以相关工具书及其它资料作为词汇的补充,作为分词元素集合同时采用适量的无用词,建立无用词表组成自动分类知识库,应用文本自动分类技术通过对原始数据的有效整理,找出关键词、主题词和分类号之间隐含的概念关系,形成分类类目与标引词串的对应款日,自动得出分类号。  相似文献   

4.
以建国以来历次科技规划为主要研究对象,采用文本挖掘和人工判读相结合的方法,确定规划文本主题词及词组,通过词频统计等发现受关注程度高的主题词及其潜在关系.结合文本挖掘结果与历史研究,从核心理念、发展阶段和政策重点3个方面对科技规划的演化进行分析.研究发现:规划核心理念逐渐清晰,科技规划发展经历了从科学技术体系建设、科技创...  相似文献   

5.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

6.
关系营销是维护企业与消费者利益关系的重要前因变量,也是获取和提高企业占有率的重要手段.此研究基于CiteSpce可视化分析软件,以中国知网1998—2020期间,主题词"关系营销"检索的1250篇核心中文期刊论文为研究对象,通过发文作者和发文机构分析、关键词突显、关键词共线分析以及关键词聚类等分析,总结这一领域的研究热...  相似文献   

7.
随着现代科学技术的飞速发展,科技文献数量急剧增长,种类繁多,内容庞杂,代谢频繁.手工检索已远不能适应形势发展的需要,计算机检索势在必行.而主题词标引是计算机检索的必备条件.主题词是专门为文献标引和检索而从自然语言的主要词汇中选出的、经过规范化的词,分类列于《汉语主题词表》和《医学主题词表》中.主题词标引就是把文献资料的主题内容和某些具有检索意义的特征,如研究对象、处理方法、研究与实验设备等,用主题词表中的主题词作为存贮和检索的标志.  相似文献   

8.
法律语言文本结构以条为基本单位,条款式表述是法律修辞之特质。法律条款式表述,往往以主题词为核心形成一个主旨突出、语义贯通的主题语链(topicchain)。条的构段,要注意设款的匀称,款与款之间在语义上和形式上的关联。  相似文献   

9.
设计了一种用于OA系统主题词提取算法,该算法包括单句聚类、抽取代表句、代表句分词和主题词提取几个步骤。采用层次凝聚法作为单句聚类算法,研究公文句子的特点,设计了代表句抽取算法,根据公文群体较为单一的特点,建立主题词词库以及主题词提取规则库,对机械分词法进行改进,设计了代表句的分词算法,实现了公文搜索主题词的自动生成。  相似文献   

10.
李响 《长沙大学学报》2012,26(3):107-109
通过对比主题词列表、关键词的搭配词和高频词簇来比较中国《政府工作报告》和美国《国情咨文》,发现二者差异明显。《政府工作报告》的核心主题词主要是经济、改革、发展、教育、安全、居民生活水平等,而《国情咨文》的主题词是就业、税收、赤字、能源、反恐等。对比经济、教育、医疗和外交等子语料库,发现各子库主题词和词簇的差异也十分显著,这些差异反映了中美政府在这些领域的不同意识形态和工作重点。  相似文献   

11.
目的:对近年来国际上阻塞性睡眠呼吸暂停综合征(OSAHS)的研究热点进行分析。方法:对2004年1月—2013年12月美国国立医学图书馆Pubmed数据库收录的相关文献采用书目信息共现挖掘系统(BICOMS)进行文献计量分析,利用PASW19.0统计软件对高频主题词进行共词聚类分析并描绘聚类关系图。结果:共检出OSAHS相关文献8 710篇,相关高频主题词共35个,共词聚类分析发现高频主题词聚类为6个类别。结论:近年国际对OSAHS的关注和发文量逐年增加,OSAHS的研究热点主要集中在手术治疗、病因学、多导睡眠图诊断技术、流行病学研究、并发症治疗、影像学检查等6个领域。  相似文献   

12.
根据汉语语言的特点,对以中文文本数据库为数据源的汉语关键词自动转换主题词的方法进行了探讨.其方法是通过现有工具和计算机编程语言实现中文文献的分词、筛选统计,然后与主题词表进行匹配,并将最终转换的主题词进行存储.  相似文献   

13.
基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法.根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词,利用获得的初始主题词构建中文新闻信息分类与代码体系的特征向量,将文本按该体系进行自动分类,分类结果采用人工抽样分析,一级类目的正确率为72%.  相似文献   

14.
基于自建的国内外高校英文简介语料库,本文对中国财经类知名高校与经济类专业排名靠前的英语国家高校的英文简介进行比较研究。利用AntWordProfiler,AntConc和Readability Analyzer等语料分析工具,多维度考察了两个语料库的词汇难度、词频、词块、主题词、词性分布等措辞方面的差异。研究结果表明:中国高校英文简介与国外高校简介之间存在诸多差异,具体主要体现在文本特征、语篇的信息性和描述视角三个方面。  相似文献   

15.
为了让用户从海量知识信息中精确、快速地获取到感兴趣的信息内容,综合考虑文档的头部信息(标题、摘要、关键词)和重点主体内容,采用基于主题词迭代提取的信息检索算法,使得主题词的提取在兼顾效率的同时准确率达到83%以上,主题信息检索的性能也随之增加.实验结果表明,在文档查询词频和倒排文档频率(TF-IDF)的基础上对候选主题词相关度权值的计算进行合理化调整,并利用所提出的主题词迭代提取算法,主题信息检索的有效性将显著增加.  相似文献   

16.
以Web of Science(WS)网络数据库为数据源基础,查询和统计了1989—2008年间WS收录的气象学和大气科学类别中主题词,得出了近20年来大气科学领域中出现频率高的热门主题词,以及这些主题词的论文数量的变化趋势。  相似文献   

17.
以中国知识资源总库和中国引文数据库为实验工具,选取"police"为主题词开展学科脉络实验研究,通过对比分析警学文献知识点之间的交叉融合与渗透演化,从学科关联、引文关联、机构关联、基金关联、语种关联、分类号关联等角度,直观立体地展现中外警学文献的关联性,为挖掘警学外文文献、夯实警学学科框架、厘清国际警学发展规律提供参考依据。  相似文献   

18.
吴磊  李舒 《科技信息》2010,(35):J0115-J0116
从PubMed检索1958年到2010年5月5日间可视化的相关文献4488篇,下载这些文献的主题词并统计主题词出现的频次,截取频次大于40次的主题词作为高频主题词,经处理生成主题词词篇矩阵并利用SPSS统计软件对矩阵进行聚类,通过分析各类的文献内容,得到该主题的研究热点。  相似文献   

19.
多数科技期刊要求作者标引出论文的主题词。什么是主题词、如何标引出主题词,本文以实例加以说明,以供科技论文作者标引主题词时参考。一、科技论文标引主题词便于信息传播与交流科学研究离不开情报资料,如果情报不灵、资料不全,难免重复别人的工作,形成无效劳动。现代科学技术的发展,导致图书资料数量的急剧增加。据报道,全世界每年估计可产生数百万项科研成果,数千万项技术资料;出版的期刊、连续出版物达10万种,其中比较重要的约2万种。而且又以7—8年翻一番的速度增加;加之类型复杂、出版分散、文种多样,  相似文献   

20.
信息主题的抽取是快速定位用户需求的基础任务,主题词抽取时主要存在三个问题:一是词语权重的计算,二是词语间关系的度量,三是数据维度灾难.在计算词权重时首先利用互信息确定共现词对,与词频、词性、词位置信息非线性组合,然后,根据词权重构建文档—共现词矩阵并建立潜在语义分析(Latent Semantic Analysis,LSA)模型.该方法借助LSA模型的奇异值分解(Singular Value Decomposition,SVD)将文档—共现词矩阵映射到潜在语义空间,不仅实现数据降维,而且获得低维度的文档相似矩阵.最后,对文档相似矩阵进行k-means聚类,在同类文档中选出词权重最大的前几对共现词,作为该类文章的主题词.对比基于TF-IDF(Term Frequency-Inverse Document Frequency)和共现词抽取主题词的实验,该算法的准确度分别提高了19%和10%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号