首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
赵源 《科技信息》2010,(35):58-58,49
本文在中文分词技术的基础上,提出了一种基于中文文本主题提取的分词方法,以概念语义网络的思想构造主题词典,描述词间概念语义关系,采用改进的最大匹配算法对文本进行切词,既提高了分词的准确性,又能识别文中的未登录词,并同步完成主题词的规范工作。从而在概念层次上理解用户的需求,实现概念检索,提高查准率。  相似文献   

2.
现有的文本自动摘要技术大多是运用向量空间模型将文本作为一个整体进行处理,忽略了段落及段落之间的关联程度,导致提取的摘要不能够全面反映所包含的主题,针对这一问题,文章提出了基于互信息的文本自动摘要方法。该方法利用互信息对文本中词语、句子及段落之间的关联程度进行计算,依据关联程度将整个文本划分成包含不同主题的较小单元,并针对每一单元运用优化的句子权重计算方法进行主题句提取,然后利用主题句生成文本摘要。实验验证了方法的有效性,在自动摘要提取方面取得了良好效果。  相似文献   

3.
为了提高文本标记和分类的效率,提出了基于概念语义相关性和LDA的文本自动标记算法(Text Mark Label,TML),用以代替人工标记的文本分类标记. 该算法在概念语义相关性计算的基础上,使用LDA(Latent Dirichlet Allocation)提取文本的主题表示,通过计算文本主题从属于各分类目录的期望从而实现文本自动标记. 为验证TML算法的效果,在标准文本分类数据集上使用文本分类器进行有监督文本分类实验. 为对比数据集和分类器对分类效果的影响,在3个数据集(WebKB、Reuters-21578、20-NewsGroup)上分别使用3种不同的分类器(Rocchio、KNN、SVM)进行实验. 实验结果表明:TML算法有效地提高了文本分类效率及文本标记效率.  相似文献   

4.
针对股评论坛主题发现,提出基于频繁项集与潜在语义相结合的短文本聚类(STC_FL)框架.在基于知网的知识获取后得到概念向量空间,挖掘并筛选出重要频繁项集,然后采用统计和潜在语义相结合的方法进行重要频繁项集的自适应聚类.最后,提出TSC-SN(text soft classifying based on similarity threshold and non-overlapping)算法,通过参数调优策略选择和控制文本软聚类过程.股吧论坛数据实证分析发现:所提出的STC_FL框架和TSC-SN算法可充分挖掘文本潜在语义信息,并有效降低特征空间维度,最终实现对短文本的深层次信息挖掘和主题归类.  相似文献   

5.
随着技术预见定量分析方法以及文本挖掘技术的发展,通过主题模型挖掘专利文献的潜在语义来获取技术发展趋势逐渐成为研究热点之一。尽管LDA(Latent Dirichlet Allocation)模型依然是文本主题建模领域应用最广泛的方法,但传统LDA建模存在主题可解释性差以及未能充分利用专利文本上下文的语义关联等问题,导致部分有价值的技术情报未能完全呈现。为了进一步拓展传统LDA方法在专利文本挖掘和技术预见领域的应用,综合集成LDA模型的文本聚类功能与KeyBERT算法的关键词生成与语义分析能力,构建了一种面向技术预见量化分析的集成框架,并通过对工业互联网领域的技术预见分析验证了所提出模型的有效性,从而进一步丰富了当前基于文本建模和语义计算的技术预见方法体系。  相似文献   

6.
提出了面向微博应用的新闻文本自动摘要研究方法.利用互信息对新闻文本中词语和句子之间的语义特征进行计算,根据其关联度对句子进行主题划分,赋予主题句较高的权重,同时从文本中抽取多种组合特征,利用Ranking SVM对句子进行排序,从而得到自动摘要.在NLPCC2015面向微博中文新闻自动摘要评测数据集上进行对比实验,取得了良好效果,证明该方法的有效性.  相似文献   

7.
通过主题模型与语义网络对旅游电商中的评论文本进行挖掘,从而引导消费者与商家对评论信息作出重要决策;提出一种基于LDA(Latent Dirichlet Allocation,LDA)主题聚类与语义网络模型(LDA topic clustering and semantic network model,LTC-SNM)的方法对酒店在线评论文本进行研究;获取在线评论文本进行数据预处理,使用Word2vec生成词向量,利用机器学习算法对评论文本进行情感分类;通过LDA主题模型对分类后的文本进行聚类,生成酒店的特征主题词;通过ROSTCM将特征主题词与所修饰的情感词生成语义网络,缓解了挖掘文本信息的复杂性;实验结果表明:提出的LTC-SNM文本挖掘方法使得在线用户评价的主题更具表达性。  相似文献   

8.
针对社交网络用户人格预测问题, 提出一种结合信息增益与语义特征提炼用户文本信息, 并采用多标签分类算法进行综合预测的方法. 先基于信息增益提取文本词特征, 包括情感词、 词性和时态等, 进行特征选择与加权; 对于语义特征, 将文本内容映射为本体概念并计算语义相关度; 然后以基于词的特征和语义特征的共同
影响为依据, 运用多标签分类算法执行人格预测过程, 从不同角度处理文本信息, 并充分考虑了类标签间的相关性. 实验结果验证了该方法的有效性.  相似文献   

9.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

10.
使用JST模型对中文新闻文本进行情感分析,相对于评论文本,新闻文本主观性比较弱,而且大多是长文本,会影响JST模型的分类性能.给出一种抽取情感主题句的方法,将抽取得到的情感主题句结合现有的JST模型对新闻文本的情感倾向进行了分析.实验表明,使用情感主题句进行情感分析,避免了与主题情感无关的句子对分析结果的影响,提高了分类准确率.  相似文献   

11.
高校图书馆的服务是一种专业性、学科性很强的服务。以2008—2012年图书情报档案类39种期刊关于"学科服务"的397篇文章为样本,利用Excel、SPSS对5年来研究"学科服务"的主要期刊、代表作者、作者来源机构和高频研究热点进行了统计分析,并对近5年"学科服务"的研究热点进行了述评。  相似文献   

12.
基础教育课程改革的推进,凸显了学科教育学课程的问题与弊端,学科教育学课程的改造与重楚迫在眉睫。本文基于新世纪的教育教学理论与课程改革的现实需要,从课程目标的重楚、课程内容的更新、课程实施方式的转交、课程的外部支持与研究机制的建立等方面,提出了重楚学科教育学课程的初步设想。  相似文献   

13.
英语教学应尊重学生的主体地位,以“传授知识、强化素质、发展能力、为宗旨,突出学生创新精神和英语语言实践能力的培养,从语法、词汇教学,听力、口语教学及阅读、写作教学诸方面,努力探讨并积极实施有效的英语教学策略,渗透、体现素质教育的要求,在尊重学生主体地位的前提下,通过激发学生主体积极性的手段,达到发挥学生主体作用的目标,从而促进学生个体素质的全面发展。  相似文献   

14.
基础教育课程改革的推进,凸显了学科教育学课程的问题与弊端,学科教育学课程的改造与重建迫在眉睫。本文基于新世纪的教育教学理论与课程改革的现实需要,从课程目标的重建、课程内容的更新、课程实施方式的转变、课程的外部支持与研究机制的建立等方面,提出了重建学科教育学课程的初步设想。  相似文献   

15.
阐述了基础学科、交叉学科及前沿学科在当今科学发展中的重要地位,指出高校学报编辑不断加强和积累科学意识,提高自身的科学修养,对于组稿、选稿,做好科技编辑工作,办好高校学术期刊有十分重要的意义.  相似文献   

16.
对人的主体性的理解经历了从群体本位、个体本位到类本位的必然逻辑。相应地,人类的教育也会从群体教育、个体教育向类主体教育发展。在类主体教育视野下,教育不仅要关注个体主体的发展,而且还应该关注类主体的发展。因此,在类主体教育中,教育过程是对话和理解的过程,是生命提升的过程,也是一个以经验为生长点的过程。  相似文献   

17.
长期以来,人们对军事装备学学科体系的划分,习惯于按照研究对象领域来进行。在钱学森依据学科知识在人们认识世界和改造世界中的作用,提出了学科体系划分的另外一种方法后,提出了把二者有机结合起来对军事装备学学科体系划分的二维(即研究对象维和知识作用层次维)划分方法,以期实现两种截然不同方法的统一。  相似文献   

18.
详细论述了学生的主体性及其表现,分析了主体性教育的科学性、民主性、活动性和开放性.实施主体性教育,既是时代进步的需要,也是教育改革和发展的必然.  相似文献   

19.
汉唐乐府诗题目的创制,多取首句前二三字甚至是整个首句,或者再缀以歌辞性题目“行”、“篇”、“歌”、“曲”、“乐”等。部分以“篇”为缀尾的题目是“因意命题”,而南朝乐府民歌的题目表现出艺术化的倾向。唐代乐府诗中的有些新题目是从旧题乐府中衍生出来的,其方式主要有五种;唐人完全自创的乐府诗新题目,其方式主要有两种。  相似文献   

20.
陶能祥 《韶关学院学报》2002,23(11):110-114
在教育界对主体教育理论开展了广泛而深入的讨论的大背景下,认为幼儿也具有主体性.其特征表现为:自主性、能动性、创造性.幼儿主体性发展是其以主体身份在对象性活动中的发展,可从三方面进行研究.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号