首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于语料库的《呼啸山庄》检索分析   总被引:7,自引:0,他引:7  
运用语料库语言学的研究方法,使用Wordsmith Tools语料库索引软件对小说《呼啸山庄》进行文本主旨、情景发展以及人物性格塑造方面的分析;以图形、列表、统计等量化结果分析文本,清晰地把握了小说的总体特征,得到对文本更加理性的诠释。  相似文献   

2.
语料库为文学研究提供了一套全新的研究思路和方法,并被广泛应用于文学文本分析。该文运用语料库工具AntConc 3.2.4w和词汇分析软件Range分析赛珍珠的代表作《大地》的总体语言特征、情节发展、小说的主题和人物刻画等文体特征。文体的定量分析和定性分析相结合才是文本分析的有效途径。  相似文献   

3.
文学与语言学的融合形成了新的研究方法—基于语料库的文学批评方法,被广泛地应用于文学作品分析。使用语料库检索软件Word Smith Tools对《伊坦?弗洛美》进行文本总体特征、故事情节和人物塑造等方面进行分析,以图表等量化结果分析文本,旨在对文本进行更理性的分析。  相似文献   

4.
语料库检索软件检索能力强大,可用在文学文本的分析上,用语料库方法分析文学作品能揭示文本的主题是如何通过故事情节、人物刻画、修辞手法等来表达的。本文通过免费绿色语料库检索软件Antconc分析了英国著名作家多丽丝.莱辛的短篇小说———《屋顶丽人》,以此揭示小说的情节和文中主要人物的性格特征。  相似文献   

5.
总统就职演说是重要的语篇体裁,它旨在阐述新任总统的施政纲领。语料库语言学蓬勃发展于20世纪80年代,它通过对文本的取样、检索、统计和分析为语言的研究提供了一种新方法,使语言研究更具客观性、科学性。拟采用语料库分析软件如Wordsmith、Range、AntConC从单词、句子和语篇三个方面对奥巴马2009年就职演说文本进行文体分析,以揭示其特征和魅力所在。  相似文献   

6.
古藏文字符统计研究能够对机器翻译以及从海量文本中快速定位核心内容、情报收集工作等有着重要意义.目前,藏文字符统计研究主要依据现代藏文语料库.文章以敦煌藏文文献为主,构建了古藏文文献标注语料库.在此基础上,应用python语言设计出古藏文频率统计软件,对古藏文和现代藏文的元音、辅音、藏文数字频次等进行对比分析,归纳出古藏文字符的分布特征,以期为古藏文标注语料库的构建和研究提供参考.  相似文献   

7.
本文从文本的互文性特征入手对日本明治时期著名文学家坪内逍遥在《小说神髓》全书进行了整体细读,归纳和统计了该文本对其他文本引用和吸收的具体情况,对其中的主要互文性手法进行了分析,并对《小说神髓》有直接影响的外源性前文本以及作者完成书稿前撰写的相关论著等内源性前文本进行了比较,从中可以看出《小说神髓》是融合“和”、“汉”、“洋”多种文化背景中无数文本,对其进行歪曲、改编、模仿、借用、剪贴、拼凑,它的最后成书是作者坪内逍遥超越前辈作家、评论家以及超越自我的结果。  相似文献   

8.
介绍了3种用于文本聚类的特征选择方法:文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果.  相似文献   

9.
医学文本实体识别过程存在多义性和复杂性等特点,这导致传统的语言处理模型无法有效获取医学文本语义信息,从而影响了医学实体识别效果。本文提出了一种基于全词MASK的医学文本实体识别模型,其能有效处理中文文本。其中,BERT预处理层能够生成表征上下文语义信息的词向量,Bi-LSTM层对输入的词向量进行双向特征信息提取,注意力机制层对输出的特征向量进行权重分配,从而有效获取文本语句中的长距离依赖,最后通过CRF解码以生成实体标签序列。实验结果表明,该模型在中文简历语料库和CCKS2017语料库中表现优异,F1值分别为96.14%和92.68%。  相似文献   

10.
本文从《塔铺》文本切入,从语言、叙述态度、结构等方面对新写实主义小说与传统现实主义小说的文本特征作比较观照,以期对这两种小说文本有一较具体可感的认识。  相似文献   

11.
美国当代黑人作家爱德华·P·琼斯在其代表作《已知的世界》中,运用了互文性的写作手法,建立了小说同其他文本的深层联系,赋予小说叙述开放性、复杂性的特征。作者跨越不同文本之间的界限,使小说的叙事更易与历时和共时层面上的历史文本相融合,大大增强了小说的艺术魅力。  相似文献   

12.
本文采用语料库的研究方法,试图揭示英文小说语篇中定语或关系从句使用的叙事功能及倾向。通过分析小说语篇中定语从句特定类型的分布模式及出现频率,检验定语从句语法结构与出现频率与其叙事功能之间的关系。以先行研究为基础,考察了关系从句的语义、语法、句法功能特征,并以福楼拜的小说《包法利夫人》为分析对象,建立语料库,对其中实际使用的关系从句类型以及使用倾向性进行研究。结果显示关系从句以及某特定类型的使用频率在此小说中起到了描写与叙述女主人公情感逐渐堕落的作用。  相似文献   

13.
刘瑞 《中州大学学报》2011,28(1):121-125
经过自20世纪60年代至今近50年的发展,语料库的种类、应用领域及相关技术正在不断扩展。然而,语料库的建设与检索常常涉及文本预处理、文本标注、词表制作、字符块匹配、搭配分析、句型查找等诸多模式匹配问题,这对于绝大部分语言研究者和外语教学者来讲是一个相当大的技术难题,也是制约语料库建设与推广运用的主要障碍。在语料库建库与检索中,我们常常可以利用功能强大的正则表达式结合相关检索软件,对文本进行模式匹配,从而准确、高效的提取各种所需信息。本文主要探讨如何使用正则表达式解决语料库建库与检索中的模式匹配问题。  相似文献   

14.
周韵 《咸宁学院学报》2013,(10):121-123
词汇量的大小对于任何一门语言来说都至关重要。随着语料库语言学的不断发展,丰富的在线语料库资源对学习者的自主学习起到了极大的推进作用。本文基于与美国当代英语语料库相关的WORD AND PHRASE数据库,通过实例演示该库促进了单词深度学习,通过文本分析确定语篇中的重点单词以及近义词替换,词组搭配等方面的运用,达到推广和普及语料库相关数据库在英语自主学习中的应用。  相似文献   

15.
文本分类是根据文本内容自动确定文本类型的过程。介绍现有特征抽取和分类算法,提出用模糊聚类算法FCM确定文本类标签,Boosting算法构造分类器的方法,使文本分类具有更好的分类精度和时效性,以及对未知类标签语料库中文本的自适应性。  相似文献   

16.
美国英语词汇的语义从19世纪到21世纪经历了很多的发展和变化。本文通过使用语料库的研究方法,从美国当代英语语料库和美国历史英语语料库中提取文本语料,对美国英语词汇语义变化进行共时和历时的研究,从"一词多义"和"一义多形"的角度,结合语言中的社会、历史维度来揭示美国英语词汇语义变化的特征,并从认知语义学的视角对这些变化产生的原因进行定性的分析。  相似文献   

17.
提出了一种利用深度去噪自编码器(SDAE)的自然语言指令意图理解方法.根据家庭服务机器人的使用环境和应用场景构建了一个自然语言文本指令语料库,并对语料库中各类指令进行意图标注,从而把文本指令理解问题转化为文本分类问题;在传统的文本向量空间模型的基础上,融合了文本指令的词性信息,定义了一种文本表示模型——词性向量空间模型;将SDAE应用于文本指令意图理解,提取指令的高阶特征;用高斯核支持向量机进行训练和预测,进而实现了自然语言指令的意图理解.在所建语料库上进行多折交叉验证,结果表明指令意图理解平均准确率达到96%以上.  相似文献   

18.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法。选用X2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测。实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些。  相似文献   

19.
马建强 《科技信息》2012,(21):108-109,155
本文以新疆大学研究生院2010级的69维吾尔族名民考民硕士研究生为研究对象,通过作文竞赛的方式收集学习者的作文文本并通过语料库检索软件Antconc对数据进行量化分析和定性研究,对学生写作中附加性话语标记语的总体使用频率、位置、功能等进行分析,找出学习者使用不当的话语标记语并分析其原因。进而提出教学建议。  相似文献   

20.
基于多类特征池化的文本分类算法   总被引:2,自引:0,他引:2  
文本分类是文本挖掘的一个内容,在信息检索、邮件过滤、网页分类等领域有着广泛的应用价值。目前文本分类算法在特征表示上的信息仍然不足,对此本文提出了基于多种特征池化的文本分类算法。在该算法中,本文首先对分词后的文本采用skip-gram模型获取词向量,然后对整个文本的词向量进行多种池化,最后将多种池化的特征作为一个整体输入到Softmax回归模型中得到文本的类别信息。通过对复旦大学所提供的文本分类语料库(复旦)测试语料的实验,该结果表明本文所给出的多种特征池化方法能够提高文本分类的准确率,说明了本文算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号