共查询到20条相似文献,搜索用时 322 毫秒
1.
基于语料库的《呼啸山庄》检索分析 总被引:7,自引:0,他引:7
任培红 《沈阳大学学报:自然科学版》2008,20(4):75-78
运用语料库语言学的研究方法,使用Wordsmith Tools语料库索引软件对小说《呼啸山庄》进行文本主旨、情景发展以及人物性格塑造方面的分析;以图形、列表、统计等量化结果分析文本,清晰地把握了小说的总体特征,得到对文本更加理性的诠释。 相似文献
2.
语料库为文学研究提供了一套全新的研究思路和方法,并被广泛应用于文学文本分析。该文运用语料库工具AntConc 3.2.4w和词汇分析软件Range分析赛珍珠的代表作《大地》的总体语言特征、情节发展、小说的主题和人物刻画等文体特征。文体的定量分析和定性分析相结合才是文本分析的有效途径。 相似文献
3.
文学与语言学的融合形成了新的研究方法—基于语料库的文学批评方法,被广泛地应用于文学作品分析。使用语料库检索软件Word Smith Tools对《伊坦?弗洛美》进行文本总体特征、故事情节和人物塑造等方面进行分析,以图表等量化结果分析文本,旨在对文本进行更理性的分析。 相似文献
4.
语料库检索软件检索能力强大,可用在文学文本的分析上,用语料库方法分析文学作品能揭示文本的主题是如何通过故事情节、人物刻画、修辞手法等来表达的。本文通过免费绿色语料库检索软件Antconc分析了英国著名作家多丽丝.莱辛的短篇小说———《屋顶丽人》,以此揭示小说的情节和文中主要人物的性格特征。 相似文献
5.
古藏文字符统计研究能够对机器翻译以及从海量文本中快速定位核心内容、情报收集工作等有着重要意义.目前,藏文字符统计研究主要依据现代藏文语料库.文章以敦煌藏文文献为主,构建了古藏文文献标注语料库.在此基础上,应用python语言设计出古藏文频率统计软件,对古藏文和现代藏文的元音、辅音、藏文数字频次等进行对比分析,归纳出古藏文字符的分布特征,以期为古藏文标注语料库的构建和研究提供参考. 相似文献
6.
王春梅 《重庆工商大学学报(自然科学版)》2012,(11):86-89
总统就职演说是重要的语篇体裁,它旨在阐述新任总统的施政纲领。语料库语言学蓬勃发展于20世纪80年代,它通过对文本的取样、检索、统计和分析为语言的研究提供了一种新方法,使语言研究更具客观性、科学性。拟采用语料库分析软件如Wordsmith、Range、AntConC从单词、句子和语篇三个方面对奥巴马2009年就职演说文本进行文体分析,以揭示其特征和魅力所在。 相似文献
7.
本文从文本的互文性特征入手对日本明治时期著名文学家坪内逍遥在《小说神髓》全书进行了整体细读,归纳和统计了该文本对其他文本引用和吸收的具体情况,对其中的主要互文性手法进行了分析,并对《小说神髓》有直接影响的外源性前文本以及作者完成书稿前撰写的相关论著等内源性前文本进行了比较,从中可以看出《小说神髓》是融合“和”、“汉”、“洋”多种文化背景中无数文本,对其进行歪曲、改编、模仿、借用、剪贴、拼凑,它的最后成书是作者坪内逍遥超越前辈作家、评论家以及超越自我的结果。 相似文献
8.
介绍了3种用于文本聚类的特征选择方法:文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果. 相似文献
9.
医学文本实体识别过程存在多义性和复杂性等特点,这导致传统的语言处理模型无法有效获取医学文本语义信息,从而影响了医学实体识别效果。本文提出了一种基于全词MASK的医学文本实体识别模型,其能有效处理中文文本。其中,BERT预处理层能够生成表征上下文语义信息的词向量,Bi-LSTM层对输入的词向量进行双向特征信息提取,注意力机制层对输出的特征向量进行权重分配,从而有效获取文本语句中的长距离依赖,最后通过CRF解码以生成实体标签序列。实验结果表明,该模型在中文简历语料库和CCKS2017语料库中表现优异,F1值分别为96.14%和92.68%。 相似文献
10.
美国当代黑人作家爱德华·P·琼斯在其代表作《已知的世界》中,运用了互文性的写作手法,建立了小说同其他文本的深层联系,赋予小说叙述开放性、复杂性的特征。作者跨越不同文本之间的界限,使小说的叙事更易与历时和共时层面上的历史文本相融合,大大增强了小说的艺术魅力。 相似文献
11.
本文从《塔铺》文本切入,从语言、叙述态度、结构等方面对新写实主义小说与传统现实主义小说的文本特征作比较观照,以期对这两种小说文本有一较具体可感的认识。 相似文献
12.
词汇量的大小对于任何一门语言来说都至关重要。随着语料库语言学的不断发展,丰富的在线语料库资源对学习者的自主学习起到了极大的推进作用。本文基于与美国当代英语语料库相关的WORD AND PHRASE数据库,通过实例演示该库促进了单词深度学习,通过文本分析确定语篇中的重点单词以及近义词替换,词组搭配等方面的运用,达到推广和普及语料库相关数据库在英语自主学习中的应用。 相似文献
13.
14.
15.
经过自20世纪60年代至今近50年的发展,语料库的种类、应用领域及相关技术正在不断扩展。然而,语料库的建设与检索常常涉及文本预处理、文本标注、词表制作、字符块匹配、搭配分析、句型查找等诸多模式匹配问题,这对于绝大部分语言研究者和外语教学者来讲是一个相当大的技术难题,也是制约语料库建设与推广运用的主要障碍。在语料库建库与检索中,我们常常可以利用功能强大的正则表达式结合相关检索软件,对文本进行模式匹配,从而准确、高效的提取各种所需信息。本文主要探讨如何使用正则表达式解决语料库建库与检索中的模式匹配问题。 相似文献
16.
对目前比较流行的4种中文文本分类器(Rocchio、KNN、Naive Bayes、最大熵)进行评价,其中,Naive Bayes和最大熵是基于概率统计的方法,而Rocchio和KNN是基于向量的相似度计算的方法。选用X2作为文本特征选取方法,对一个中文文本分类语料库进行分类评测。实验结果表明,最大熵和Naive Bayes的分类性能十分接近,处于较好水平,而KNN和Rocchio分类性能稍差一些。 相似文献
17.
《东莞理工学院学报》2016,(4)
美国英语词汇的语义从19世纪到21世纪经历了很多的发展和变化。本文通过使用语料库的研究方法,从美国当代英语语料库和美国历史英语语料库中提取文本语料,对美国英语词汇语义变化进行共时和历时的研究,从"一词多义"和"一义多形"的角度,结合语言中的社会、历史维度来揭示美国英语词汇语义变化的特征,并从认知语义学的视角对这些变化产生的原因进行定性的分析。 相似文献
18.
《上海交通大学学报》2016,(7)
提出了一种利用深度去噪自编码器(SDAE)的自然语言指令意图理解方法.根据家庭服务机器人的使用环境和应用场景构建了一个自然语言文本指令语料库,并对语料库中各类指令进行意图标注,从而把文本指令理解问题转化为文本分类问题;在传统的文本向量空间模型的基础上,融合了文本指令的词性信息,定义了一种文本表示模型——词性向量空间模型;将SDAE应用于文本指令意图理解,提取指令的高阶特征;用高斯核支持向量机进行训练和预测,进而实现了自然语言指令的意图理解.在所建语料库上进行多折交叉验证,结果表明指令意图理解平均准确率达到96%以上. 相似文献
19.
本文以新疆大学研究生院2010级的69维吾尔族名民考民硕士研究生为研究对象,通过作文竞赛的方式收集学习者的作文文本并通过语料库检索软件Antconc对数据进行量化分析和定性研究,对学生写作中附加性话语标记语的总体使用频率、位置、功能等进行分析,找出学习者使用不当的话语标记语并分析其原因。进而提出教学建议。 相似文献
20.
采用图神经网络模型为整个语料库构建异构图处理文本分类任务时,存在难以泛化到新样本和词序信息缺失的问题。针对上述问题,提出了一种融合双图特征和上下文语义信息的文本分类模型。首先,为每个文本独立构建共现图和句法依存图,从而实现对新样本的归纳式学习,从双图角度捕获文本特征,解决忽略单词间依存关系的问题;其次,利用双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)编码文本,解决忽略词序特征和难以捕捉上下文语义信息的问题;最后,融合双图特征,增强图神经网络模型的分类性能。在MR,Ohsumed,R8,R52数据集上的实验结果表明,相较于经典的文本分类模型,该模型能够提取更丰富的文本特征,在准确率上平均提高了2.17%,5.38%,0.61%,2.48%。 相似文献