首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文从语料库的特点和语料库语言学的发展入手,分析了语料库语言学的发展对语言教学和测试的影响,同时以词汇测试的设计和评估为例,探讨了语料库在词汇测试中的影响及运用。  相似文献   

2.
1984年7月,我校软件教研室研制的“TP词汇处理系统及MSAE语料库”,“XENIX汉字扩充系统”,“《ETS》英语测试系统”,“《FIMS》指纹系统”,通过了技术鉴定。兹将这些软件情况,简报加下。1.TP词汇处理系统及MSAE语料库MSAE语料库包含机械、电子、电气、建筑、化工、纺织等学科词条近10万条,每一词条进行交叉编码,并将继续扩充。TP词汇处理系统有7个功能:即建立语料库、编辑、排序、检索、打印英汉或汉英、查阅。系统采用人机会话形式引导用户操作。系统设计模块化,易于扩充。用户容易进入所需功能和退出系统。  相似文献   

3.
介绍基于词汇坐标的语料库文本处理模型,并对英语文本词汇坐标思想进行详细阐述.对语料库文本进行词汇坐标化处理从本质上讲就是从字母串到数字串的映射实现过程.基于词汇坐标的文本处理模型改变了传统的语料库检索模式,从一定程度上适应了当前超大型语料库建设的需要.  相似文献   

4.
"元数据模型"在数据提取中的实现   总被引:10,自引:1,他引:10  
大量分散的形式及不同格式的数据给现代数据处理带来了越来越大的困难.为统一数据形式以利于数据操作和处理,讨论了将形式多样的数据格式转换成统一的XML(extensible Markup Language)格式的问题.在计算机网络中,应用"元数据模型"技术,对数据源中不同格式文件数据,按照预先定义的XML模板,以格式说明文件结构统一描述,并提取数据或作进一步的处理,最后转换为XML格式输出.设计了具体的实现策略以及实现流程:实现了从TXT文件格式数据中提取数据转换成XML格式的代码,将TXT文件数据提取成XML格式的数据;完成了数据说明文件格式的设计,数据路径选择工具的开发,语言分析工具的设计开发等工作.结果表明:能满足同类产品的按行(line)为单位的源数据结构形式处理,还具有同类产品不具备的非行(字符串和关键字)提取处理功能.  相似文献   

5.
新农村建设规划中的测绘地形图具有现势性好和信息量丰富准确等特征.其原始底图的处理是否得当,关系到后期规划设计中计算机辅助处理的效率和设计成果的正常输出.采用分层导出法优化处理测绘地形图中的矢量格式,并将矢量格式与栅格图形实现无缝叠加,从而大大简化了规划设计的前期图形处理工作.  相似文献   

6.
Cisco Netflow在流量监控、网络安全等许多方面得到了广泛的应用.目前高端路由器大都支持Netflow数据输出,但使用路由器来产生Netflow存在输出字段不够丰富、无法定制等弊端.本文设计并实现了一种基于通用PC和普通千兆网卡的高速数据包采集与流归并系统,实时采集千兆链路流量并输出Netflow数据.通过修改网卡驱动,实现了数据包在内存中的零拷贝.通过多索引队列实现负载均衡,系统可将一路网卡流量分配到多个CPU并行处理,有效利用了多CPU的计算资源,大大提高了系统处理能力.系统的流归并模块使用Netflowv9格式,可输出丰富的流信息.测试表明,该系统能够实现单路千兆链路环境下100万pps的数据包采集和流归并.  相似文献   

7.
isco Netflow在流量监控、网络安全等许多方面得到了广泛的应用.目前高端路由器大都支持Netflow数据输出,但使用路由器来产生Netflow存在输出字段不够丰富、无法定制等弊端.本文设计并实现了一种基于通用PC和普通千兆网卡的高速数据包采集与流归并系统,实时采集千兆链路流量并输出Netflow数据.通过修改网卡驱动,实现了数据包在内存中的零拷贝.通过多索引队列实现负载均衡,系统可将一路网卡流量分配到多个CPU并行处理,有效利用了多CPU的计算资源,大大提高了系统处理能力.系统的流归并模块使用Netflow v9格式,可输出丰富的流信息.测试表明,该系统能够实现单路千兆链路环境下100万pps的数据包采集和流归并.  相似文献   

8.
针对实现片上雷达的关键技术--基于标准片内总线的IP设计与复用,研究并设计实现了符合AMBA2.0 AHB Lite协议的用于数字下变频和数字脉冲压缩处理雷达信号处理IP.介绍了IP的总体结构和各子模块的设计,并使用ARM Versatile平台进行了原型验证.验证结果表明,协议实现正确,可以在73.31μs和15.84μs内分别完成1024点和256点数字脉冲压缩,脉压结果以块浮点格式或32bit标准IEEE754浮点格式输出.该技术可用于快速构建高速雷达信号处理系统芯片.  相似文献   

9.
针对实现片上雷达的关键技术———基于标准片内总线的IP设计与复用,研究并设计实现了符合AM-BA2.0 AHB Lite协议的用于数字下变频和数字脉冲压缩处理雷达信号处理IP.介绍了IP的总体结构和各子模块的设计,并使用ARM Versatile平台进行了原型验证.验证结果表明,协议实现正确,可以在73.31μs和15.84μs内分别完成1 024点和256点数字脉冲压缩,脉压结果以块浮点格式或32 bit标准IEEE754浮点格式输出.该技术可用于快速构建高速雷达信号处理系统芯片.  相似文献   

10.
英语阅读是英语语言教学的核心内容之一,对于阅读材料的难度调控、定级分类是英语教学中必须面对的问题。本文以大学英语阅读为例,介绍了一种阅读材料生词率探测技术:通过利用多个语料库作为数据支撑,构建囊括中学英语词汇和大学英语四六级词汇的参照词汇语料库,采用语料库软件及相关功能构建基于阅读材料的目标词汇语料库,最后将目标词汇语料库与参照词汇语料库对比,从而探测出大学英语阅读材料的生词率。  相似文献   

11.
本文分析了语料库辅助课堂词汇教学的优越性,即强化频率在输入中的作用、提高学习者对语言形式的注意程度和培养学习者合作精神和自主性、探究式学习的能力,讨论了实施语料库辅助课堂词汇教学的必备条件,介绍了利用自建教材语料库进行课堂词汇教学的模式的一些具体做法和效果。  相似文献   

12.
针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义倾向性计算系统进行比较,结果是所提方法的准确率达到了80%,表明在提高中文词汇语义倾向性计算的准确性方面是可行、有效的.  相似文献   

13.
商务英语因其包含的各种文体的特殊性而使得其内部众多词汇拥有隐喻的功能和特征。本文拟通过加工处理《新编剑桥商务英语(初级)》这套教材来建立一个小型的商务英语书面语篇语料库,并通过该语料库来进行商务英语书面语篇词汇的隐喻研究。  相似文献   

14.
本文分析了语料库辅助课堂词汇教学的优越性,即强化频率在输入中的作用、提高学习者对语言形式的注意程度和培养学习者合作精神和自主性、探究式学习的能力,讨论了实施语料库辅助课堂词汇教学的必备条件,介绍了利用自建教材语料库进行课堂词汇教学的模式的一些具体做法和效果.  相似文献   

15.
唐宋诗之计算机辅助深层研究   总被引:9,自引:0,他引:9  
介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字)和宋代部分名家诗(160万字)组成的语料库为基础,运用计算语言学方法对唐宋诗进行分析研究,提取了唐宋诗中的词汇,计5万余条目。在对诗文进行词语切分的基础上,建立了词汇的共现关系、对仗关系以及词汇的作者分布特征信息。系统除了提供面向诗文内容的全文检索功能外,还进一步开发了基于词汇的统计分析和诗句相似性检索等功能,实现了对全唐诗的自动注音。  相似文献   

16.
本文介绍了一个基于语料库方法建立的历史资料处理专家系统以及它的系统功能,体系结构和处理方法。  相似文献   

17.
词汇是学习语言最根本的部分。英语中有很大一部分词汇属于同义词,因此对英语学习者来说掌握辨析同义词的技巧,正确选择并且恰当地运用同义词决定着语言输出的质量。本文试图通过BNC语料库,使用Sketch Engine(SkE)检索工具,从词频分布、类联接、搭配三个方面比较分析同义词adapt和adjust,以期对二语习得过程中借助语料库语言学的方法辨析同义词用法差异有所启示。  相似文献   

18.
设计实现了一个基于Lucene的全文检索系统模型.在该系统模型中,针对中文分词实现了基于词库的采用正向最大匹配算法的中文分词模块;针对多种格式文档的处理采用接口实现的方式和动态实例化的方法,实现了可以有效地处理txt、xml、html、pdf、doc和rtf等常见格式文档.  相似文献   

19.
介绍了规范彝文字词频度统计的设计及应用程序.首先阐述了研究开发该软件的必要性和重要意义:然后介绍了用于统计的彝语语料库;讨论了统计的算法;最后根据国际彝文编码的基本原则,词汇的频度、频率、累计频率以及通用度原理结合规范彝文的特点设计字词频统计系统.  相似文献   

20.
词汇是语言技能的基石,是语言理解和表达的基础,词汇学习是语言学习的主要任务.英语词汇众多难记,词汇之间的联系复杂难以掌握,词汇学习仍然是英语学习的要点和难点.语料库的发展为词汇学习提供了大量真实的语言资料,提供了对语言使用规律和模式进行定量分析的可能性.本文针对语料库的特点,旨在分析如何运用语料库进行自主性词汇学习.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号