首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
在词典编纂现代化进程中,为了便于管理,通过引入工作流技术,进而设计开发面向任务的词典计算机辅助编纂系统是必然的.采用工作流技术的词典计算机辅助编纂系统覆盖词典编纂全过程,包括语料采集、语料处理、语料查询、词目编制、义项例证的收集筛选和词典出版等,通过对工作任务的高效管理,以保证词典内容的准确性和词典发布的时效性.  相似文献   

2.
双语术语自动抽取是自然语言处理领域的重要研究课题之一,对于跨语言检索、机器翻译,以及双语词典的构建等具有重要意义。该文提出了一种面向中英平行专利语料的无监督双语术语自动抽取算法。该算法利用基于短语的统计机器翻译模型中的短语对齐和基于条件随机场的组块分析,实现双语术语自动抽取,同时借助专利语料的领域主题信息进一步提高双语术语抽取的准确率。实验表明:该算法在5 867组电通信技术领域的中英平行专利文档上进行双语术语的自动抽取,准确率达到94.00%。  相似文献   

3.
针对微博的倾向性分析问题,提出了一种基于三元词组模式的情感分类方法。该方法通过构造情感词典及微博的三元词组模式,对未标注语料自动进行情感评分并标注情感极性,然后使用自动标注的语料训练得到情感分类器。在测试集上的实验结果表明,使用无人工参与标注的训练语料达到了79.26%的测试正确率。  相似文献   

4.
<蒙古语语法信息词典>是为实现蒙古语的自动分析和自动生成而研制的一部机器词典.从词典建设的实际需求出发,设计了<蒙古语语法信息词典>管理平台,介绍了管理平台设计和实现的基本方法.  相似文献   

5.
本文介绍了一个已研制成功的新闻语料自动分词系统—NEWS的结构和功能。着重介绍了汉语分词词典的信息描述和动态设置方法。应用结果表明,NEWS是一个高效的实用系统。  相似文献   

6.
歧义是在基于词典的分词方法中常见的问题,以往的基于词典的分词方法往往使用双向最大匹配法获得分词结果后,通过使用上下文信息来进行歧义消解,但是对于没有上下文信息的单独语料无法进行歧义消解。本文提出一种通用的基于词频的歧义消解法,该方法是与上下文无关的,能够消解没有上下文信息的语料切分后产生的歧义,扩大了歧义消解的应用范围,简化了歧义消解的处理过程。实验表明:文本方法与传统基于词典的分词算法相比,具有更强的适用性及更高的可用性。  相似文献   

7.
基于登录词邻接关系的双条件概率的领域术语抽取算法   总被引:2,自引:2,他引:0  
领域词典作为中文信息处理的基础,在各个领域都有着重要的应用.而人工构建领域词典不仅工作量大,而且缺乏时效性.因此,自动构建领域词典成为目前研究的重点,而构建领域词典的关键是从领域语料中自动抽取领域术语.本文以金融领域作为切入点,提出了根据登录词前后邻接关系计算邻接词之间的双条件概率自动识别领域术语.实验证明,本文提出的算法不仅能够有效地提取新术语,同时在小语料和低词频情况下也能取得较好的效果.  相似文献   

8.
介绍了藏汉句子自动对齐系统及其对齐方法,详细地分析了基于平行语料的藏汉句子自动对齐问题,提出了利用大规模高效藏汉双语词典进行句子局部对齐的策略,并做了验证.  相似文献   

9.
谈整体观在大型语文词典义项方面的作用   总被引:1,自引:0,他引:1  
主要讨论了在大型语文词典编撰中整体观在义项方面的作用,并指出《汉语大字典》在义项上的一些不足,可供大型语文词典编撰及修订时参考。  相似文献   

10.
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。  相似文献   

11.
根据汉语中二字词较多的特点,提出了一种新的分词词典机制.该机制在词典数据结构中添加二字词检测位图表,在分词时,利用位图表可快速判断二字词优化分词速度.选取人民日报语料片断进行了实验测试.实验结果表明,基于二字词检测位图表的分词词典机制有效地提高了汉语自动分词的速度和效率.  相似文献   

12.
针对目前少按键设备搭载的汉语输入法多数输入效率较低的现状,在对现在方法进行考察的基础上,提出一种能够自动适应用户输入习惯的笔画输入方法.方法对笔画按键进行了合理的键盘布局并充分利用输入候补的屏幕显示功能,引入分词技术和自动学习机制,使输入法能够通过机器学习自动调节输入词典和联想信息,自动登录新词和删除不用的词汇,使输入法能够随着用户的使用输入效率不断提高.在PC机环境下编程实现了仿真系统,并通过输入实验验证了方法在较小输入词典的状态下,具有较好的输入效率和用户自适应性.  相似文献   

13.
实现站内搜索引擎的关键一步是信息的自动采集.站内信息采集技术是通过分析网页的HTML代码,获取网内的超链信息,使用广度优先搜索算法和增量存储算法,实现自动地连续分析链接、抓取文件、处理和保存数据的过程.系统在再次运行中通过应用属性对比技术,在一定程度上避免了对网页的重复分析和采集,提高了信息的更新速度和搜全率.  相似文献   

14.
张帆 《甘肃科技》2009,25(16):14-16
提出了一种利用CDMA 1x网络的短消息业务,实现水位自动测报系统中水位信息远距离传输的解决方案,给出了系统结构、工作原理,并着重论述了利用短消息实现远程通信的具体实现方法。目前,已将该技术应用于金昌市明渠水位监测系统,成功地实现了水位信息的自动采集、存储、远程通信及实时查询。  相似文献   

15.
基于数据挖掘的高校图书馆辅助决策系统研究   总被引:2,自引:0,他引:2  
丁国庆 《科技信息》2009,(27):310-310
数据挖掘技术是一种新兴的信息处理技术,在信息的利用和提取中发挥着日益重要的作用。本文在论述数据挖掘技术的基础上,提出了数据挖掘技术在图书馆图书摆放、图书采集、个性化服务及读者导读中的应用。  相似文献   

16.
为实现Web学习信息资源有效整合,提高查询效率,通过采用分布式Web爬虫技术实现后台自动采集任务,利用ECharts和JavaScript技术实现数据可视化展示,最终设计实现学习资源自动采集系统.经过功能测试和性能测试,系统能够满足实际工作需要,具有稳定性和适应性,能够有效提升学习水平,具有较高应用价值.  相似文献   

17.
从不同结构的词典中可自动构建出一部复合词典的算法。新的复合字典中同时包含有源词典的分类信息和语义信息,自动补充部分源词典中不存在的信息。  相似文献   

18.
为提高砝码检定的准确性,提高检定效率,本项目设计完成了砝码自动检测系统.本系统利用计算机技术实现了砝码检测数据的自动采集,利用数据库技术实现了成组砝码的检定信息的集成和汇总,并能自动生成砝码检定记录.同时构建的砝码检测信息数据库,可方便查询以往检定信息,便于计量管理.  相似文献   

19.
计算机识别"有"与其他动词构成的述宾短语,仅利用语法信息词典提供的静态规则是难以采用规则方法来处理大规模真实文本的。"有+V"述宾短语的组合,不但要受到静态规则的制约,而且也会被动态组合过程中产生的新条件所管制。为提高计算机对"有+V"述宾短语的识别率,以CCL语料库为语料调查源,参照《现代汉语语法信息词典》分析"有"跟一般动词构成述宾短语的动态条件。研究这些一般规则的突破条件,或许是提高大规模真实文本自动句法分析准确率的切入点。  相似文献   

20.
随着突发事件的频发,对突发事件在线评论进行倾向性分析引起了广泛关注,情感词典是其中重要的资源.对面向突发事件的情感词典自动构建方法进行探讨.基于对大规模评论数据的统计分析,提出采用基于词性标注和snownlp的方法实现突发事件情感词典的自动构建.为验证构建词典的有效性,设计基于情感词典的情感倾向性分析模型.结果表明,词典构建方法在准确率和召回率方面效果较好.基于该词典的情感倾向性分析模型的性能较基础模型性能有较大的提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号