首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   7篇
  免费   0篇
理论与方法论   3篇
综合类   4篇
  2023年   1篇
  2018年   3篇
  2014年   1篇
  2013年   2篇
排序方式: 共有7条查询结果,搜索用时 0 毫秒
1
1.
中文术语识别与抽取是中文文本信息处理的基础,对于提高中文文本索引与检索、文本挖掘、本体构建、潜在语义分析等的处理精度有着重要的意义。文章以互信息和信息熵理论为基础,提出一种基于统计技术的中文术语半自动抽取方法,并且以互联网新闻话题数据为对象进行了实验验证,结果表明所提方法能够有效支持中文术语的抽取。  相似文献   
2.
围绕双语平行语料质量评价问题,提出基于集成机器翻译的无监督质量评价思路,从翻译方向和翻译系统两个视角分别设计实现了单引擎和多引擎无监督评价框架和算法。实验结果表明单引擎无监督评价算法能够集成同一个机器翻译系统不同翻译方向的差异,多引擎无监督评价算法能够集成不同机器翻译系统之间的差异,采用最基本的莱文斯坦字符串形态相似度计算方法和线性加权集成方法能够实现高效工业级语料质量评价。  相似文献   
3.
低时空复杂度始终是多类别文本分类算法希望达到的性能。新闻文档集中Token频率分布的研究再次验证了Token频率分布普遍服从幂律。据此设计了一种新的多类别Token频率索引数据结构,并基于该数据结构提出了一种低时空复杂度的多类别文本分类算法。在TanCorp数据集上的实验结果表明该算法在多类别新闻文档分类应用中是时空高效的。  相似文献   
4.
针对日汉机器翻译问题,提出一种新的独立于具体机器翻译算法的两层翻译架构。第一层优先利用信息检索和双语语料实现翻译记忆;第二层充分利用日语的自然形态特性,在句法匹配和词汇记忆基础上支撑高级翻译。该架构的效力依赖于大规模日汉语料资源和高效的句法匹配算法。网络语言大数据爆发在一定程度上缓解了日汉语料资源的匮乏,而平假名符号子系统表示的句法框架显式标记可以支持高效句法匹配算法的实现。实验结果表明把日语自然形态特性融入日汉机器翻译,能够创新翻译架构、扩充语料规模、降低训练开销。  相似文献   
5.
针对国防缩略术语不断涌现、猜证难度大、查询不便等突出问题,尝试综合运用计算术语学、术语知识工程学等相关理论和方法,揭示国防领域不同语种的缩略术语构成机制和规律,构建多语种国防缩略术语查询系统,以期促进国防缩略术语使用处理的规范化和标准化。  相似文献   
6.
针对中国译介研究术语演化规律这一科学问题,采用文献计量方法对中国期刊全文数据库(1963—2016)中的译介研究关键词进行了统计分析。结果表明中国译介研究术语经历了三个演化阶段:第一阶段为1963—1982年,这期间相关研究论文的数量比较稀少,导致术语贫乏;第二阶段为1983—2000年,这期间发文量明显增多,多研究重心开始形成,新的术语不断产生;第三阶段为2001—2016年,这期间发文量大规模增长,研究重心发生迁移,术语呈现“百花齐放”态势。当前,中国译介研究方兴未艾,译介研究术语更多地被赋予了时代性、民族性、多样性的文化内涵。  相似文献   
7.
针对越南语分词词典构建问题,提出了一种新的半监督集成构建方法.该方法能够结合人工干预,从大规模未标注越南语语料中识别多音节单词.首先设计了一种n元音节词产生器,并生成尽可能多的候选多音节词;其次通过3种统计特征的计算并根据预设阈值实现了相应的单词提取器,接着越南语专家检测并修正3个单独的词典;最后词典合成器合并这几个提取出的词典形成一个集成词典.采用直接实验和间接实验来评估这些词典的效力,实验结果表明,所提出的半监督集成构建方法是有效的,而且采用这些动态提取词典的两种越南语分词算法都能够达到理想的性能.  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号