期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	3篇
免费	0篇

专业分类

综合类

3篇

出版年

2008年	1篇
2001年	1篇
1997年	1篇

排序方式： 共有3条查询结果，搜索用时 457 毫秒

基于语料库的语言建模 总被引：6，自引：0，他引：6

许伟苑春法黄昌宁《清华大学学报(自然科学版)》1997,(3)

语料库语言学的发展的核心问题是语言模型的建立问题。常用的语言模型可以概括为三类：（１）ｎ元模型（及隐马尔可夫模型）；（２）基于分布理论的模型；（３）基于规则的模型。基于语料库的建模过程就是对语言模型的参数进行求解的过程，也可以认为是一个机器学习的过程。它可分为两大类别：（１）有指导学习；（２）无指导学习。本文着重论述了近年发展的热点——无指导学习的各种技术和影响参数可信度的数据稀疏问题及其解决办法。相似文献

中文时间信息的TIMEX2自动标注 总被引：5，自引：0，他引：5

林静曹德芳苑春法《清华大学学报(自然科学版)》2008,48(1):117-120

为了完善中文时间信息标注规范,实现中文时间短语的自动标注,该文研究并修改国际通用的时间短语标注规范TIMEX2的中文标注草案,以此为基础开发一个基于正则表达式的中文TIMEX2自动标注系统(CTAT).该系统采用3层候选确定参考时间,并行使用多个模块识别输入句子中的时间短语,通过排序冲突消解确定最终结果.经测试,该系统识别时间短语和将时间信息值解析为标准格式的F-measure分别达到了90.15%和83.27%, 与其他语言同类系统性能相当.应用该系统标注的语料,为时间信息处理方面的后续研究提供了重要资源. 相似文献

基于遗传算法的汉语构词研究 总被引：1，自引：0，他引：1

苑春法　李莼崔永华邢红兵《清华大学学报(自然科学版)》2001

相似文献