期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	0篇

专业分类

综合类

2篇

出版年

2010年

2篇

排序方式： 共有2条查询结果，搜索用时 0 毫秒

基于统计的中文关键短语自动抽取 总被引：1，自引：0，他引：1

张永刚梁颖红颜振祥姚建民《江南大学学报(自然科学版)》2010,9(1):26-29

用统计的方法从单文本中自动抽取关键短语。在实验中验证了频度、首位置作为特征的有效性。用各种方法过滤非法词串，综合短语位置和统计特征对候选短语进行权重计算，并依据关键短语分布规律选择关键短语。另外，通过分析关键短语分布特点为Ⅳ元短语在过滤、按比例选择方面提供了依据。获得了比较好的实验结果：TOP5精确率21．80％，召回率28．27％，F-measure25％；TOP10精确率17．10％，召回率44．50％，F-measure30．80％。相似文献

基于平行语料库和网络的未登录词译文挖掘

孙萌梁颖红葛运东颜振祥姚建民《江南大学学报(自然科学版)》2010,9(1):66-70

分别通过搜索引擎和本地的双语语料库挖掘OOV译文。首先,提出一种利用词汇重叠特征、词对齐特征和位置特征建立最大熵分类器的方法,借以自动从网页信息中抽取和构建双语平行语料库。其次,提出一种结合互信息的频率变化方法生成多词单元,并采用频度．距离模型和音译模型进行正确译文的选择。对这两种挖掘方法的性能进行对比,实验表明基于网络的Top10的包含率达到94．6％,而基于平行语料库的Top10的包含率为37．5％。相似文献