排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
提出语素词的采集方法,在统计的基础上采用语法跟语义分析相结合的方法,分类来提取语素字,并且对语素字内部的兼类情况进行了分析,采用基于范例的推理方法提取兼类语素字。 相似文献
2.
由于超链接语言结构本身所提供的信息,网页分类问题不同于一般的文本分类。本文分析了网页内部特征,并在1000篇网页规模语料库的基础上,通过试验对比了三种特征选择方法对高维特征向量空间进行降维的效果。文章还提出了一种新方法,根据特征项所处的位置赋予不同权重的方法,实验表明这种由文本结构导出的权重计算方法能够取得很好的分类效果。 相似文献
3.
4.
5.
人称代词消解是文本信息处理中的一项重要任务,目前,网络上大量涌现关于突发事件的新闻,针对这类语料的人称代词消解技术可以帮助实现网页文本的信息处理。分析了中文突发事件语料中人称代词的特点,提出一种基于语料库,运用最大熵模型与规则预处理方法结合的代词消解方法。实验表明,利用该方法,可使测试语料上算法的F值达到70.9%。 相似文献
1