排序方式: 共有3条查询结果,搜索用时 46 毫秒
1
1.
2.
针对传统查询词临近性(QTP)分析方法无法有效提高查准率的问题,提出了一种孤立项过滤的信息检索查询词分析方法.该方法根据词汇相似度较高的查询词对之间具有强可替代性这一事实,从查询词及其实例中分解出查询内的孤立项和文档内的孤立项,在分析查询词临近性之前预先进行孤立项过滤,使之不参与QTP统计量的计算,由此减小了过分强调临近性对查准率的影响.实验结果表明,对于词汇相似度差异比较显著的查询,进行孤立项过滤的查询词临近性分析方法的平均检索精确度比传统分析方法提高14%. 相似文献
3.
一种高稳定性词汇共现模型 总被引:1,自引:0,他引:1
针对传统词汇共现模型存在的缺乏理论基础和稳定性欠佳等问题,提出了一种基于项场的高稳定性词汇共现模型.借鉴经典物理学中场的概念给出了项场的定义,其中项是语言的基本单位,是概念的抽象描述,而项场则是项在文档中的影响范围.在此基础上,引入量子场论将项与项的相关度类比为项场的叠加,由此给出了项与项之间距离和相关度的函数关系,并用其建立了词汇共现模型.实验结果证明,在小距离的情况下,所提模型中项的相关度大体呈常数,具有一定的窗口内稳定性,而同范畴的项对相关度振幅只有对照模型中最小振幅的26%,表明它具有较好的数据集稳定性. 相似文献
1