首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   5篇
  免费   0篇
  国内免费   1篇
现状及发展   1篇
综合类   5篇
  2009年   1篇
  2007年   1篇
  2006年   2篇
  2005年   1篇
  2004年   1篇
排序方式: 共有6条查询结果,搜索用时 9 毫秒
1
1.
去除内容相同或相近的新闻是提高搜索引擎的关键技术之一.提出一种基于关键词提取的新闻去重算法,通过以标题为种子点构建词汇链的方法,能够找到对主题贡献大的非高频词,从而抽取出完整文档关键词集合,该方法能够基于小规模语料库识别新词;为了提高网页去重速度和质量,基于关键词建立去重倒排文档.实验结果显示,该方法与传统方法相比排斥错误率降低了5%,去重时间缩短了20%~30%.  相似文献   
2.
基于词间语义相关度的搜索结果聚类算法   总被引:1,自引:1,他引:0  
将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词间语义相关度的搜索结果聚类算法,该算法以词为聚类的核心,词所出现的文档为词的属性,根据词在搜索结果文档中共现的情况来划分类别.该方法可以充分利用词间的语义相关性,类别划分后即可确定类名.实验结果表明,对搜索结果聚类时与K-Means和STC算法相比,质量上有所提高.  相似文献   
3.
基于属性相似度的云分类器   总被引:4,自引:0,他引:4  
提出了属性相似度概念解决高维对象分类的权重问题,并结合云理论建立了基于属性相似度的云分类器.采用云理论建立训练集的各属性模型,表达各属性值隶属于其类别中心Ex的程度.分类模型由属性模型集成得到,属性权重根据属性相似度计算.各类别的同一属性间的相似度越大,此属性对分类的作用越小.基于粒子群优化方法对分类模型的中心位置Ex进行优化.将此分类器与普通云分类器应用于iris数据集的分类实验,该分类器的分类效果好于后者.  相似文献   
4.
关于二维图像Euler数新公式的证明   总被引:3,自引:0,他引:3  
Euler数是拓扑学的重要特征参数,在二维数字图像中,由局部性质计算图像Euler数的公式,对于4-连通和8-连通是不同的.在定义图段和相邻数概念的基础上,提出了由局部性质计算二值图像Euler数的一种新公式,并证明了该公式在4-连通和8-连通情况下都能成立.为局部计算二维图像的Euler数提供了新的思路.  相似文献   
5.
提出了一种基于Boosting的特征筛选算法.根据Boosting分类训练时的训练错误率、训练过程中错误率的收敛速度以及测试错误率确定特征影响因子;利用这些影响因子对待识别目标的特征进行排序,去除冗余特征,以降低特征空间的维数.对于筛选后保留的特征,根据其影响因子进行加权,以提高目标识别的准确率.用该方法可避免其它分类学习器训练时的过学习现象,生成的分类器模型小,识别速度快,适用于对特征不易确定的目标识别.  相似文献   
6.
提出了一种有效的快速k近邻分类文本分类算法,即PSOKNN算法,该算法利用粒子群优化方法的随机搜索能力在训练文档集中进行有指导的全局随机搜索. 在搜索k近邻的过程中,粒子群跳跃式移动,掠过大量不可能成为k近邻的文档向量,从而可以快速找到测试样本的k个近邻. 以Reuters 21578文档集分类为例验证算法的有效性,结果表明,保持k近邻法分类精度,新算法比KNN算法降低分类时间70%.  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号