期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	5篇
免费	0篇
国内免费	1篇

专业分类

现状及发展	1篇
综合类	5篇

出版年

2009年	1篇
2007年	1篇
2006年	2篇
2005年	1篇
2004年	1篇

排序方式： 共有6条查询结果，搜索用时 9 毫秒

基于关键词提取的娱乐新闻文档去重算法

沙芸张国英孟凡亮《广西师范大学学报(自然科学版)》2007,25(2):30-33

去除内容相同或相近的新闻是提高搜索引擎的关键技术之一.提出一种基于关键词提取的新闻去重算法,通过以标题为种子点构建词汇链的方法,能够找到对主题贡献大的非高频词,从而抽取出完整文档关键词集合,该方法能够基于小规模语料库识别新词;为了提高网页去重速度和质量,基于关键词建立去重倒排文档.实验结果显示,该方法与传统方法相比排斥错误率降低了5%,去重时间缩短了20%～30%. 相似文献

基于词间语义相关度的搜索结果聚类算法 总被引：1，自引：1，他引：0

沙芸张国英《郑州大学学报(理学版)》2009,41(1)

将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词间语义相关度的搜索结果聚类算法,该算法以词为聚类的核心,词所出现的文档为词的属性,根据词在搜索结果文档中共现的情况来划分类别.该方法可以充分利用词间的语义相关性,类别划分后即可确定类名.实验结果表明,对搜索结果聚类时与K-Means和STC算法相比,质量上有所提高. 相似文献

基于属性相似度的云分类器 总被引：4，自引：0，他引：4

张国英沙芸余有明刘玉树《北京理工大学学报》2005,25(6):499-503

提出了属性相似度概念解决高维对象分类的权重问题,并结合云理论建立了基于属性相似度的云分类器.采用云理论建立训练集的各属性模型,表达各属性值隶属于其类别中心Ex的程度.分类模型由属性模型集成得到,属性权重根据属性相似度计算.各类别的同一属性间的相似度越大,此属性对分类的作用越小.基于粒子群优化方法对分类模型的中心位置Ex进行优化.将此分类器与普通云分类器应用于iris数据集的分类实验,该分类器的分类效果好于后者. 相似文献

关于二维图像Euler数新公式的证明 总被引：3，自引：0，他引：3

林小竹沙芸籍俊伟王彦敏《中国科学(E辑)》2006,36(4):429-436

Euler数是拓扑学的重要特征参数，在二维数字图像中，由局部性质计算图像Euler数的公式，对于4-连通和8-连通是不同的．在定义图段和相邻数概念的基础上，提出了由局部性质计算二值图像Euler数的一种新公式，并证明了该公式在4-连通和8-连通情况下都能成立．为局部计算二维图像的Euler数提供了新的思路．相似文献

模式识别中基于Boosting的特征筛选

张国英沙芸刘玉树《北京理工大学学报》2004,24(7):613-616

提出了一种基于Boosting的特征筛选算法.根据Boosting分类训练时的训练错误率、训练过程中错误率的收敛速度以及测试错误率确定特征影响因子;利用这些影响因子对待识别目标的特征进行排序,去除冗余特征,以降低特征空间的维数.对于筛选后保留的特征,根据其影响因子进行加权,以提高目标识别的准确率.用该方法可避免其它分类学习器训练时的过学习现象,生成的分类器模型小,识别速度快,适用于对特征不易确定的目标识别. 相似文献

基于粒子群优化的快速KNN分类算法

张国英沙芸江慧娜《山东大学学报(理学版)》2006,41(3):34-36

提出了一种有效的快速ｋ近邻分类文本分类算法,即PSOKNN算法，该算法利用粒子群优化方法的随机搜索能力在训练文档集中进行有指导的全局随机搜索. 在搜索ｋ近邻的过程中，粒子群跳跃式移动，掠过大量不可能成为ｋ近邻的文档向量，从而可以快速找到测试样本的ｋ个近邻. 以Reuters 21578文档集分类为例验证算法的有效性，结果表明，保持ｋ近邻法分类精度，新算法比KNN算法降低分类时间70％. 相似文献