首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 79 毫秒
1.
Web图像是网络资源的重要组成部分,研究Web图像搜索方法对充分利用网络资源具有实践意义.提出一种面向专题领域、综合利用关键词和基于内容特征的搜索方法,以此为基础设计Web图像搜索系统,给出了系统结构和图像检索的关键算法,实现了原型实验系统.经初步实验表明,该系统在专题领域具有较高的图像检索准确率.  相似文献   

2.
基于Morphology处理和主题词抽取的垃圾邮件过滤方法   总被引:4,自引:0,他引:4  
考虑到垃圾邮件预处理的重要性,提出了利用Morphology对垃圾邮件内容进行还原.为了提高邮件分类的性能,对邮件进行主题词抽取,并且结合邮件其他的属性特征,利用贝叶斯方法对邮件进行分类.实验表明,这种基于Morphology处理和主题词抽取的垃圾邮件过滤方法十分有效.  相似文献   

3.
基于Dempster-Shafer证据理论的虹膜图像分类方法   总被引:6,自引:0,他引:6  
为了提高虹膜图像的分类率,提出了一种基于证据理论的虹膜图像分类方法.该方法利用虹膜图像的纹理变化信息来提取虹膜灰度信号的比率特征,并结合证据理论实现了虹膜图像的决策分类,降低了不确定性因素对图像分类的影响,提高了分类率.在相同的实验条件下,对不同数量的虹膜图像进行了实验验证,结果表明,该方法在保持了分类稳定性的同时,其分类率比直方图交叉分类方法和直方图比率特征分类方法分别提高了6.96%和4.44%.  相似文献   

4.
文中针对大规模Web文本信息的结构与内容特征提出一种高效的Web文本分类方法。该方法主要包含3个模块:(1)针对Web长文本提出一种基于复杂网络的特征选择方法,网络中的节点对应于文本中的词条,通过节点的度与聚集系数来衡量对应词条的重要性从而选择特征词;(2)对于Web长文本,提出基于k NN的SVM决策树分类方法,将支持向量机与k最近邻相结合,并构建决策树实现层次化分类;(3)对于短文本,通过构建长文本各类别的主题词集合来引导短文本的分类,将短文本的归类问题转化为基于主题的检索问题。实验结果表明该方法在处理大规模Web文本时表现出了较好的性能。  相似文献   

5.
基于最小最大概率机的虹膜图像分类方法研究   总被引:2,自引:2,他引:0  
为了提高虹膜图像分类的准确性和稳定性,提出了一种基于最小最大概率机的虹膜图像分类方法.该方法通过控制错分概率实现分类的最大化,将一般的二维分类问题扩展到虹膜特征的多维空间,并利用最小最大概率机的高维映射泛化特性,实现了不同核函数下的虹膜图像多维分类问题,具有分类准确率高、稳定性好的特点.通过虹膜图像库的实验验证表明,该方法在保持分类稳定性的同时,获得了径向基核函数高达98.55%的分类率,该分类率比最近特征线方法和相异度函数方法的分类率分别提高了4.47%和6.41%.  相似文献   

6.
用支持向量机实现尺度和旋转不变性纹理分类   总被引:3,自引:0,他引:3  
提出了一种简单的尺度和旋转不变性纹理分类方法.首先使用对数-极坐标变换对要分类的各纹理图像进行变换,生成对数-极坐标图像;然后以对数-极坐标图像的正则化以后的行投影数据向量构成纹理图像的特征向量;最后运用支持向量机实现尺度和旋转不变性纹理图像的分类.实验结果表明,该方法在尺度和旋转不变性纹理图像的分类中,准确率可达90%以上.  相似文献   

7.
互联网的电商中存在着大量的评论信息,这些带有主观情感色彩的评论信息不仅反应了客户对产品的满意程度,而且暗含了市场产品的流行趋势。针对评论信息中所蕴涵的相关主题词,提出了将文本分类和主题词挖掘相结合的方法。该方法首先使用SVM对情感进行分类,再通过 LDA 模型进行建模对分类后的评论信息挖掘主题词。真实数据集上的实验结果验证了本文方法的有效性,获得了良好的分类结果,能够准确地挖掘出主题词。
  相似文献   

8.
多光谱图像分类方面,由于普通的SVM方法没有考虑多光谱图像具有高维度和冗余的特点,因此难以实现令人满意的分类精度.本文提出了一种基于SVM和主成分分析相结合的多光谱的图像分类方法.并用5幅6波段两类地形的多光谱图像进行实验.实验结果表明,这种分类方法与普通的SVM方法相比提高了多光谱图像的分类精度.  相似文献   

9.
研究并提出了基于Hyperlink聚类的分类算法,它不需要分析Web文档内容,只根据Web图来聚类,算法性能比传统文本分类方法有很大提高,大大增强了网页分类的能力和效率,适合于海量网页分类,实验表明基于Hyperlink聚类的分类算法,应用于Web文档信息分类,比传统的文本分类方法更加有效。  相似文献   

10.
根据Web文档分类与人工神经网络理论,设计了一个Web分类挖掘系统。针对BP网络分类器的不足,提出了用径向基函数神经网络对Web页面中的文本信息进行分类的方法。实验初步证明,用径向基函数进行分类比BP算法构造的神经网络更具准确性,有效地提高了分类的正确率。  相似文献   

11.
《土力学》网络课件的设计与开发   总被引:1,自引:0,他引:1  
根据土力学教学大纲的要求,应用计算机网络技术,设计开发了《土力学》多媒体网络课件,课件采用文本、图像、动画等多种形式,形象直观地表现了土力学中难以描述的抽象内容。本文论述了课件的设计原理和方法以及课件系统开发的全过程。  相似文献   

12.
随着计算机网络与信息技术的迅速发展 ,广大用户对网上资源信息检索的质量提出更高要求 ,其关键因素是信息的自动处理和控制能力 ,电子叙词表建构及其计算机管理是提高信息检索质量的重要保证 .文中建立了叙词表、叙词关系表、停用词表以及范畴索引、词族索引 ,并给出了具体实现的数据结构与算法 .实践表明 ,以词表知识概念控制的自动处理技术极大地提高了信息检索的质量  相似文献   

13.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

14.
基于同义词词林的中文文本主题词提取   总被引:3,自引:0,他引:3  
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明,用该方法对中文文本  相似文献   

15.
服装款式复杂多变,而目前服装情感描述大多是定性描述,对各类服装的情感描述词也未进行系统分析.建立服装情感空间是实现计算机对服装图像情感识别及量化评价的重要前提.通过对男西装情感描述词的筛选、投票、初步确定、相关性分析、因子分析等过程进行了研究,最后得出一个2维的男西装情感因子空间,这样每幅图像对应着该因子空间上的2维坐标值,使得在因子空间上定义男西装图像间的情感相似度和对男西装图像按情感相似性进行评估和索引成为可能,为下一步实现男西装图像情感的机器评估和图像情感语义识别、检索奠定了基础.该方法同样可以扩展到其他类别的服装.  相似文献   

16.
可及性是认识主体达到某一指称对象的难易程度。英汉指称形式存在共性,也有以下显著差异:英语中的代词和汉语中的零代词具有相同的可及性,而且汉语中处于主题位置上的代词和指示词语也具有高可及性;英语中的指示代词主要出现在中距离篇章语境中,是中可及性标示语,汉语中的中可及性标示语通常由宾语位置上的代词和指示词语充当;英汉语中,专有名词和有定描述语尽管同属于低可及性标示语,但仍存在差异。上述各方面差异,给英汉互译造成障碍,可通过分析其异质性表现来探索互译策略。  相似文献   

17.
以首都图书馆北京地方文献中心为例,对以地方文献馆藏为基础开发的专题数据库进行了介绍,并探讨了由专题数据库搭建网站开展网络信息服务的模式。  相似文献   

18.
题元角色与及物性参与者对比分析及研究   总被引:1,自引:0,他引:1  
题元角色反映了受动词支配的名词之间的语义关系,是句法和语义的接口。与题元角色不同的是,参与者是功能语言学及物性系统的一个重要组成部分,是构成及物性过程不可缺少的要素之一。但两者都用于语义分析,存在某种联系。本文目的在于分析两者的理论基础,初步探讨两者之间在理论框架,角色划分和角色之间关系等方面的异同。  相似文献   

19.
针对元搜索的重复网页问题,提出基于元搜索的网页去重算法,并通过实验对算法进行有效性验证。该算法首先对各成员搜索引擎返回来的结果网页的URL进行比较,然后对各结果网页的标题进行有关处理,提取出网页的主题信息,再对摘要进行分词,计算摘要的相似度,三者结合能很好的检测出重复网页,实现网页去重。该算法有效,并且比以往算法有明显的优势,更接近人工统计结果。  相似文献   

20.
针对传统通用网络信息采集系统自身固有的缺陷,根据语义分析的相关理论,本文提出了基于语义的网络爬虫的相关模型,该模型构建知识概念集合,并对其进行关键字切割与划分,生成能表达主题的主题关键词集合。结合中国《知网》的相关理论与技术,对传统抓取的网页在语义的角度进行分析,对已抓取的网页页面内容及其中链接的扩展元数据等相关信息进行分词及语法语义等相关处理,获取网页内容关键词集合及超链接的关键词集合,然后分别对获取的网页内容关键词与链接关键词进行与主体关键词集合采用语义分析算法进行语义相关性的判定,保存需要的网页,并预测及提取与主题相关的URL,从而提高网络资源信息采集相关率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号