共查询到18条相似文献,搜索用时 62 毫秒
1.
分析了Web文档的结构特征,并利用知识树快速高效等特征,设计了Web文档知识树;基于Web文档知识树结构,提出了构建Web文档知识树的构造算法、创建知识结点算法以及知识树访问算法.并对上述算法作了分析和评价,说明了这些算法对提高Web信息检索的准确率以及信息查找的速度是有益的. 相似文献
2.
在分析不规范书写的Web网页的DOM树存在的树深度大、结点层次多、结点层次和子树间关系错误等问题的基础上,提出了一种容错的Web网页语义树构造方法,为文本分类与聚类、网络社区发现、Web主题信息的提取和基于主题的Web信息检索等技术的研究工作奠定了基础. 相似文献
3.
数据采掘是数据库中知识发现的核心 ,概念树方法是数据采掘较常用的方法之一 ,该文详细描述了该方法在模糊性问题中的应用 相似文献
4.
通过阐述Web知识挖掘:搜索引擎的现状、原理及分类,指出了传统搜索引擎存在的不足,介绍了一种基于概念搜索的Web知识挖掘:智能搜索,并对其原理及基本实现进行了简要说明.在此基础上,提出了智能搜索的研究动向. 相似文献
5.
介绍了向量空间模型中文档向量及查询向量的表示,以及索引同一文档矩阵的含义,在此基础上讨论了索引词权重的计算公式及选择方法(特征提取)。 相似文献
6.
利用二元树复小波变换(DT CWT)良好的方向选择性和矩阵奇异值分解(SVD)的稳定性,作者提出了一种新的特征提取方法并用于车牌汉字识别.实验证明该方法比二维实小波变换具有更好的识别效果 相似文献
7.
信息检索向量空间模型中特征提取的研究 总被引:8,自引:0,他引:8
介绍了向量空间模型中文档向量及查询向量的表示,以及索引词-文档矩阵的含义,在此基础上讨论了索引词权重的计算公式及选择方法(特征提取). 相似文献
8.
李政 《云南民族大学学报(自然科学版)》2011,20(1):53-57
通过二元树复小波变换对图像进行4尺度分解,提取每一尺度下代表6个方向的高频带子图小波系数模的均值和标准方差组成48维的特征向量,利用支持向量机的一对一多分类算法对Brodatz图像库中的112幅图像进行了纹理特征提取和分类实验,结果表明二元树复小波变换提取的图像特征能有效提高图像的分类精度. 相似文献
9.
针对Web上的公共生物学数据资源,提出一种适合于在线搜索生物学数据的数据模型.该模型基于后缀树思想,通过建立生物体的DNA、RNA、蛋白质序列数据的后缀树结构,并将之转化为更加空间有效的后缀数组,然后搜索数组以找到查询序列的近似匹配.结果表明,这种数据模型比常规的线性搜索模型在时间和空间开销上更加高效. 相似文献
10.
依据机器学习理论,提出一种手写汉字识别中的特征提取方法,以及将判定树归纳学习算法应用于学习识别过程,使得特征提取和识别同时进行.依据判定树有选择地提取特征进行匹配,可减少特征提取的数量,提高识别速度. 相似文献
11.
一种新的Web链接提取模型 总被引:4,自引:0,他引:4
以搜索引擎链接提取模块所要求的容错性、正确性、全面性、高效性和可扩展性为目标,提出了一种新的链接提取模型的设计思路。该模型将链接提取过程划分为信息提取、信息加工、信息分析和信息储存。信息的获取是通过HTM L(hypertex t m arkup language)文法分析方法从文档中得到初始统一资源地址(un iform resourceiden tifier,UR I)数据;信息加工阶段通过运用UR I解析算法对初始数据进行精练;然后在信息分析过程中进一步加以筛选和过滤;最后将结果存储在一个灵活的数据结构中。通过对比测试证实这种新的链接提取模式比传统方法在各项指标上均具有明显优势。 相似文献
12.
Web信息查询研究进展 总被引:2,自引:1,他引:2
Web上大量、分布、动态的信息,造成了用户在查询Web上的信息时产生的"信息过载”和"信息迷向”现象.Web信息检索与查询是目前的研究热点,本文分析和比较现有Web信息检索和查询语言技术的发展现状,介绍了基于人工智能领域中机器学习方法的Web信息检索和查询以及信息抽取技术的研究,以供研究者参考. 相似文献
13.
搜索引擎使用技巧 总被引:1,自引:0,他引:1
蒋福兰 《科技情报开发与经济》2003,13(5):178-179
对如何正确选用关键词,利用适当的搜索引擎在Internet搜索所需要的信息作了简要介绍。 相似文献
14.
WEN Kun-mei LU Zheng-ding LI Yu-hua SUN Xiao-lin 《武汉大学学报:自然科学英文版》2006,11(1):11-14
0 IntroductionTIon tceorpneet w ,itthhefr cerqauwelnetr sch oafn sgeeasr cohf tehneg iinnfeo rnemeadti toon uopnd tahteethe web pages visited. Different pages have different changefrequencies[1].Sothe crawlers must firstly esti mate which pa-ges need to b… 相似文献
15.
简析搜索引擎中网络爬虫的搜索策略 总被引:4,自引:0,他引:4
刘世涛 《阜阳师范学院学报(自然科学版)》2006,23(3):59-62
随着网络信息的迅速发展,搜索引擎已成为人们获取有用信息必不可少的工具.以何种策略有效地访问网络资源是专业搜索引擎中网络爬虫研究的主要问题.本文对搜索引擎中网络爬虫的搜索策略进行简要分析,比较各种搜索算法的优缺点,总结提高搜索效率的因素,使人们对网络爬虫的搜索算法有个大概了解,以及对新一代搜索引擎的期望,以便更快捷获取自己需要的信息. 相似文献
16.
17.
李霞 《玉林师范学院学报》2011,32(4):152-156
网络上的教育信息资源呈逐步上升的趋势,其主要分布于综合性网站、教育机构网站、网络数据库网站、学科门户网站和个人网站中。本文从五个方面概述了互联网教育信息资源的检索方法与技巧:利用教育机构网站查找、从综合性网站的分类目录中查找、利用搜索引擎查找、从网络数据库系统查找、利用学科门户网站查找。 相似文献
18.
彭莲好 《科技情报开发与经济》2009,19(20):44-46
高效使用搜索引擎的策略与技,虿包括了解搜索引擎的类型和特点;选择合适的搜索引擎;选用恰当准确的关键词;使用高级搜索语法或高级搜索界面;利用网页快照、相关搜索、类似网页;养成良好有效的搜索习惯等. 相似文献