排序方式: 共有32条查询结果,搜索用时 31 毫秒
1.
首次提出利用URL-Key进行领域术语识别的方法。以URL作为媒介, 借助已知URL-Key的领域性来判断未知领域候选术语的领域性。首先, 借助互联网中已有的人工分类领域URL, 根据URL-Key在各领域汇总使用的频度, 采用基于方差的领域URL-Key识别方法, 构建领域URL-Key词表; 然后, 利用伪反馈技术, 收集候选领域词检索得到的URL结果集, 根据URL结果集构建候选领域术语的URL-Key特征向量; 最后, 利用SVM对候选领域术语进行提取。在4个领域进行实验, 都取得不错的效果。新提出的方法可以有效地解决低频术语识别问题, 为低频术语的识别提供新的思路。 相似文献
2.
一种新的Web链接提取模型 总被引:4,自引:0,他引:4
以搜索引擎链接提取模块所要求的容错性、正确性、全面性、高效性和可扩展性为目标,提出了一种新的链接提取模型的设计思路。该模型将链接提取过程划分为信息提取、信息加工、信息分析和信息储存。信息的获取是通过HTM L(hypertex t m arkup language)文法分析方法从文档中得到初始统一资源地址(un iform resourceiden tifier,UR I)数据;信息加工阶段通过运用UR I解析算法对初始数据进行精练;然后在信息分析过程中进一步加以筛选和过滤;最后将结果存储在一个灵活的数据结构中。通过对比测试证实这种新的链接提取模式比传统方法在各项指标上均具有明显优势。 相似文献
3.
宁建飞 《海南大学学报(自然科学版)》2012,30(4):354-359
通过处理和研究Web日志,得到多数用户感兴趣的页面URL和具有相近访问爱好的用户群体,对站点的结构是否适合用户作出判断并进行相应的调整,从而实现对用户的个性化服务. 相似文献
4.
姚增伟 《天津理工大学学报》2001,17(Z1):80-82
IIS是Internet Information Server的缩略词,意思是国际互联网络信息服务器.当创建一个 IIS 应用程序时,应当牢记几个因素.这些因素包括决定一个一致的目录结构;可使您的部署工作顺利进行而使用的路径;考虑 Web 应用程序独特的漫游特性.本文将对这些因素加以讨论并提出相应的程序设计原则. 相似文献
5.
针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key。然后结合伪相关反馈技术,选取URL-key为特征,构建URL-key向量,利用SVM对查询串进行分类。实验结果表明,该方法不仅F值比对比方法提高7%,而且资源的使用也远远小于对比方法,提高了系统的时效性。 相似文献
6.
针对反向代理应用中存在着的网页内嵌URL问题,提出了前置URL控制机制,构建了该机制的总体模型,包括URL定向模块、预分析器、HTML/XML解析器、URL修改模块和COOKIE修改模块各部件.论述了模型的核心技术--动态脚本的HTML解析和XSL/XML联合解析,提出了异地代理的解决方案.在Apache/Linux下实现了该模型原型,对其功能进行了完整测试,包括性能负载测试,测试结果表明该机制能高效地完成预期目标. 相似文献
7.
8.
信息过滤代理模型设计与实现 总被引:1,自引:0,他引:1
简要论述了WWW信息检索的现状并给出了一个检索智能代理模型的总体设计及其中的信息过滤信息模型设计与实现。 相似文献
9.
袁雪松 《大庆师范学院学报》2005,25(4):74-78
在“数字地球”概念发展的驱动下,利用GPS系统和宽带无线网络系统,把GPS定位坐标作为互联网的统一资源定位器(URL),使现实空间点成为可以存储和发布数据的信息点,建立了一种全新的网络信息浏览和发布方式;论述了GPS系统与无线网络系统的整合方式,探讨了基于GPS的三维因特网超文本信息系统实现的原理和关键问题,最后指明这一全新的技术具有巨大的潜力和广阔的应用前景。 相似文献
10.
网上图书馆 总被引:3,自引:0,他引:3
韩上霞 《青岛大学学报(自然科学版)》1999,12(2):94-98
本文介绍了部分国内外著名的公共图书馆和专业图书馆网络资源,并列出这些图书馆的WWW和GOPHER网址,使广大信息查询者更好地利用国际互联网检索资料 相似文献