首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 170 毫秒
1.
环球信息网(WWW,即World Wide Web)是一个基于Internet的、全球连接的、分布的、多平台的交互式图形超文本信息系统。它利用多种协议去传输和显示驻留在世界各地计算机上的多媒体信息源,与WWW服务器一起为Internet提供“分布式客户/服务器”的运行环境。由于WWW  相似文献   

2.
1.在WWW上查询企业新品信息的方法 1.1 WWW信息源及其特点 WWW(World Wide Web):中文译名环球网、全球网或万维网,采用客户机/服务器结构,以其联网简单(http)、超文本连接(Hypedinks)、标准格式、规模大小可伸缩、多媒体、浏览界面  相似文献   

3.
WWW即全球广域网(万维网),它是一个包含各种信息的无限网络。整个网络的形成需要许多的技术要素,诸如URI、HTTP、HTML等。我们主要介绍的是HTML(HyperText Markup Language)。HTML可以让我们自如地在各种不同的资源之间进行切换,它已成为一种在网络上使用的事实标准。而TML4.0将原先的HTML语言扩展到一些全新的领域,使如我们讨论的动态网页技术,讨论一些利用HTML设计完全动态网页的技术,并看几个设计的实例。  相似文献   

4.
嵌入式Internet的设计中,Embedded Web Server的实现关键在于使系统支持HTTP(超文本传输协议),嵌入式HTTP服务器是控制网络的关键设备,也是实现设备Internet远程监控的关键技术,本论文对HTTP协议进行了分析,对任务函数进行了设计,实现了单片机系统接入Internet设计中Embedded Web Server的实现.  相似文献   

5.
季凤 《科技信息》2009,(26):233-236
www的工作基于客户机/服务器计算模型,由Web浏览器(客户机)和Web服务器(服务器)构成,两者之间采用超文本传送协议(HTTP)进行通信。HTTP协议的作用原理包括四个步骤:连接,请求,应答,关闭。根据上述HTTP协议的作用原理,本文实现了GET请求的Web服务器程序的方法,通过创建Server Socket类对象,监听端口8080;等待、接受客户机连接到端口8080;创建与socket字相关联的输入流和输出流:然后读取客户机的请求信息,若请求类型是GET,则从请求信息中获取所访问的HTML文件名,如果HTML文件存在,则打开HTML文件.把HTTP头信息和HTML文件内容通过socket传回给Web浏览器,然后关闭文件,否则发送错误信息给Web浏览器。最后,关闭与相应Web浏览器连接的socket字。  相似文献   

6.
谭锋 《科技资讯》2011,(7):5-5,7
针对在Web信息抽取系统开发中遇到的关键性技术问题,如Web页的HTML文档下载,HTML到XML格式转换,XML文档清理等,分析和探讨了基于.NET技术的编程实现方法.  相似文献   

7.
全国科学技术名词审定委员会推荐名 信息科学技术  部分名词 1998年7月公布 序号中文推荐名英文名注释 98. X. 13超文本传送协议hypertext transfer protocol, HTTP用于万维网(WWW)的通信协议,在可靠的底层连接的基 础上,通过该协议可以在应用层传输纯文本、超文本以及 各种格式的多媒体信息,还可以转发其他因特网应用层协 议的消息,是因特网协议族中应用非常广泛的应用层协议 之一 98. X. 14函件分发器mail exploder又称"邮件分发器". 电子函件系统的一个部件,它把收 到的每个函件信息的一个拷贝发送给函件发送地址表的 每个地址 98. X. 15发函清单mailing list又称"邮件发送清单". 包含许多接收者地址的一个电 子函件列表文件. 因特网上通常简称清单,主要用来进行 信息发布 98. X. 16多播multicast网络中使用的一种传输方式,它允许把所发消息传送给所 有可能目的地中的一个经过选择的子集 98. X. 17单播unicast网络中使用的一种传输方式,它只允许把所发消息传送给 单个目的地 98. X. 18网络信息中心network information center, NIC为用户提供网络信息资源服务的网络技术管理机构. 主 要职责是对网上资源进行管理和协调,例如: 域名管理、应用软件管理和提供、技术支持和培训,以及多样化信息服务的开展等  相似文献   

8.
Web文本挖掘中的一种中文分词算法研究及其实现   总被引:3,自引:0,他引:3       下载免费PDF全文
针对Web文本挖掘中的中文信息处理的问题,介绍了将超文本格式(Html格式)的文档转化为纯文本格式(Txt格式)文档的方法.利用改进的最大匹配法来实现对文档的汉语自动分词,同时,加强消除歧义方面的处理,分词精度有所提高.  相似文献   

9.
随着HTML格式的出现,Internet得到了迅猛发展,面对着浩瀚如烟的数据,为了从中发现潜在的、有价值的信息,必须对Web信息进行挖掘,但由于HTML语言特点,使得Web信息的组织结构性很差,对于进行Web数据挖掘工作有很大的阻碍,XML语言的出现从根本上解决了这个问题,XML语言具有良好的结构,层次性好,用其对Web页面信息进行组织,有利于进行数据挖掘工作。  相似文献   

10.
基于MEDL模型提出了一种以内容为导向的,将HTML转换为XML数据的方法.在该方法中,根据网页中值域和属性域的识别,并结合MEDL模型对HTML中的数据进行提取,并将其转换为符合要求的格式.该方法具有提取信息精确、转换格式统一等优点,且具备很好的扩展性,能够为深入开展Web数据挖掘提供很好的支持.  相似文献   

11.
Internet网络中的WWW系统及HTML语言张月琳,姚卓英,陈滢(东南大学信息中心,南京210018)环球信息网WWW(WorldWideWeb)是分布式的超文本信息检索系统,采用客户机/服务器模式,客户机与服务器之间采用超文本传输协议HTTP(...  相似文献   

12.
基于条件随机域的Web信息抽取   总被引:1,自引:0,他引:1  
为了获取隐藏在Internet中的信息,基于条件随机域模型(CRF),提出了一种Web信息抽取的方法。该方法对网页样本中的每一行加注标签,确定文本特征,建立条件随机域模型,采用拟牛顿迭代方法对样本进行训练,参照学习得到的条件概率分布模型,实现网页搜索结果的抽取。与HMM模型相比,CRF模型支持网页文本的语言特征,抽取准确率高。实验结果表明,使用CRF模型的抽取准确率达到90%以上,高于使用HMM模型的抽取准确率。  相似文献   

13.
嵌入式Web服务器开发过程中,超文本传输协议作为互联网上应用最为广泛的一种网络协议.为了在嵌入式系统中更好的处理Web服务器与浏览器应用,对HTTP协议进行了分析实现.  相似文献   

14.
基于DOM树及行文本统计去噪的网页文本抽取技术   总被引:1,自引:0,他引:1  
首先对网页源码文本统一编码转为UTF格式,然后把HTML网页文档转换为XML文档并解析为一棵DOM树。依据XML语言特点及噪声特征规则先对DOM树的噪声节点进行过滤删除,然后依据中文标点符号统计方法提取网页正文内容,并在此基础上利用行文本统计方法去除提取出的正文中存在的噪声信息,最后得到网页正文文本。对来自结构完全不同的主流与非主流的中英文新闻网站上的2 000篇网页进行实验,结果表明本文提出的方法具有较高的抽取准确率,并具有很好的通用性和实现简单的特点,适用于针对互联网中不同网站新闻文本信息的自动采集。  相似文献   

15.
随着Internet的普及,Web信息量爆炸性的增长,数以亿计的Web页面形成了内容丰富而庞杂的WWW资源,如何从海量的数据中高效、高质量地检索到用户所感兴趣的信息资源是当前我国Internet资源挖掘的热点问题之一. 将基于模糊逻辑的聚类算法FK prototype引入到Web信息搜索中,改良了传统方法一刀切的 分类处理方式,从而有效地提高了Web文档的检索质量.  相似文献   

16.
Internet的发展影响了每个人的生活 .WWW应用的开发 ,从HTML编程、CGI编程、基于数据库的直接WWW编程到构件技术以及流媒体技术的应用 ,都代表了Internet发展的重要阶段 .Java技术的发展更是与Internet发展相辅相成 .本文介绍了流媒体技术的相关概念 ,分析了B/S(Browser/Server)结构和三层结构的原理特点 ,对音频视频课件系统的总体框架和主要实现技术做出了详细的说明 .  相似文献   

17.
针对电子商务Web网站中HTML页面传输问题,分析了基于HTML文本的信息隐藏方法.根据标记属性赋值符左右两边空格特性,使用C++语言实现了信息隐藏算法和信息提取算法,该方法具有一定的实际意义.  相似文献   

18.
CSS将网页上的内容和格式分开控制,能够简化网页的格式代码.但目前网页布局多用表格、层等,CSS元素多是嵌入到HTML标记中使用,不能自如地改变网页的版面布局,也不能充分发挥CSS在版面布局中的强大作用.WEB信息网页的制作日益成为大众化的技术,对于电子信息管理人员来说,掌握这门技术已经成为趋势.介绍通过使用HTML的DIV标记和CSS设计易于改版的信息网页的方法.  相似文献   

19.
含有位置坐标树的Web页面分析和内容提取框架   总被引:6,自引:0,他引:6  
随着Internet的发展,Web上信息呈爆炸式增长趋势,呈现方式也愈发多种多样,这就给信息检索、信息提取等计算机处理带来了巨大困难.针对HTML的半结构化特征和DOM缺乏位置信息的不足,该文提出了一种新型的Web页面分析和内容提取框架,该框架既包括一种新型的含有位置信息的坐标树模型,还包括能反映空间关系的图模型,将HTML文档转换为坐标树,并结合位置特征和空间关系对网页进行分析和提取内容.对来自120个网站的5 000个网页进行测试后的结果表明该方法可达到93.78%的准确率.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号