首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于DOM的半结构化网页信息抽取算法   总被引:1,自引:0,他引:1  
为从不同的半结构化网页中自动提取数据记录,提出了基于DOM和记录子树最大相似度发现记录模武的思想,对信息噪声有较强的过滤功能,在记录模式存在一定差异的情况下也能正确识别记录。在此基础上,实现了多记录网页自动抽取的IESS算法.该系统可以从多个学术论文检索网站中自动获取结果网页。并自动抽取其中的记录。对常见论文检索网站的实验表明了该系统具有较好的有效性和准确性。  相似文献   

2.
基于ISAPI过滤器的网页防篡改系统   总被引:1,自引:0,他引:1  
首先分析了几种常用网页防篡改技术的特点,然后提出并实现了一种基于ISAPI过滤器的网页防篡改系统.该网页防篡改系统可以高效地监控网页内容的变化,对于被篡改的网页文件能在其被用户访问之前自动加以恢复,使用该系统能方便网站的管理,并能帮助网站管理员及时地了解网站信息.  相似文献   

3.
如果你的英文不佳,又想从英文网站获取更多信息,那么1月15日由盈动华建推出的盈华英汉/汉英双语浏览器,或许可以帮助您扫除语言障碍。 在盈华双语浏览器发布会暨盈动华建(北京)科技发展有限公司成立典礼上我们了解到,盈华双语浏览器是香港电讯盈科有限公司和中国科学院直属企业华建集团合作的结晶,它采用了华建集团的机器翻译技术,具有支持多种文本格式的英汉双向自动翻译、电子邮件收发与翻译、网络教育、信息浏览与检索、翻译十寻呼的网络寻呼和网络游戏下载等功能。产品将分为标准、专业和企业三个版本,相关价格正在制定中…  相似文献   

4.
研究了基于频率共现熵的跨语言网页自动分类问题,使用翻译软件将所有中文网页翻译为英文,计算中文和英文网页的共现特征频率共现熵值,确定中文和英文网页的共现知识,并与英文网页相结合训练中文分类模型.实验结果表明,该方法与贝叶斯分类模型、向量空间分类模型和信息瓶颈模型相比体现出良好的性能.  相似文献   

5.
旅游网站的翻译远非语码之间的转换,还应考虑目标浏览者的阅读习惯和需求。结合在自建澳大利亚旅游网站语料库的基础上,从网页构建要素、网页设计、网站文本、网站语言等方面对比分析了澳大利亚旅游网站与中国英文旅游网站的特点,认为中国旅游网站的英译,除了单词句子的文本语境外,更需要考虑网页设计和文本结构这个大语镜。  相似文献   

6.
岳西 《科技信息》2013,(18):280-280
前言英文网站建设是学校信息化建设的重要部分,事关学校的形象。有英文版网站的高职、高专院校为数不多,在进行我校英文网站建设时,主要借鉴一些本科院校的英文网站和国外相关院校的网站来进行设计。虽然先前在相关的IT部门参与过网站建设,但鉴于本次网站建设对本人来说是首次牵头,所以定位没有过高,主要目的就是“在国际上宣传我校”,即贯彻我校“走出去”的方针,技术层次为“静态网页”,主要特点以达到页面表现层清晰为目的,适当加入动态设计内容。  相似文献   

7.
网站的内容组织和管理都是网站设计人员设计的网站后台系统进行设计和管理的,一般的浏览者所看到的网页内容都是由服务器端动态生成后送浏览者的IE或Navigator浏览器。要生成动态网页,对于使用传统网页制作技术的设计者是十分困难的,而使用ASP、Java等动态网页制作技术则可以很好的解决网站开发的瓶颈问题。  相似文献   

8.
基于聚类的智能网页推荐系统研究   总被引:1,自引:0,他引:1  
设计了一种智能网页推荐系统的架构,其中包括数据预处理、聚类分析和网页推荐3个子系统,可以根据网站的访问日志来对用户进行自动分类,进而对网站的新用户在线提供网页推荐。提出了路径间距离的计算方法,进而研究了聚类子系统的结构,并通过对微软网站中用户访问日志的仿真实验,说明了所述方法的有效性。  相似文献   

9.
竖排古文风     
点开网页,如果你看见的内容是竖排版繁体字,那么,不要惊讶,更不要以为是网页出了问题,其实,这是网络新近的流行元素。近日,网络上突然兴起坚排古文风。网友争相传送各种能将一般横排简体字转换成竖排繁体字的软件网站地址。有网友称,  相似文献   

10.
基于DOM树及行文本统计去噪的网页文本抽取技术   总被引:1,自引:0,他引:1  
首先对网页源码文本统一编码转为UTF格式,然后把HTML网页文档转换为XML文档并解析为一棵DOM树。依据XML语言特点及噪声特征规则先对DOM树的噪声节点进行过滤删除,然后依据中文标点符号统计方法提取网页正文内容,并在此基础上利用行文本统计方法去除提取出的正文中存在的噪声信息,最后得到网页正文文本。对来自结构完全不同的主流与非主流的中英文新闻网站上的2 000篇网页进行实验,结果表明本文提出的方法具有较高的抽取准确率,并具有很好的通用性和实现简单的特点,适用于针对互联网中不同网站新闻文本信息的自动采集。  相似文献   

11.
本文对我国特别是合肥高校、政府等企事业单位网站英文版的现状进行了调研分析,从网页的设计风格、菜单版面的形式及英文表述等,提出了改进方法与设计规范,并从信息技术、文化等角度,提出英文网站设计的理念和目标。  相似文献   

12.
垂直搜索中网页抓取技术的研究   总被引:1,自引:0,他引:1  
陈哲 《科技信息》2009,(22):I0182-I0182
网页抓取是由一个称为网络爬虫的程序实现的,该程序是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。网络爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上提取新的URL放入队列,直到满足系统的一定停止条件。  相似文献   

13.
据国家计算机网络应急技术处理协调中心统计,网页篡改2005年在大陆发生13000多次,其中六分之一攻击对象是政府网站,对电子政务构成严重威胁.由于Internet是个开放的网络,网站发布的信息一天二十四小时都在被查询、阅读、下载或转载.网站内容复制容易,转载速度快,后果难以预料,网页如果被篡改,将直接危害该网站的利益,尤其是政府部门的网站,网上发布的重要新闻、重大方针政策以及法规等具有权威性,一旦被黑客篡改,将严重损害政府的形象,破坏群众对政府部门的信任.如果没有坚固的安全体系和有效的事件响应能力,无异于将重要信息暴露于外.由此看来,网络安全问题已成为政府部门网站建设的一项重要内容.  相似文献   

14.
3721兑现预谋     
1999年,一家名叫3721的公司宣称,使用其中文网址的用户不必再输入繁琐难记的英语网址,只需要在浏览器的对话框里直接输入你要去的网站、公司的中文名称,或直接输入你想要了解的产品名,你想要去的网址或介绍该产品的网页马上就出现在你的眼前。  相似文献   

15.
随着互联网在中国迅猛发展,而今为政府、企事业单位提供电子政务、电子商务信息平台的门户网站,为个人提供淘金机会的种类商业网站大量涌现。今天建一个网站已不再是一门高不可攀的技术,只要你了解网站建设的基本知识,做好网站建设的规划与设计,掌握网页制作及网站维护的相关技术,你就可能成为一名网站建设的高手。  相似文献   

16.
WEB网页超链接路径的选择在网站制作和站点维护中具有重要的作用。由于HTML等标记语言对网页超链接的规定与HTTP协议传送网页到浏览器时赋予的路径之间没有很好协调,网页制作与站点维护时链接路径没有正确选择,就会导致网页有时打不开.本文对多层目录下网页链接路径的选择提供了方法,为网页制作、网站维护提供参考。  相似文献   

17.
Cookies现在经常被大家提到,那么到底什么是Cookies,它有什么作用呢?Cookies是一种能够让网站服务器把少量数据储存到客户端的硬盘或内存,或是从客户端的硬盘读取数据的一种技术。Cookies是当你浏览某网站时,由Web服务器置于你硬盘上的一个非常小的文本文件,它可以记录你的用户ID、密码、浏览过的网页、停留的时间等信息。  相似文献   

18.
越来越花哨的个人网站容易让人产生网站很容易做的误解。阅读完本文,你才会知道建设一 个商业网站的艰苦卓绝。 个人网站像儿童的画板,商业网站是一套软件。个人网站很容易绚丽多彩,因为它不必考虑 目的性、完整性、扩展性以及负荷,它更多地只是一时兴起;商业网站是工作的平台,它关乎未 来工作的效率、连续性、安全性,不容失败。 如果你是一家中小企业,你恰好要建一个基于工作的网站,如果你真正想将工作架在互联网 上,而不是一时新奇,那么,你仔细读读这篇文章,能消灭很多错误的观念。读完本文,如果你 觉得做一个商业网站太麻烦了,你不做了,那也是一种收获。现在,很多“商业”网站形同虚设, 最重要一个原因,建立者建立之时,就根本没有将它当作商业网站做。 本文作者为北京朗川软件有限公司运营总监,有着丰富的网站项目管理实施经验,他发起成立的网络项目管理学会(http://www.wpmi.net)致力于网站项目管理的研究。 ——编者按  相似文献   

19.
个性化Web推荐系统是利用用户的浏览行为定制符合用户结构和内容的过程。在综合应用协作过滤和内容过滤方法的基础上,通过对网站网页关键词的评估,提出了一种新的个性化Web推荐算法,研究了基于网页关键词的个性化模型,网站页面中关键词的权重计算,基于协作过滤的新用户推荐,基于内容过滤的再次推荐方法,以及基于用户群的用户兴趣调整方法。实验证明,本算法能够以较高的效率对用户进行网页推荐。  相似文献   

20.
论述了利用SQL Server Agent技术定期启动以VB设计的任务,该任务包括自动下载网页、获取网页中特定的超链接地址和文本信息,并保存到网站指定目录中,从而实现网站自动更新。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号