共查询到20条相似文献,搜索用时 265 毫秒
1.
作为Web内容挖掘的重要组成部分,基于Web的命名实体提取与实体关系发现,以海量Web网页中蕴涵的海量实体及丰富的实体间关系为对象,充分利用Web数据本身的特点,发展一整套方法和技术,力求高效、准确地提取Web网页中的实体与关系. 相似文献
2.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率. 相似文献
3.
4.
加权Web访问模式聚类算法 总被引:4,自引:0,他引:4
针对Web应用挖掘中聚类算法中的问题,提出加权Web访问模式聚类算法,该算法利用服务器日志库中保存的网页访问次数信息,提高了聚类的客观性和准确性。 相似文献
5.
蔡爱杰 《哈尔滨师范大学自然科学学报》2010,26(2):90-94
Web是一个巨大的知识库,作为知识的载体,Web上的海量网页数据包含了各种各样的内容,在这些内容中,命名实体(named entity)是一类重要的内容.随着Web规模的指数级膨胀,如何在海量Web信息中定位自己所需的信息,成为一个非常紧迫的需要.本文结合大量相关文献,对Web命名实体提取的研究工作进行了介绍、分析与比较,并指出了以后努力的方向. 相似文献
6.
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理RDF文档之外,还试图从传统HTML网页中通过强化学习的方法发现更多RDF文档链接. 相似文献
7.
ASP作为一种功能强大的动态Web技术,得到越来越多的应用.介绍利用ASP的FileSystemObject组件实现网页计数器的方法,给出了程序范例.介绍了利用该组件容易遇见ASP木马程序入侵的问题,并提出防范策略. 相似文献
8.
9.
网络课程的设计水平直接体现设计者的艺术修养。网络课程设计最常用的载体是网页,网页的艺术设计日益被网络课程开发者所注重。从网络课程的艺术设计内容、原则两方面,对其进行归纳和理论探讨。 相似文献
10.
活动服务器网页(ASP)是一种被广泛用于创建动态网页的功能强大的服务器端的脚本语言。Oracle 数据库功能强大,在浏览器中访问大量数据信息时需要在 ASP 环境下访问 Oracle 数据库。本文在 ASP 与 Oracle 数据库的访问方面进行了一些实践和探讨。 相似文献
11.
在网络技术飞速发展的今天,网站成为互联网上人们快速获取、发布和传递信息的重要窗口,它在人们生活各个方面发挥着重要的作用.本文应用网页制作软件Macromedia Dreamweaver、Flash、Photoshopcs和ASP动态网页设计方法,通过资料的收集整理,探讨了个人网站创建. 相似文献
12.
对目前使用的几种评价Web信息系统质量方法的不足之处进行了分析,根据软件质量特点,利用模糊理论建立了一种高效合理的Web信息系统质量评价模型;通过建立的评价知识库,改善了原来评价方法中的不精确性和复杂性,并在实际应用中取得了良好的运行效果。 相似文献
13.
对网页进行有效的标注,有助于搜索引擎、浏览器等应用程序从中抽取结构化的数据。本文首先介绍Schema.org词表的基本情况,然后讨论将UMLS语义网络转换为Schema.org词表扩展成分的5个关键步骤,最后通过实例探讨基于Schema.org词表的医学类网页语义标注方法。 相似文献
14.
15.
宋春晖 《海南师范大学学报(自然科学版)》2005,18(1):46-49
随着人们对网络信息要求的提高,网页设计中越来越多地融入了美学的平面设计技术.网页设计不仅是网页制作技术的简单运用,而且更是视觉艺术设计的体现.在网页设计中运用美学的理论与设计方法是信息时代对信息表现形式提出的客观要求. 相似文献
16.
提出了一种针对网页结构树的相似度计算方法,首先把网页标签结构表示成树,然后通过动态规划算法,使两棵树在每一层上最相似的儿子节点继续进行比较,而那些没有找到匹配节点的儿子节点则产生距离,累加这些距离作为两棵树之间的距离,以此来衡量两个网页之间的相似程度。实验证明本方法可以正确区分同类网页和不同类网页。 相似文献
18.
巧用CSS样式表制作个性化网页 总被引:3,自引:0,他引:3
<正>Macromedia Dreamweaver是网络“三剑客”之一,被称为全功能世界级网页编辑软件与设计行业标准,它提供了最佳的编辑环境,利用它我们可以大幅度提高网页制作效率。 在网页设计中,为了美化网页、统一风格、提高工作效率,Dreamweaver提供了强大的样式设计功能,CSS样式表可谓举足轻重。CSS样式表是一种某于“层叠在要使用样式表的文字或图形上”的样式表,主要用来设置网页的段落、文字、版面等素材的格式。既可以作为一个外部文件链接使用,也可以是只对当前网页有效的内嵌式样式表,我们还可以把样式代码直接添加在HTML源代码中使用。不论是设置素材格式还是用于网页更新,都是非常方便快捷的。 相似文献
19.
重复短语识别是网页文本的特征抽取过程中的关键性技术之一,通过重复短语的识别能够有效地解决网页文本内容特征抽取的难题.研究利用后缀数组进行重复短语识别和抽取的方法.实验表明,该方法进行重复短语识别后,得到的特征向量对于源网页文本的表示更具有代表性,网页相关性的挖掘可以获得更好效果. 相似文献
20.