首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
从Web上异质的、非结构化的数据中发现有用的知识或者模式是目前数据挖掘研究中的一个重要内容。Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的有用模式和隐藏的信息。介绍了Web挖掘基本情况,在此基础上对基于Web的文本挖掘进行了分析研究,给出了一个基于Web的文本挖掘的结构模型图。重点介绍了网页聚类算法,实现了远程教学的按需学习和因材施教的要求。提出了一个基于Web挖掘的智能化、个性化的现代远程教育系统结构模型。  相似文献   

2.
Web应用威胁建模与定量评估   总被引:1,自引:0,他引:1  
为有效地对Web应用威胁进行评估,分析了Web应用威胁现状,定义了Web应用威胁模型,提出了一种利用攻击图对Web应用进行威胁建模和定量评估的方法。描述了攻击图建模过程,并给出其生成算法。研究了利用攻击图对Web威胁进行量化评估的分析方法。通过一个典型的Web应用网络环境,对攻击图生成算法和Web威胁评估方法进行了验证。对Web应用进行量化威胁评估的结果,有效揭示了web应用面临的各种可能的威胁隐患和攻击路径,对有效抵御风险具有重要的意义。  相似文献   

3.
为了更好地对基于SOA的Web服务组合进行可靠性预测,提出了基于服务依赖图的可靠性模型.首先介绍了Web服务组合的描述语言WS-BPEL,以及用来描述服务业务流程的原子活动和结构化活动;其次在传统的控制流图的基础上提出了Web服务依赖图的概念,Web服务依赖图用来描述Web服务组合的执行行为和结构信息,包括服务名、服务类型和服务的可靠性,以及服务之间的转移概率、转移可靠性等信息;然后分析BPEL的原子活动和结构化活动的控制依赖关系,并在此基础上构造相应的Web服务依赖图.最后基于服务依赖图的遍历,应用可靠性预测算法计算Web服务组合的可靠性.实例分析结果表明,基于依赖图的可靠性预测方法具有简便性和易处理性.  相似文献   

4.
通过考虑Web服务的兼容性,提出了一个基于二部图的服务推荐方法(BIGSIR).BIGSIR方法将Web服务及服务之间的关系抽象成一个二部图,并基于二部图为用户推荐合适的Web服务;使用myExperiment上的工作流服务和Web服务的真实数据来验证方法的有效性.实验结果表明:除了一些孤立Web服务结点和工作流结点,执行BIGSIR方法的平均排名都在0.184~0.281之间,与GRM方法相比具有更好的推荐性能,同时还揭示了影响算法性能的因素;针对当历史使用信息不充分时算法的推荐效果不佳的情况,也提出了相应的拟解决方案.  相似文献   

5.
唐月娥  魏洁  张光俊  李蔚清 《科技信息》2009,(34):I0015-I0016,I0018
本文针对数字图书馆异构数据源统一检索的需求,在研究异构数据源统一检索技术的基础上,分析了基于Web服务的统一检索的体系结构,设计了一个异构数据源统一检索系统框架;针对检索服务分发和结果融合提出了检索服务统一模型、基于XML的结果记录元数据模型以及相应的算法,实现了一个统一检索系统,并在上海市委党校数字图书馆系统中获得应用。  相似文献   

6.
随着3D Web技术的成熟与发展,第二代Web离我们越来越近,从3D Web中挖掘多媒体数据是一个新兴的研究领域.提出了一种基于VRML标准的多媒体数据模型——VMDM,该模型能够充分表达3D Web中的多媒体对象的特征,且易于实现,尤其易于可视化的数据挖掘.同时,在此模型基础上,提出了基于兴趣的个性收索方法,并给出了部分算法,最后,给出了基于VMDM模型的3D Web多媒体数据查询语言VMQL,并展望了在该领域将要进一步研究的内容.  相似文献   

7.
文中介绍了Web挖掘的基本概念,提出了一种基于加权关联矩阵聚类的Web日志挖掘算法——多标记传播聚类算法,设计了一个面向电子商务的Web日志挖掘系统模型。  相似文献   

8.
为实现用户和关注对象的多社区划分,针对完全子图模型不能进行多类分类的缺陷,该文引入了阈值划分方法,提出基于改进完全子图模型的社区发现算法。实验表明:与经典数据挖掘算法K-medoids相比,该文算法具有更高的准确性。  相似文献   

9.
在新的系统模型上,提出了一个任务调度算法.该系统模型考虑了通信冲突,即在任何时刻,一个处理器只能接收一条消息,发送一条消息.新的算法包括异构系统中任务优先级的高效排序和基于任务复制的处理器分配两部分.随机产生的任务图和一个具体应用的任务图进行调度试验的结果表明,该算法比已有调度算法的性能有了显著的提高.  相似文献   

10.
最大完全子图是图论中一个重要的问题。粘贴和删除模型是DNA计算的两个基本计算模型。利用改进的粘贴和删除模型给出求解最大完全子图的DNA算法。  相似文献   

11.
Most of the behavior models with respect to Web applications focus on sequencing of events,without regard for the changes of parameters or elements and the relationship between trigger conditions of events and Web pages.As a result,these models are not sufficient to effectively represent the dynamic behavior of the Web2.0 application.Therefore,in this paper,to appropriately describe the dynamic behavior of the client side of Web applications,we define a novel Client-side Behavior Model(CBM) for Web applications and present a user behavior trace-based modeling method to automatically generate and optimize CBMs.To verify the effectiveness of our method,we conduct a series of experiments on six Web applications according to three types of user behavior traces.The experimental results show that our modeling method can construct CBMs automatically and effectively,and the CBMs built are more precise to represent the dynamic behavior of Web applications.  相似文献   

12.
Web数据库信息发布模板技术的研究   总被引:3,自引:1,他引:2  
在基于 Web的数据库信息发布技术中 ,为有效快捷地显示统一风格的动态页面 ,增加信息发布内容的灵活性 ,提出了 H TML模板的思想 ,详细介绍了模板的建立、调用与显示过程。 HTML模板技术的应用使编程方法简洁清晰 ,减少了开发设计的工作量 ,并进一步提高系统的可维护性。  相似文献   

13.
互联网上信息是海量的,并且还在快速的发展.面向主题的Web信息检索已成为当前研究的热点之一.将语义网技术同传统的信息检索技术相结合,给出一个利用本体判断主题相关度的判断算法,通过实验验证了算法的有效性.  相似文献   

14.
基于Web的新闻文本分类技术的研究   总被引:1,自引:0,他引:1  
从Web新闻网页中挖掘出有用的知识是当前研究的热点问题,将Web新闻网页进行解析,在此基础上进行Web新闻文本分类处理,可在一定程度上解决此问题.针对Web新闻网页的结构特点,提出了基于Web的新闻文本分类系统的实现框架.实验结果表明,基于KNN算法的分类系统具有较好的分类效果.  相似文献   

15.
Density-based approaches in content extraction, whose task is to extract contents from Web pages, are commonly used to obtain page contents that are critical to many Web mining applications. However, traditional density-based approaches cannot effectively manage pages that contain short contents and long noises. To overcome this problem, in this paper, we propose a content extraction approach for obtaining content from news pages that combines a segmentation-like approach and a density-based approach. A tool called BlockExtractor was developed based on this approach. BlockExtractor identifies contents in three steps. First, it looks for all Block-Level Elements (BLE) & Inline Elements (IE) blocks, which are designed to roughly segment pages into blocks. Second, it computes the densities of each BLE&IE block and its element to eliminate noises. Third, it removes all redundant BLE&IE blocks that have emerged in other pages from the same site. Compared with three other density-based approaches, our approach shows significant advantages in both precision and recall.  相似文献   

16.
给出了一种基于网页内容相似度和网页之间链接关系的社区发现方法.该方法不仅考虑了网页之间的超链接关系,而且着重考虑了网页在内容上的相似度并克服了传统社区发现算法忽略网页内容的局限性,使发现的社区在内容上更相关.在原始社区的基础上对其进行动态添加,将网络中新出现的与原始社区中的网页存在链接关系同时与主题相关的网页加入到原始社区.实验表明,此方法可以有效地应用于网络的社区发现,使发现的社区在内容上更相关.  相似文献   

17.
随着移动互联网的飞速发展,网站桌面Web应用和移动Web应用的相关性和一致性是网站建设的关键,目前解决这一问题的方法主要采用响应式Web设计思想,本文从液态布局、液态图片和响应式图片三个方面介绍了响应式Web设计的实现方法,基于这些方法建立的网页能够自动适应浏览设备的环境,独立于设备,为网站开发提供了一种高效的方法。  相似文献   

18.
Web日志挖掘   总被引:19,自引:1,他引:19  
提出了一种新颖的MBP算法,它利用关联规则挖掘发现的频繁项目集以加快速度,能找出所有满足阀值约束的频繁浏览路径,该算法是有很效的,同时,针对Web浏览和日志文件固有的模糊性和不确定性,还讲座了Web面面的模糊聚类问题,最后,对发现的知识讨论了其在推荐系统及自适应Web站点中的应用并给出了相应算法。  相似文献   

19.
基于特征相关学习的网页信息提取方法   总被引:1,自引:0,他引:1  
为了给出网页信息提取方法的数学形式化的理论分析,首先用一维空间域的信息函数来表示网页信息,并通过分析网页过滤过程,推导出网页信息过滤定理.然后通过分析网页的相似性,推导并提出一种基于相关过滤的网页特征信息的提取理论.在这个理论基础上,融合基于标识规则和基于内容规则的两种方法,提出一种基于特征相关学习的网页信息提取方法.导出的特征提取理论和实验结果表明这种方法具有较好的准确率.  相似文献   

20.
利用超链接信息改进网页爬行器的搜索策略   总被引:5,自引:0,他引:5  
网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的.爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高.为此,给出了利用超链接信息改进网页爬行器搜索策略的算法.该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行.实验表明,利用该算法爬行得到的网页与某一特定主题相关的网页超过50%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号