首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
作为Web内容挖掘的重要组成部分,基于Web的命名实体提取与实体关系发现,以海量Web网页中蕴涵的海量实体及丰富的实体间关系为对象,充分利用Web数据本身的特点,发展一整套方法和技术,力求高效、准确地提取Web网页中的实体与关系.  相似文献   

2.
Web是一个巨大的知识库,作为知识的载体,Web上的海量网页数据包含了各种各样的内容,在这些内容中,命名实体(named entity)是一类重要的内容.随着Web规模的指数级膨胀,如何在海量Web信息中定位自己所需的信息,成为一个非常紧迫的需要.本文结合大量相关文献,对Web命名实体提取的研究工作进行了介绍、分析与比较,并指出了以后努力的方向.  相似文献   

3.
随着计算机和网络在人们工作和生活中的广泛普及,图片数据也成几何倍地急剧膨胀。面对日益增多的海量图像数据,如何进行有效的存储及图像信息数据的快速挖掘,是目前需要解决的主要问题。本文借助云平台Hadoop的分布式文件系统(HDFS)和分布式并行计算框架(MapReduce),进行海量数字图像的数据挖掘。构建基于Hadoop云平台的海量数字图像数据挖掘系统,实现海量数字图像信息数据挖掘。  相似文献   

4.
活动服务器网页(ASP)是一种被广泛用于创建动态网页的功能强大的服务器端的脚本语言。Oracle 数据库功能强大,在浏览器中访问大量数据信息时需要在 ASP 环境下访问 Oracle 数据库。本文在 ASP 与 Oracle 数据库的访问方面进行了一些实践和探讨。  相似文献   

5.
本文涉及中、美、日、欧、韩五大局以及国际专利局网站的利用,重点介绍了在各网站进行专利文献查找时的输入规范以及相关专利申请审查过程的查看方法。  相似文献   

6.
随着人们对网络信息要求的提高,网页设计中越来越多地融入了美学的平面设计技术.网页设计不仅是网页制作技术的简单运用,而且更是视觉艺术设计的体现.在网页设计中运用美学的理论与设计方法是信息时代对信息表现形式提出的客观要求.  相似文献   

7.
随着我国社会经济的迅速发展,Internet和电子商务也随之发展起来,Web站点业务的竞争也随着互联网的发展愈发激烈。为了能够获得更多的电子商务信息并对其加以组织和利用,应该从具有丰富数据资源的电子商务中挑出所需的商业形式,这样就能更多地了解到客户的想法。为了获得更多商家和客户的支持,要完善网站的结构,使之能够为客户提供更多更便捷的服务。Web数据挖掘技术是寻找Web文档和用户浏览网站数据中具有潜在应用价值信息的一种手段,挖掘到的信息非平常模式的信息。本文通过对电子商务数据特点进行分析,来详细描述Web数据的概念、方法和相关技术。  相似文献   

8.
为了汇总、归类和整合网络上杂乱无章的职位信息,设计基于Python的职位画像系统,该系统将招聘网站的招聘页面进行划分.利用Python使用Encode、Xpath和正则表达式的爬取规则设计网页爬取器,获得职位信息.利用My SQL数据库存储爬取的数据,并进行数据清洗及分析,使用Flask和Echarts实现数据可视化.该系统通过图表直观展现职位画像,帮助用户了解目前各个领域职位的需求情况,为用户提供参考,同时从各个维度搭建职位检索功能.测试结果表明,该系统具有高效的爬取效率.  相似文献   

9.
随着互联网技术的不断发展,数据的产生呈现出爆炸式增长,一系列信息数据的出现意味着大数据时代的来临。如何从海量的数据中提取具有价值的信息,再将这些有用的信息反馈给用户,已成为未来图书馆信息服务发展的趋势。大数据时代为图书馆带来了更多的发展机遇,同时也对图书馆的信息服务管理提出了一些挑战。只有抓住机遇,并找出解决问题的途径,才能更好地服务读者,从而增强图书馆的竞争力和影响力。  相似文献   

10.
针对常用的文本数据挖掘系统在处理海量文本数据时时间效率较低的问题,论文提出了一种基于改进Hadoop云平台的海量文本数据挖掘方法.该方法首先将传统Hadoop云平台进行改进以适应海量文本数据挖掘的需要,然后将海量文本数据集和挖掘任务分解到该改进平台上的多台计算机上并行处理,从而实现了一个基于改进Hadoop云平台的海量文本数据挖掘平台,并通过对10 000篇新闻材料组成的实验数据集进行挖掘验证了该平台的有效性和高效性.  相似文献   

11.
数据聚类是将数据对象划分到不同的类或簇中,是数据挖掘中的一项重要技术.教育领域拥有海量的学生信息数据,把数据挖掘中的聚类技术引入其中,具有很强的实际价值.阐述了运用数据挖掘中改进的引入权重的聚类技术对成绩数据进行选择、预处理和挖掘分析等,展示了3个Matlab实验使成绩数据如何通过K-means算法进行聚类分析,并对3种运行结果的意义各自进行了显示与分析,同时指出了运行结果的不足及意义.针对学生实验中的分类原因进行了研究并在学生成绩分析中发现很多隐含着的不易发现的有价值信息,利用这些聚类结果提出了相应的教学措施及建议,从而有针对性地提高教学质量.  相似文献   

12.
为了对网页客户进行研究,从理论上自主构建了一套具体的分析方法.该方法将代数学知识与计算机科学知识相结合,通过进行若当标准型转化和施密特正交化,确定了网页客户的具体分类方法,同时也确定了网页客户的发展趋势.随后,将上述理论分析结果具体应用于某网站,展开基于该实证对象的网页客户挖掘与聚类研究.确定了该网站的发展趋势和聚类特性.通过近一年的应用检验,确定了理论研究和实证应用的正确性.  相似文献   

13.
政府网站是政府特色的体现,它是政府机关与社会公众进行交流与沟通的重要平台,同时也是政府实现政务信息公开的载体。因此,政府网站的网页一定要规划合理,体现各级政府的特色。本文主要分析了政府网站网页规划中的几个要点。  相似文献   

14.
Web的海量信息导致了搜索引擎的出现,同时,Web数据的迅速膨胀以及频繁的更新对搜索引擎提出了更高的要求,而并行搜索引擎可以提高抓取速度,并改善更新效率.语义Web是对未来Web的一个设想,语义Web的数据同传统Web一样面临着数据的膨胀更新问题.于是研究语义Web并行搜索引擎成了一个重要的研究方向.介绍了如何设计一个基本的面向语义Web的并行爬虫系统.该系统由一个中央控制器和若干个子爬虫组成.中央控制器负责为爬虫分配抓取任务,并汇总抓取的数据;子爬虫负责抓取并抽取URLs的工作.而对于每个子爬虫除了处理RDF文档之外,还试图从传统HTML网页中通过强化学习的方法发现更多RDF文档链接.  相似文献   

15.
基于云计算的农业信息管理系统设计   总被引:1,自引:0,他引:1  
在已有的地理信息系统技术和相关学科的支持下,提出了基于云计算技术,结合3S集成、GIS资源监控、GIS自动化部署、云安全等多种现代化技术的农业信息管理系统.在该系统中,通过信息采集模块,利用传感器获取到各种气象和环境等方面信息,再通过云数据库将所获得信息进行整合,并对海量数据加以分析,将对作物不利的环境和气象信息进行提取,并提供给有需求的用户.使用户更便捷高效地进行农业生产管理,从而从更专业的层面来满足不同应用人群的需求,为构建下一代农业信息管理平台打下基础,给现代化农业发展提供决策和技术支持.  相似文献   

16.
在电子商务中的信息流、物流和资金流三大平台中,每天将产生海量的大数据,而电子商务信息系统最核心的能力是对大数据进行处理、分析和挖掘。本文重点介绍电子商务大数据分析的指标体系。通过电子商务大数据分析的指标体系的研究,可以使大数据驱动电子商务运营精细化,提升运营效果和业绩。  相似文献   

17.
在局域风外布置和开发虚拟网站,进行以网页设计为主的internet(互联网)教学和实验。  相似文献   

18.
基于蚁群算法的Web站点导航   总被引:4,自引:0,他引:4  
提出了一种Web站点的导航方法.首先利用蚁群算法对已经存在的Web日志进行训练,构造一个有向图,该有向图的节点和边保存了网页与网页间的链接概率和用户行为规则.利用训练结果,预测访问网站的用户行为,根据其行为推荐网页,最后的测试结果表明该方法比单纯的概率分析和关联规则具有更高的精度.  相似文献   

19.
在网络技术飞速发展的今天,网站成为互联网上人们快速获取、发布和传递信息的重要窗口,它在人们生活各个方面发挥着重要的作用.本文应用网页制作软件Macromedia Dreamweaver、Flash、Photoshopcs和ASP动态网页设计方法,通过资料的收集整理,探讨了个人网站创建.  相似文献   

20.
较为详细地介绍了关联规则挖掘的基本内容和相关算法,给出了在web个性化网站的建设中,利用关联规则挖掘对用户数据进行分析和预测用户行为的一个实例.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号