首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 609 毫秒
1.
基于Web Log的数据预处理研究   总被引:4,自引:0,他引:4  
Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步,首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法。  相似文献   

2.
针对联盟链扩展能力差、互操作性差、存储资源浪费等问题,借助原有公证人跨链机制研究了一种去中心化的分布式公证人跨链模型。从各个局部链中推选节点组为分布式公证人链——全局链,将全局链作为跨链媒介提升模型的去中心化程度;以JMeter工具对系统的延迟和吞吐量进行测试,并从理论角度对系统存储空间利用率以及安全性进行分析;将所提出的跨链模型用于医疗健康领域,验证了该模型的可行性。  相似文献   

3.
现代企业每天生成很多日志文件,如果能实时处理日志数据,企业能获取更大的商业价值,但管理这个大日志数据是一个巨大的挑战,因为传统的技术用来处理庞大的数据不够高效.Hadoop生态系统提供一种新的方式来处理大数据,ElasticSearch技术是基于云环境的实时搜索引擎.本文提出了基于ElasticSearch实时进行大日志数据搜索的软件集成方案,采用基于硬件创建虚拟机环境,根据搜索条件使用ElasticSearch得到需要的rowkey列表,Hbase用这些rowkey直接从数据库中得到数据.实验证明,随着日志事件搜索量的增加,搜索反应时间不线性增加,基于ElasticSearch的大日志实时搜索的软件集成方案设计具有可行性.  相似文献   

4.
在系统开发过程中,最常见的写日志的做法就是在代码中嵌入许多的打印语句,这些打印语句可以输出到控制台或文件中。但这种方法不容易控制,一旦不再需要这些信息,必须把它们从程序中删除,且大量的打印语句降低了程序的可读性。本文就采用java开发语言实现了一个日志组件,并很好地解决了以上问题。  相似文献   

5.
探讨Credit-Recovery分布式并行终止检测的算法,并对算法的不足之处进行改进,提出了改进后的算法模型和描述.通过理论分析和验证,表明该模型适用于非集中式分布式并行计算的终止检测,并提高了精确度和性能.  相似文献   

6.
在计算机软件的日益复杂过程中,根据我国计算机的发展现状,对分布式计算机控制系统的发展状况进行了分析和探究,提出了有关计算机制造过程的分布式检测系统模型。  相似文献   

7.
分布式构件技术在图书馆管理系统中的应用   总被引:1,自引:0,他引:1  
介绍了分布式构件技术在开发分布式图书馆管理系统中的应用,讨论了分布式构件模型、构造原理以其对系统分析和设计的要求,提出了一种基于构件方法来实现分布式图书馆管理系统的设计原理。  相似文献   

8.
图书馆大规模日志数据的快速聚类   总被引:2,自引:0,他引:2  
给出了一种简单有效的算法,用于对图书馆大规模日志数据的快速聚类和借阅趋势分析。首先,根据读者基本的借阅规律,把日志数据聚成若干子类,然后,给出了对子类结果进行再次聚类的模糊算法。最后,为了预测读者的借阅趋势,对每一类进行了回归分析。该算法具有线性复杂度,对大规模数据集是可伸缩的,实验证明是可行的。  相似文献   

9.
物联网正在改变消费者的行为和业务流程.针对物联网设备的信息隐私及安全问题,提出基于区块链技术的物联网设备位置信息保护模型.该模型首先借助区块链技术将记录设备标识,保证物联网设备信息不可篡改;然后基于白名单技术实现分布式哈希表网络,并对设备位置信息进行异或处理以隐藏物联网的网络拓扑,保护物联网设备的位置信息;最后根据k-匿名算法泛化数据的敏感属性为用户提供区域信息统计服务.实验结果证明该模型可以有效隐藏设备位置信息,同时能够提供定制的区域统计服务并且保护用户信息安全.  相似文献   

10.
本文通过解析当前医院信息化实际情况,首次将医学数据中心模型划分为分体式、大集中式、B/S、C/S混合分布式.并依据对医学数据中心模型发展趋势的分析,提出云式医学数据中心模型.通过对分体式、大集中式和B/S、C/S混合分布式的综合分析,指出云式医学教据中心将成为主流模型.本文认为云计算本质上是对软件设计理论中最根本的抽象和封装概念在大范围、高层次上的延续实现,其核心是公共数据中心,首次提出创建云计算公共数据中心应遵循的宗旨是“一切是服务,服务是一切”.  相似文献   

11.
本文在分析Apache日志文件结构基础上,设计了基于增量复制技术的日志更新算法,解决了在不影响Apache正常运行前提下目志实时更新问题.实验表明,所实现的系统不但解决了Apache日志管理的界面化问题,而且具备良好的实时更新性能,操作简便,具有较高的应用价值.  相似文献   

12.
低孔渗储层油水层判别分析方法   总被引:2,自引:0,他引:2  
低孔渗储层油水层判别分析方法,从大庆长垣以东特低渗透油藏常规测井物理参数的概率分布属性具体特征出发,首先分析确定了特低渗透油层、油水同层、水层及干层的常规测井物理量的概率分布有的具有正态属性,有的具有近正态甚至完全偏离正态属性。据此充分利用传统的参数判别分析法对正态属性判别精度高的优势,提高判别符合率,同时考虑到非参数判别分析方法对非正态属性的适应性与稳定性特点,将两种判别分析方法有机结合,优势互补,建立了半参数判别分析模型,实现提高流体识别符合率的目标。经10口井资料处理解释,符合率达96%,见到明显应用效果。  相似文献   

13.
在一般对数衰减模型中衰减因子是一个常量,但在实际应用中会引起较大的测距定位误差. 为了减少定位估计误差,在对Zigbee 组网定位实验数据进行统计分析的基础上,提出用负指数函数来描述衰减因子与距离(目标节点与锚节点间距)之间的关系,进而建立一种改进对数衰减模型;给出一个基于改进对数衰减模型的ML 估计器,并推导了该估计器的Cramer-Rao下界(Cramer-Row lower bound, CRLB). 在实验室和车站站场的Zigbee 组网定位实验结果表明,使用改进对数衰减模型的ML 估计器能提供更准确的定位估计,对场景变化有较好的适应性.  相似文献   

14.
为确保量子密钥从生成、分发、存储、使用、更新到销毁的安全性更高,提出一种基于区块链的量子密钥全生命周期管理方案。首先有保密通信需求的两方机构通过量子密钥分发设备产生真随机对称量子协商密钥,并将其分别存储在两方机构的量子设备管理员处;然后两方量子设备管理员协商量子密钥编号规则生成量子密钥文件;最后两方机构用户分别向各自量子设备管理员申请量子密钥用于通信。在通信过程中,与量子密钥生成、分发、使用、更新、销毁的相关日志信息上传到区块链,由量子设备管理员、通信用户协同区块链管理员完成量子密钥全生命周期的管理与追溯。理论分析表明:该方案能解决量子密钥在通信系统中无法有效追溯和管理的问题,可以实现对量子密钥全生命周期管理和追溯过程的透明可信。  相似文献   

15.
胜利油田某地区沙三下亚段浊积岩、三角洲沉积体时空展布复杂,大量分布的灰质泥岩对沉积体系空间描述造成了影响。为更好地对该类沉积体系进行研究,基于常规测井资料、岩心观察、薄片鉴定及XRF(X-ray fluorescence)元素测试等资料,从沙三下亚段富灰质泥岩岩石类型分析入手,对不同尺度灰质泥岩岩石学及测井响应特征进行了总结,划分不同的岩石类型组合并建立了测井响应模式。研究结果表明,深灰色灰质泥岩具有低GR(自然伽马)中AC(声波时差)特征,砂质泥岩及深灰色泥岩呈现高GR、高AC特征。砂质泥岩的GR均值大于深灰色泥岩,而声波时差值则偏低。研究区岩石划分为灰质泥岩—砂岩型、泥岩—砂岩型、灰质泥岩—泥岩型、灰质泥岩—砾岩型四种类型,建立了相应的测井解释模型。  相似文献   

16.
为了提高闸机信息化管理的水平,基于以太网设计嵌入式闸机监控系统。通过对JFFS2文件系统、网络通信模块、数据库接口模块等的设计,构建运行稳定、可扩展性强的分布式控制系统。该系统以C/S结构为模型,具有闸机监控、设备管理等功能。  相似文献   

17.
在概述Web挖掘以及Web日志挖掘的相关领域的发展和技术及其理论基础上,详细研究了Web日志挖掘的预处理技术,Web日志挖掘利用数据挖掘技术分析和挖掘网络日志,获取网站使用情况的有价值模式,应用于个性化服务、网站设计和商业决策等方面.通过将日志挖掘的结果与最优路径算法将结合,进一步优化网站,设计出拥有最优路径拓扑结构的网站,使优化后的网站更具优势,在同类网站中能够脱颖而出.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号