首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
卢印举 《科学技术与工程》2013,13(18):5366-5370
在传感器网络、RFID等各种应用中会产生大量不确定性数据,有效的Top-K查询处理是不确定性数据管理中一项重要技术。针对已有的Top-K查询没有很好地结合元组的分值和不确定性,在分析不确定性数据模型和可能世界模型的基础上,定义了不确定数据流元组的查询语义。设计并实现了一种有效的Top-K查询算法。该算法按照元组的得分值进行降序排列,概率值最高的前K个元组集合就是Top-K的查询结果,实验结果表明,与CSQ和SCSQ算法相比,更具高效性和实用性。  相似文献   

2.
 提出一种基于DS理论的co-location挖掘方法.先将数据集按照空间对象分类,然后从分类后的子数据集中依次提取该空间对象的实例,与其他空间对象数据集中的各个实例进行配对,将找到的各实例关系记录到一个新的关系表中,作为使用DS理论求解的基础.从一个新的角度来研究co-location挖掘技术,在DS理论的基础上重新定义了参与度,基于新定义的参与度来求解co-location模式.  相似文献   

3.
提出了一种使数据挖掘与数据库系统无缝集成的方案.该方案基于关联规则挖掘和关系数据库系统的通用查询算法,采用一种扩充的嵌套关系代数作为关联规则和其它数据查询的一种内部表达方式.通过一个典型实例展示了这种代数表达式.代数表达式也被表达为一种查询树,查询树中代数运算的公共操作序列模块化后,具有更多的灵活性,能方便地处理约束关联规则查询和其它各种关联规则描述.  相似文献   

4.
深入研究了适合数据流连续查询处理的Shared PushDown,PullUp和Filtered PullUp三种可共享连接结果的策略.通过理论分析和实验证明,在数据流的连续查询处理中,PullUp策略性能较低,而Filtered PullUp和Shared PushDown策略各占优势.Filtered PullUp处理简单,消耗内存相对较少.而Shared PushDown增加内存使用,但在注册查询的选择因子覆盖较少时有一定优势.考虑到处理的方便,一般情况下Filtered PullUp是适合数据流连续查询处理的最佳方案.  相似文献   

5.
为了对云端海量的数据进行高效的管理以及精准快速的查询,尤其是针对多维数据的范围查询问题,提出了一种新型的分布式多维数据索引方案BSCBF-index。实验证实:该方案能够带来较低的用户访问延迟,从而可以大大提高用户的查询体验。  相似文献   

6.
针对海量RFID数据中存在的不准确性以及语义信息鸿沟,提出了一种基于概率分布熵的数据推导方法.该方法采用时变图模型并充分利用历史RFID识读,从不确定RFID数据流上有效捕获贴标对象所处的状态,并采用基于概率分布熵的方法分别推导对象最可能的位置和包含.该方法可以同时处理RFID识读中的漏读和多读.最后利用模拟RFID数据进行参数调优和算法评价,实验结果显示:该方法在获得准确推导结果的同时,能确保其高效性和高伸缩性.  相似文献   

7.
社交数据流上的连续查询处理具有广泛的应用,但其处理技术仍不成熟.本文对社交数据流上的连续查询问题进行建模,定义数据特征、负载类型与分布,以及性能测度.在此基础上,提出一个面向该问题的基准评测.该工作对社交数据流处理应用的系统选型、相关查询处理技术性能比较具有重要意义.  相似文献   

8.
取样是一种通用有效的近似技术,利用取样技术进行近似聚集查询处理是决策支持系统和数据挖掘实现技术中的常用方法.如何正确有效地给出近似查询结果并最小化近似查询误差是近似查询处理的关键和目标.在深入研究近似聚集查询取样方法的基础上,本文提出了一个有误差确界且只需单遍扫描数据集的离群分治取样Outlier-DivideConq...  相似文献   

9.
流数据频繁项挖掘是一项重要的研究课题,是其他流数据挖掘任务的基础。Lossy counting 算法是第一个近似的流数据频繁项挖掘的算法,并且具有空间和时间的高效性。详细分析该算法,尤其是它不能回答关于时间的查询的不足后,对其进行改进,提出了一个在多时间粒度上挖掘流数据频繁项的设想,加入时间维度。改进后的算法在时间倾斜窗口保存与合并频繁项,可以应用于各种对时间敏感的流数据查询和挖掘应用中。  相似文献   

10.
为应对传统DEA方法在信息不确定条件下评价结果可能出现不稳定的现象,结合鲁棒优化方法,构建鲁棒数据包络分析RDEA模型,分别和同时应对投入产出数据受到扰动的情形,以增强DEA评价方法的可靠性.算例和敏感性分析表明RDEA方法对投入产出数据不确定性有免疫作用,通过适当牺牲最优性实现了提升效率评价结果稳定性的目的.  相似文献   

11.
一种不确定性数据中最大频繁项集挖掘方法   总被引:1,自引:0,他引:1  
不确定性数据挖掘已经成为数据挖掘领域的新热点,频繁项集挖掘是重点研究的问题之一.但是目前出现的挖掘算法大多集中在完全频繁项集,而用于最大频繁项集和频繁闭项集的算法尚不多见.文中研究了一种基于UF-Tree的用于不确定性数据中挖掘最大频繁项集的算法,该挖掘过程分为两个步骤,第一步先得到以频繁1-项集为后缀的局部最大频繁项集,第二步得到所有的全局最大频繁项集,实验证明该算法性能良好且特别适用于稠密型、事务长度较小的数据集.  相似文献   

12.
基于D-S证据理论的不确定数据清洗   总被引:1,自引:0,他引:1  
数据清洗的任务是检测数据中存在的错误、缺失或不一致,通过删除、填充、修改等方法提高数据质量.针对存在元组级不确定性的数据表上的选择投影连接操作,基于D-S证据理论中置信区间的概念,给出辨识框架构建和置信区间计算的方法,提出了一种基于待测数据项置信区间来检测查询结果中错误数据的方法.实验结果表明,提出的不确定数据错误检测方法具有高效性、准确性和可用性.  相似文献   

13.
为了优化应急物资配送系统,提高配送的时效性和经济性,以总时间最短和总成本最小为目标,建立了不确定双目标机会约束优化模型,在这个模型中综合考虑了需求点的限制期要求以及需求点物资需求量的不确定性、两节点运输时间的不确定性、若干车辆容量的有限性和若干候选救援中心容量的有限性,并且假设救援车辆完成自身的任务后停靠在就近已经启用的救援中心;运用遗传算法求解该模型,并且利用惩罚函数的思想以及加权法对目标进行了处理,最后给出数值例子验证该模型和算法的有效性.  相似文献   

14.
随着交通、网络流量监控等应用的涌现,不确定数据流频繁项集挖掘成为近年来的研究热点。通常在不确定数据流中,频繁项集所占的比例较小,导致挖掘中无效操作较多。基于这种情况,提出了一种基于预裁剪的不确定数据流频繁项集挖掘算法Prep-UF-Streaming;该算法,不仅能裁剪掉大部分非频繁项集,提高了算法的平均运行时间;而且能够检测到非频繁项集成为频繁项集的可能性,尽量不丢失频繁项集,从而尽可能地提高算法的性能。  相似文献   

15.
针对决策问题中出现的多个不确定因素,研究2个不相关的不确定因素的一次性决策问题.在单一不确定因素的一次性决策基础上,首先得出2个不确定因素的可能性,然后提出焦点和最优方案的选择方法,给出2个不相关的不确定因素的一次性决策过程,最后以报纸经销商问题为例说明这样的决策过程.分析的结果表明提出的决策模型能够帮助决策者在2个不确定因素的情形下找出最优方案.  相似文献   

16.
本文叙述了怎样根据给定的概率分布曲线来产生相应数据问题的解决方案,该方案主要包括编程的思路、算法的简单描述、程序流程,程序测试和改进等方面。该程序能很好的解决所提出的问题,程序的设计思路清晰,有创新的部分,并提出了该程序应谈如何改进以及可以如何发展,为解决类似问题提供了一个很好的参考方案。  相似文献   

17.
目的对江西省病理专业委员会疑难病例读片年会(1981-2005)资料分析,探讨疑难病例读片重点与难点。方法对1981—2005年疑难病例读片年会资料进行回顾性分析。结果1981-2005年疑难病例读片年会明确诊断的病例782份,其中:肿瘤病例684份、占83.0%,恶性肿瘤563例、占72.0%(其中:软组织肉瘤176例、占31.26%,列第1位;恶性淋巴瘤99例,占17.6%,列第2位;部位和组织来源不明的转移癌31例、占5.5%,列第3位)。结论软组织肉瘤、淋巴瘤、来源不明的转移癌是读片的重点。软组织肉瘤的组织起源和淋巴瘤的分类是重点中的难点。  相似文献   

18.
目的 对江西省病理专业委员会疑难病例读片年会(1981~2005)资料分析,探讨疑难病例读片重点与难点.方法 对1981~2005年疑难病例读片年会资料进行回顾性分析.结果 1981~2005年疑难病例读片年会明确诊断的病例782份,其中:肿瘤病例684份、占83.0%,恶性肿瘤563例、占72.0%(其中:软组织肉瘤176例、占31.26%,列第1位;恶性淋巴瘤99例,占17.6%,列第2位;部位和组织来源不明的转移癌31例、占5.5%,列第3位).结论 软组织肉瘤、淋巴瘤、来源不明的转移癌是读片的重点.软组织肉瘤的组织起源和淋巴瘤的分类是重点中的难点.  相似文献   

19.
由于仪器的不精确和网络延时等原因,在传感器网络和P2P系统中数据都存在不确定性.为解决此问题,基于现有的集中式的不确定数据的kNN查询方法,提出了一种在P2P环境中对不确定数据的kNN查询方法.该方法在super-peer的网络拓扑结构的基础上,以一种扩展的R树(P2PR-tree)作为此查询算法的空间索引结构,解决P2P环境中对多维数据的索引.并且结合两种剪枝策略减小了候选集的范围和减少了查询在P2P网络中的网络代价.实验结果表明,该方法在减少网络代价方面具有较高的性能.  相似文献   

20.
考虑到国内普遍带有防浪墙的斜坡堤在风暴潮下受到最大越浪量的破坏威胁,采用波浪水槽试验测定了破碎波情况下单坡带有直立式防浪墙上的单波越浪量,基于现有的单坡无防浪墙的越浪量分布计算公式,引入防浪墙影响因子,推导出单坡带有防浪墙的越浪量分布形状参数和越浪概率的计算公式.研究结果表明,越浪量分布形状参数、越浪概率都与相对出水高度、防浪墙相对高度有关.随着防浪墙相对高度的增大,形状参数呈指数增大趋势,而越浪概率呈指数减小趋势.研究结果可为海堤设计提供参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号