共查询到20条相似文献,搜索用时 0 毫秒
1.
在传感器网络、RFID等各种应用中会产生大量不确定性数据,有效的Top-K查询处理是不确定性数据管理中一项重要技术。针对已有的Top-K查询没有很好地结合元组的分值和不确定性,在分析不确定性数据模型和可能世界模型的基础上,定义了不确定数据流元组的查询语义。设计并实现了一种有效的Top-K查询算法。该算法按照元组的得分值进行降序排列,概率值最高的前K个元组集合就是Top-K的查询结果,实验结果表明,与CSQ和SCSQ算法相比,更具高效性和实用性。 相似文献
2.
随着大数据时代的到来,不确定性数据上的聚合查询面临形式多样、计算复杂等挑战。该文将不确定性数据上聚合查询的结果定义为所有可能的值以及对应的概率。基于动态规划思想的求解\"和\"的分布(distribution sum,DSUM)精确算法,提出贪心的\"和\"的分布(greedy distribution sum,GDSUM)和折半合并的\"和\"的分布(binary merge distribution sum,BMDSUM)的近似算法,这2种算法都能应用于元组级不确定性模型和属性级不确定性模型;并通过理论分析,给出算法的时间和空间复杂度以及最终结果的误差范围。实验结果表明:误差设定为1%时,2种近似算法分别能缩短执行时间15%~21%和22%~32%。 相似文献
3.
4.
提出了一种使数据挖掘与数据库系统无缝集成的方案.该方案基于关联规则挖掘和关系数据库系统的通用查询算法,采用一种扩充的嵌套关系代数作为关联规则和其它数据查询的一种内部表达方式.通过一个典型实例展示了这种代数表达式.代数表达式也被表达为一种查询树,查询树中代数运算的公共操作序列模块化后,具有更多的灵活性,能方便地处理约束关联规则查询和其它各种关联规则描述. 相似文献
5.
面向大数据分析和处理的NoSQL数据库具有非常好的读写性能和可扩展性,但是无法支持完整的SQL查询和跨行跨表的事务,对于传统的以关系数据库为主的金融业务在应用上有所限制.OceanBase是面向海量数据查询的分布式数据库,结合了关系数据库和非关系数据库的优势,同时支持关系查询和跨行跨表事务,具有可扩展性.但是,目前OceanBase只支持简单的、非嵌套子查询的SQL语句,无法很好地支持金融应用.本文在研究OceanBase架构和查询策略的基础上,提出了一种基于BloomFilter和HashMap的查询策略,实验表明该策略能够提高和改善现有查询策略的不足,在实现嵌套查询的基础上,可提高查询性能. 相似文献
6.
聚类作为区间型数据挖掘的重要任务之一,在度量对象之间的相似度或距离方面面临着极大的困难。传统聚类方法扩展到区间型数据后,在度量对象之间的距离时往往只考虑到了区间型数据的边界,而忽略了区间型数据内部的信息。文章引入区间型数据的概率分布,希望通过相关的区间型数据来估计每一簇的概率密度函数。提出了一种新的基于区间型数据的核密度估计方法,然后利用新方法估计出的概率密度函数重新定义了对象之间的距离,最后提出了一种自适应的区间型数据聚类方法。实验结果显示了该方法是有效的,同时也表明用区间型数据的概率分布定义距离比用区间的端点定义距离更为合理。 相似文献
7.
基于Logistic响应模型,在感度数据下,应用样本空间排序法给出了响应率的下限估计.在进行火炸药产品的响应率的测定时,利用感度实验,得到感度数据(ni,si),i=1,2,…,k的形式,将这种数据形式转换成样本空间中的序的形式,进一步利用样本空间中的序的理论给出响应率的下限估计.在此基础上进行蒙特卡罗模拟,将其结果与渐近正态的方法进行比较.并且将该方法用于QD—8电雷管的真实实验数据.模拟和实例结果表明,在样本量较小时,应用样本空间排序法可以较好地估计响应率下限. 相似文献
8.
基于不确定数据的频繁项查询算法 总被引:2,自引:0,他引:2
频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概率求解中的递推规律,极大提高了单点检测效率.实验结果显示:提出的方法可以有效地减少候选集,降低... 相似文献
9.
ZHAO Zhibin YAO Lan YANG Xiaochun LI Binyang YU Ge 《武汉大学学报:自然科学英文版》2006,11(5):1383-1388
In this paper we propose a Filter-based Uniform Algorithm (FbUA) for optimizing top-κ query in distributed networks, which has been a topic of much recent interest. The basic idea of FhUA is to set a filter at each node to pre vent it from sending out the data with little chance to contrib ute to the top-κ result. FbUA can gain exact answers to top-κ query through two phrases of round trip communications between query station and participant nodes. The experiment results show that FbUA reduces network bandwidth consumption dramatically. 相似文献
10.
深入研究了适合数据流连续查询处理的Shared PushDown,PullUp和Filtered PullUp三种可共享连接结果的策略.通过理论分析和实验证明,在数据流的连续查询处理中,PullUp策略性能较低,而Filtered PullUp和Shared PushDown策略各占优势.Filtered PullUp处理简单,消耗内存相对较少.而Shared PushDown增加内存使用,但在注册查询的选择因子覆盖较少时有一定优势.考虑到处理的方便,一般情况下Filtered PullUp是适合数据流连续查询处理的最佳方案. 相似文献
11.
应用基于概率分布的统计分析方法对涡轮叶片冷却效果试验的试验数据进行了进一步的精细处理,以便通过参数估计与统计推断得到更加准确的试验数据结论。绘制了上述间接测量值单个状态水平下的正态概率图、箱型图及概率密度分布图加高斯拟合曲线,对各测量数据值对正态分布的符合程度进行了定量分析,指出了离群值及置信区间。根据数据处理结果分析了影响数据概率分布好坏与否的关键因素,对该类试验具有较强的参考价值与实用价值,补充完善了相关试验领域的空白。 相似文献
12.
贝叶斯学派丰富和发展了古典统计学 总被引:2,自引:0,他引:2
贝叶斯学派和古典统计学派在统计的基础理论和方法上一直存在争议.本文运用对比分析的方法,从兼容、发展、精确度客观等四个方面,论证贝叶斯学派丰富和发展了古典统计学. 相似文献
13.
为了对云端海量的数据进行高效的管理以及精准快速的查询,尤其是针对多维数据的范围查询问题,提出了一种新型的分布式多维数据索引方案BSCBF-index。实验证实:该方案能够带来较低的用户访问延迟,从而可以大大提高用户的查询体验。 相似文献
14.
15.
李光勤 《复旦学报(自然科学版)》2005,44(3):452-456
考虑在间距为1的区域足够大的方格子系统中投入长度为l∈(0, ∞)的针时,针与方格子的横轴和纵轴的交点总数的分布问题. 相似文献
16.
一种不确定性数据中最大频繁项集挖掘方法 总被引:1,自引:0,他引:1
不确定性数据挖掘已经成为数据挖掘领域的新热点,频繁项集挖掘是重点研究的问题之一.但是目前出现的挖掘算法大多集中在完全频繁项集,而用于最大频繁项集和频繁闭项集的算法尚不多见.文中研究了一种基于UF-Tree的用于不确定性数据中挖掘最大频繁项集的算法,该挖掘过程分为两个步骤,第一步先得到以频繁1-项集为后缀的局部最大频繁项集,第二步得到所有的全局最大频繁项集,实验证明该算法性能良好且特别适用于稠密型、事务长度较小的数据集. 相似文献
17.
随着无线通讯及连续移动对象寻轨技术的高速发展,迫切需要提出解决大量移动对象查询的有效方法。本文提出了一个解决连续移动点反向最近邻查询的算法,同时也提出了解决连续移动点的最近邻查询算法。 相似文献
18.
19.
20.