首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
基于多层概要结构的数据流的频繁项集发现算法   总被引:1,自引:0,他引:1  
利用一类基于异或运算的两两相互独立的哈希函数族,实现了对多层结构流数据进行"概括"的概要数据结构.应用该多层概要数据结构,实现了面向数据流的多层频繁项集的动态近似查找算法.实验结果表明,该算法以亚线性的时间和空间消耗,在统计意义上达到了几乎100%的查找和估计精确度.  相似文献   

2.
要在海量的信息中进行多重复模式的查找,应用一般的查找方法所需O(n2)的复杂度.为了提高模式查找算法的效率,提出了算法Epattern searcher H.该算法是采用能节省空间占用的后缀数组数据结构来实现,同时又运用过滤算法的思想而设计,从而提高算法的运行速度.这里针对英文小说高频词的查找对算法进行测试,可得到时间复杂度为O(n)实验结果.  相似文献   

3.
给出了动态快速路由查找算法(DFR)的原理和实现。该算法采用特殊的数据结构来构建索引表,能支持动态插入、删除和更新路由;DFR算法最多4次访存,最少2次访存,就能找到完整的路由信息。该算法不仅适用于软件实现,而且由于查找简单,也适合于硬件实现。  相似文献   

4.
在路由表中高效地查找匹配128位IPv6地址,成为了IPv6技术发展的一大制约因素。经大量研究表明,Trie数据结构是实现高速路由查找和报文转发的关键。本文结合IPv6的地址结构特点,设计出基于Trie数据结构的查找算法,提高了路由查找效率以及报文转发速度。  相似文献   

5.
关系型数据库BOM表的遍历算法的改进及实现   总被引:9,自引:0,他引:9  
定义了单层BOM和多层BOM树的结构,并总结了实际运用中的多级型BOM遍历的两种基本算法:递归查找法、分层查找法.在介绍这两种算法的原理和对其速度、资源占用、实用性进行评价的基础上,提出了一种综合以上两种算法的优点,且适合普遍使用的关系型数据库存储的改进的多级型BOM遍历算法,使该改进算法包含速度快、资源占用低、实用性高的优点.同时详细介绍了此算法的软件实现,并且在实际的运用中取得了明显的效果.  相似文献   

6.
设计一种方便查找及显示最短路径的数据结构,并对针对原有的Dijkstra算法通常仅研究计算一条最短路径加以改进,实现一个顶点到另一个顶点的所有多条最短路径的查找。  相似文献   

7.
数据结构主要研究数据之间的逻辑关系、数据的存储方法以及对数据的各种操作.最小生成树是图这种数据结构的一种重要应用,实现算法与数据结构关系密切,本文以邻接矩阵作为图的存储结构,详细讨论了Prim算法在计算机上的实现方法,并对该算法作了必要的分析.  相似文献   

8.
基于Marching Cubes算法的多层医学图像重建实现   总被引:1,自引:0,他引:1  
为了进一步增强医学三维图像的可视性,研究了用于医学三维图像重建的Marching Cubes算法,采用了双曲线渐进方法来消除其等值面连接的二义性,使用八叉树数据结构减少多层图像重建的冗余计算.在VS2005平台上,对CT医学图像序列,利用OPENGL图形库实现了基于这些方法的多层医学三维图像重建.实验结果表明:基于MC算法的多层医学图像重建比单层重建能给医生提供更多的可视化信息,具有一定的临床优势.  相似文献   

9.
报文分类已成为保障网络应用的服务质量及安全性的重要手段,而二维的前缀报文分类则是其中最为常用的.通过对规则冲突的分析,提出了一个基于三态内容可寻址存储器(TCAM)的二维前缀报文分类算法,该算法借助TCAM的并行查找能力,在一个指令周期内找到前缀的最长匹配,采用内存映像及相关数据结构消除了规则之间的冲突,实现了快速的二维前缀分类查找.与其他二维分类算法相比,该算法具有最小的查找时间复杂度和较小的内存空间复杂度.  相似文献   

10.
平衡二叉树是数据结构中的重要知识点,在实际应用中多用于在内存中组织数据,因它在动态查找表中的查找效率非常高,所以得到广泛应用。实现其可视化具有重要意义。本文运用面向对象方法,利用完全二叉树特点实现了平衡二叉树的可视化,解决了该方法实现时所碰到的一些问题。  相似文献   

11.
针对XML数据流可能具有复杂的递归层次结构,提出一种XML数据流小枝匹配算法TwigPM.通过获取查询节点的结构关系,进行有效的剪枝操作,减少了处理时间和数据所占用的内存空间.实验结果表明,算法具有高效性.  相似文献   

12.
CABOSFV_C是一种针对分类属性高维数据的高效聚类算法,该算法采用集合稀疏差异度进行距离计算,并采用稀疏特征向量实现数据压缩。该算法的聚类效果受集合稀疏差异度上限参数的影响,而该参数的选取没有明确的指导。针对该问题提出基于集合稀疏差异度的启发式分类属性数据层次聚类算法( heuristic hierarchical clustering algorithm of categorical data based on sparse feature dissimilarity,HABOS),该方法从聚结型层次聚类思想的角度出发,在聚类数上限参数的约束下,应用新的内部聚类有效性评价指标( clustering validation index based on sparse feature dissimilarity, CVISFD)进行启发式度量,从而实现对聚类层次的自动选取。 UCI基准数据集的实验结果表明,HABOS有效地提高了聚类准确性和稳定性。  相似文献   

13.
提出了一种基于树形结构的Web结构化数据抽取算法.该算法基于HTML的树形层次结构,包括HTML树构造算法,数据区域挖掘算法,数据记录挖掘算法以及数据记录模式生成算法.算法引入了页面元素布局位置等信息用于清洗页面,采用层次划分思想实现页面数据区域的挖掘,并通过树匹配生成记录模式,实现最终数据项抽取.实验表明,该方法可以有效地实现Web结构化数据抽取.  相似文献   

14.
基于草图的人脸识别对于公安机关通过目击者描述出的犯罪嫌疑人草图来确定疑犯的身份具有重要的意义.为实现草图人脸识别,从人脸独立特征子空间和人脸形状结构特征出发,提出了一种新的草图人脸合成和识别方法.根据人脸图像在独立分量子空间上的重建,研究了基于独立成分分析(ICA)的草图人脸合成,实现了照片草图人脸转换;针对人脸结构信息在人脸识别中的重要作用,在分析主动形状模型(ASM)算法在提取人脸结构信息上所具有的局限性的基础上,提出了极坐标形状模型(PSM);最后,将合成的草图与待识别草图利用ICA/线性鉴别分别(LDA)和极坐标形状模型进行联合识别.实验结果表明,提出的算法可以有效地将照片转换为草图,并具有较好的识别率,1阶识别率达到94.7%,10阶达到99.1%,将子空间投影与极坐标形状模型联合起来识别,1阶识别率可提高5.3%,前3阶识别率平均提高约4.2%.算法较好的识别率基本上满足了自动草图识别系统的要求.  相似文献   

15.
针对目前手绘草图识别难度大,识别准确率低且主要以手工提取特征为主,提出一种新的卷积神经网络结构DCSN( Deeper-CNN-Sketch-Net) 进行手绘图像识别。DCSN 模型是根据手绘草图的特点进行设计,如在首层采用了更大的卷积核获取草图的结构信息和更小的步长尽可能多保留特征信息,通过增加网络层数加深网络深度等。为进一步提高识别准确率,针对手绘草图的特点提出了两种新的数据增强方法,小图形缩减策略和尾部移除策略增加数据集的多样性,并利用扩充的数据集训练DCSN 网络。经实验验证,所提出的模型在目前最大的手绘图像数据集上可以取得70. 5% 的识别准确率,超过了目前存在的几种主流的手绘草图识别方法。  相似文献   

16.
层次化话题发现与跟踪方法及系统实现   总被引:2,自引:0,他引:2  
自1996年话题发现与跟踪评测启动以来,该研究受到普遍关注,取得巨大进步,也遇到诸多困难。通过分析大量话题数据,提出层次化话题与层次聚类的区别在于话题的层次是由事件的构成决定的,层次化话题应当分为三层,即微类、中类和上类。原因在于计算机自动分析产生的层次化话题必须与现实世界有客观的联系。据此提出一个面向大规模真实数据的有充分理论依据的层次化话题发现与跟踪方法,并在集群系统上予以实现。  相似文献   

17.
针对图像里处于复杂纹理背景中物体的轮廓提取正确率低的问题,首先研究了基于非经典感受野抑制的轮廓提取算法和HMAX模型,然后利用HMAX模型所具备的具有基本视皮层功能结构的优点,弥补了前者所依据的生物学视觉结构比较简单的不足,最后提出并实现了基于HMAX模型和非经典感受野抑制的轮廓提取算法。通过与Canny算子和非经典感受野抑制的轮廓提取算法的评估比较,表明本文算法有效提高了轮廓提取的正确率。  相似文献   

18.
 当处理在网上遇到的半结构数据时,从中推导出其暗含的结构显得愈来愈重要了,不仅对于用户(如方便查询)而且对于整个系统(如优化访问)来说,其重要性也是不言而喻的.所考虑的问题就是在半结构数据集合中识别一些基本的结构,而这些数据相当不规则,所以说将所研究的数据对象近似地分成"类层"的集合形式组成这些基本的结构,提出一种数据"类层"的概念、得出类型层次的算法、以及将类型赋给数据元素的一些规则.  相似文献   

19.
在网络流量监控等数据流应用场景中,数据流中的IP地址等属性的值域往往很大,对于连续到达的数据流,管理系统一般不存储全体数据集,而是维护一个较小规模的数据概要.对于这类大域数据流中的缺失数据,难以采用邻近值填充等传统方法进行填充,也不能轻易删除.最小计数概要是一种轻量级的数据流概要,适合大域数据流的概要维护.本文基于最小计数概要及其维护技术,提出最小频率概要,并根据这两种概要填充大域数据流中的缺失数据.该填充方法首先设计一组两两独立的Hash函数族,将一段时间内大域数据流的属性值(如网络流量)映射并累加到非大域二维表数据结构中,形成大域数据流的计数概要(如一段时间内网络总流量),与此同时,在二维表中存储计数概要伴随的频率概要(即数据流到达次数,如数据包的个数),然后根据最小计数概要与最小频率概要之比对大域数据流的缺失值(如某个数据包的流量)进行填充.采用模拟大域数据集在通用软硬件环境下进行大量实验,结果表明,基于最小计数/频率概要的填充方法可获得较高的精度,而且填充误差随数据属性值定义域的变化呈非单调性变化,另外,随着数据量的增加,填充误差虽然越来越大,但是变化越来越缓慢,最终趋于一个稳定值.对于给定误差参数ε...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号