首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
在流分类算法中,聚合位向量(ABV)算法分类速度快、并行性好,但内存开销过大;位向量折叠(AFBV)算法对ABV算法进行了改进,降低了运行时内存的消耗,但其冗余计算增加了时间开销。针对上述不足,文章提出一种改进的位向量流分类算法,该算法无需进行位向量聚合,减少了内存开销,并按规则的源/目的IP地址前缀建立分组表,根据表中分组所包含IP地址数目降序排列,使得算法具有良好的时间性能。实验结果表明,本算法在大规模规则库下具有良好的时间和空间效率。  相似文献   

2.
应用粗糙集对知识分类的特点,结合遗传算法进化理论,提出了新的数据挖掘模型;针对大数据表字段过多、信息冗余大的特点,采用粗糙集的理论方法进行处理,在改进数据预处理方法的基础上,对条件属性进行约简,提出了改进的属性约简算法;指出对于数据量大的决策表仅仅属性约简是不够的,对大量的规则还要进行筛选提取,结合遗传算法进行优化筛选处理,通过选择、交叉、变异后从大量的规则中得到较优的规则集.  相似文献   

3.
一种多维关联规则算法的研究   总被引:2,自引:0,他引:2  
针对目前很少有一整套能同时处理量化属性和分类属性字段的多维关联规则的解决方法,对将单维关联规则的Aprior算法改进为量化属性的静态离散化多维关联规则的算法进行了研究,并以实例阐述了该算法在电子商店中的应用,分析了其商业价值。  相似文献   

4.
讨论了对分类规则的挖掘采用基于关联的分类方法.关联分类规则挖掘方法主要包括两大处理步骤:第一步利用分类关联规则挖掘算法挖掘出有关的分类关联规则;第二步就是基于所挖掘出的分类关联规则构造一个分类器.详细介绍了该方法的实现算法和部分数据结构.  相似文献   

5.
丁峰  沈钧毅  赵天海 《西安交通大学学报》2002,36(10):1066-1069,1074
为了将关系数据以扩展置标语言(XML)数据的形式发布,分别提出了将关系模式映射为文件类型定义(DTD)和扩展置标语言方案(XMLSchema)的两种规则;非空表元素规则和空表元素规则,前者将关系模式中的表,记录和字段分别映射为表元素,表元素中的记录元素和记录元素中的字段子元素,后者将表映射为表元素,记录映射为表元素算法,前者借助一个链队列和两个栈分别存放解析得到的各级元素的开始,结束标记和属性,后者借助一个链队列存放解析得到的元素标记和属性,它们均可实现将关系数据写入XML文档,最后对实验结果进行了分析,得出在表数目相同,表中字段数也相同的情况下,表元素非空算法略优于空表元素算法的结论。  相似文献   

6.
一种基于SVM和规则消除组合型歧义的算法   总被引:2,自引:0,他引:2  
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.  相似文献   

7.
基于规则库和聚类分析的复句短语字段的自动识别研究   总被引:1,自引:0,他引:1  
复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%.  相似文献   

8.
给出了一个基于粗糙集的知识规则的挖掘算法系统.系统具有通用性,可以对各个领域内容的数据进行挖掘.挖掘系统理论上不限定条件字段及决策字段的个数,可以对各种离散型的数据进行处理并形成规则库.  相似文献   

9.
为弥补传统的基于文本相似函数(如编辑距离、语音距离等)的方法在重复记录的识别方面的不足,对记录内部单个字段的语义以及字段之间的语义进行了研究;采用字段名与统计分析相结合的方法来识别字段内部的语义,采用语义规则库来识别字段之间的层次语义和依赖关系;将语义引入到优先队列算法中,提出了改进的优先队列法(IPQM),在计算记录之间的相似度时,显式考虑字段之间的层次语义关系,对不同的字段类型调用不同的相似度计算方法.同时将语义规则库引入到数据清理框架,在预处理阶段利用语义来处理等价类型错误,在处理阶段利用IPQM来计算记录之间的相似度.实验结果表明该框架提高了数据清理的质量,遗漏率低于7%,误判率不超过3%.  相似文献   

10.
针对目前软件定义网络(SDN)中流表规模不断增大且存储效率较低的问题,提出了一种新的提高SDN交换机存储能力的流表压缩算法。首先对传统前缀编码算法分析,发现2的指数幂(2n)范围编码后字符串最高有效位递增,且其余低位均为通配符;其次对流表中范围字段按照2的指数幂进行分割,得到多个范围字段,利用最高位和通配符实现仅用一条表项编码2的指数幂范围字段,其他范围字段采用前缀编码;最后将编码结果存储至不同三态内容寻址存储器,进行分类存储。实验结果表明,与已有的算法相比,所提流表压缩算法在独立于流表内容的基础上具备更高的更新速度与更低的最坏情况拓展比,在防火墙类型规则集编码后平均可减少86%和83%的表项数量,且不需要占用额外比特位,从更细粒度层次实现了存储空间的优化使用,具有良好的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号