首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
Intrusion detection using rough set classification   总被引:6,自引:0,他引:6  
Recently machine learning-based intrusion detection approaches have been subjected to extensive researches because they can detect both misuse and anomaly. In this paper, rough set classification (RSC), a modern learning algorithm, is used to rank the features extracted for detecting intrusions and generate intrusion detection models. Feature ranking is a very critical step when building the model. RSC performs feature ranking before generating rules, and converts the feature ranking to minimal hitting set problem addressed by using genetic algorithm (GA). This is done in classical approaches using Support Vector Machine (SVM) by executing many iterations, each of which removes one useless feature. Compared with those methods, our method can avoid many iterations. In addition, a hybrid genetic algorithm is proposed to increase the convergence speed and decrease the training time of RSC. The models generated by RSC take the form of "IF-THEN" rules, which have the advantage of explication. Tests and comparison of RSC with SVM on DARPA benchmark data showed that for Probe and DoS attacks both RSC and SVM yielded highly accurate results (greater than 99% accuracy on testing set).  相似文献   

2.
网页排序技术是搜索引擎的核心技术之一. 校园网搜索引擎是指以一个校园网内的Web网页为搜索内容的搜索引擎. 由于校园网相对于互联网和内联网的特殊性,各种启发式条件对校园网网页排序优化的影响及排序融合技术在校园网搜索引擎的作用是研究的重点. 实验结果表明各个启发式条件的影响和实验数据集有关,而不同启发式条件组合经过排序融合后所获得的查全率差别很大(2%~48%). 查全率大于35%的启发式条件组合至少包含4个启发式条件,即校园网搜索引擎的排序需要依据数据集综合考虑多个启发式条件的排序结果. 排序融合技术是校园网搜索引擎具有良好的查全率的必要技术之一. 基于排序融合技术的网页排序模块已经应用于清华大学校园网搜索引擎中.  相似文献   

3.
数据库模糊查询结果自动排序方法   总被引:1,自引:0,他引:1  
数据库模糊查询会产生多个查询结果,因此有必要将查询结果按照用户需求进行排序.首先根据元组对模糊查询的隶属度,将查询结果中具有不同隶属度的元组分开.然后,利用PIR改进模型和历史查询记录来分析元组中被查询指定的属性值与未指定的属性值之间的关联程度,从而获得用户偏好并以此对具有相同隶属度的元组进行排序.在此基础上,提出了模糊查询下的DPR自动排序方法.实验及分析证明,提出的模糊查询结果自动排序方法能够极大地提高排序质量.  相似文献   

4.
一种新型决策树属性选择标准   总被引:7,自引:0,他引:7  
讨论传统决策树算法中三种常用的基于熵的属性选择标准,提出一种基于属性重要性排序的建立决策树的新方法。该方法在决策树的每个内结点首先依据属性重要性将属性进行排序,然后选择最重要的属性作为分类属性生成决策树,并抽取出规则。与传统的决策树数据分类方法相比,此方法可有效地选择出对于分类最重要的分类属性,增强决策树的抗干扰能力,并提高规则的预测精度。  相似文献   

5.
To facilitate users to access the desired information, many researches have dedicated to the Deep Web (i.e. Web databases) integration. We focus on query translation which is an important part of the Deep Web integration. Our aim is to construct automatically a set of constraints mapping rules so that the system can translate the query from the integrated interface to the Web database interfaces based on them. We construct a concept hierarchy for the attributes of the query interfaces, especially, store the synonyms and the types (e.g. Number, Text, etc.) for every concept At the same time, we construct the data hierarchies for some concepts if necessary. Then we present an algorithm to generate the constraint mapping rules based on these hierarchies. The approach is suitable for the scalability of such application and can be extended easily from one domain to another for its domain independent feature. The results of experiment show its effectiveness and efficiency.  相似文献   

6.
朱林立 《科学技术与工程》2013,13(13):3653-3657
本体作为一种结构化数据存储和表示模型已成为信息检索领域的研究热点,并被应用于生物医学、地理科学、社会科学等诸多领域。提出基于BMRM迭代排序学习方法的本体相似度计算和本体映射算法,利用BMRM迭代得到最优参数向量,由此得到排序函数,将本体图或多本体图中的顶点映射成实数,通过两顶点对应实数间的差值来确定它们对应概念间的相似度。最后,将算法分别作用于GO本体和计算机软件本体,通过实验数据对比说明新算法对特定的应用领域具有较高的效率。  相似文献   

7.
基于数据分块的分布特性,提出了一种可用于磁存储或光存储读写通道中的高码率游长受限码的编码方法,包括对数据进行子块分割和检测、建立标志子块队列,按照排队规则和无冲突子块的映射策略进行码字映射等.该方法能在给定的(d,k)受限条件下接近编码容量,并具有递推设计更高码率编码的扩展性能.利用该方法设计了码率为32/33(d=0,k=6)的游长受限码,并给出了结合子块交叉插入技巧设计64/65(0,10)游长受限码的方法,还对受限参数与码率和编码容量的关系进行了探讨.  相似文献   

8.
分析了XML文档到关系数据库的映射方法,并提出了元素树和元素树节点与其他类型数据之间的映射算法.在此基础上建立了XML模式和关系模式之间的双向映射模型,并给出了双向映射模型算法,从而完成了XML与RDB数据转换.  相似文献   

9.
XML数据到关系数据的映射   总被引:2,自引:0,他引:2  
为实现XML数据到关系数据的数据映射,提出一种模式抽取算法,通过XML2XDR模块抽取XML模式,依据模式对XML数据分类.分析XML模式与关系模式的差异性,通过XMLdata2DB模块建立XML数据到关系数据的映射规则,从而实现将XML数据映射到关系数据中.  相似文献   

10.
结合排序学习方法, 对电影排名预测任务进行研究。通过挖掘和分析电影媒体网站数据, 完成对排名预测相关特征的抽取与扩展及排名标注的对齐和划分等, 并提出面向电影媒体网站的排名预测模型。实验结果显示, 该模型能有效地提高电影排名预测任务的性能, 在为影视院线合理规划同期电影的上映时间及排片比例、为观影者提供优质热门的电影推荐等方面具有一定的应用价值。  相似文献   

11.
为解决当前可扩展标记语言(XML)绑定框架普遍存在的由XML模式映射生成的数据类的冗余,以及数据类系统规模过大的问题,提出一种从一组相关XML数据文件的数据实体类识别方法.该方法先抽取这一组XML数据文件的XML模式树图,并将其每个节点表示成向量空间中的向量;然后,利用相似度和距离识别该模式节点对应的预定义模式节点类型;最后,按模式节点类型到类的映射规则得到数据类.结果表明:该方法能识别合并对应同一个实体的数据类避免类冗余,将集合类型的XML文件映射成泛型类和集合类减小生成类系统的规模.  相似文献   

12.
An audio information retrieval model based on Manifold Ranking(MR) is proposed, and ranking results are improved using a Relevance Feedback(RF) algorithm. Timbre components are employed as the model's main feature. To compute timbre similarity, extracting the spectrum features for each frame is necessary; the large set of frames is clustered using a Gaussian Mixture Model(GMM) and expectation maximization. The typical spectra frame from GMM is drawn as data points, and MR assigns each data point a relative ranking score, which is treated as a distance instead of as traditional similarity metrics based on pair-wise distance. Furthermore, the MR algorithm can be easily generalized by adding positive and negative examples from the RF algorithm and improves the final result. Experimental results show that the proposed approach effectively improves the ranking capabilities of existing distance functions.  相似文献   

13.
基于行为的多自由度机器人运动规划   总被引:1,自引:0,他引:1  
提出了一种有效的基于行为的多关节机械手的运动规划。该规划将低级的运动规划和高级的行为决策结合在一起,在将位于机器人工作空间中的障碍物快速映射到姿态空间中的算法基础上,通过传感信息来计算局部障碍物的信息,从而形成姿态空间中障碍物的模型。定义了几种类型的行为来描述机械手的运动,并给出了选择行为的规则。而这些行为都是用基于姿态空间的算法可实现的。该方法适于多关节机器人在非确定环境中实时规划的要求。  相似文献   

14.
区间数排序方法综述   总被引:1,自引:0,他引:1  
区间数排序方法是不确定性决策领域的重要研究内容. 为便于研究者进一步分析和讨论,本文系统总结了目前发表在各类文献中的区间数排序方法,将众多研究者提供的排序方法梳理成9类,分析比较了每一类方法的特点、适用情况,对一些有不足的排序方法通过反例给出了说明. 特别是对目前应用最为广泛的基于可能度的区间数排序方法,讨论了各种不同的可能度公式,指出了它们各自的特点,分析了可能度公式的性质,证明了一些公式相互等价. 同时从可能度和保序性2个角度,分析了基于可能度矩阵的区间数排序方法的不足,并介绍了一种改进的排序方法.   相似文献   

15.
一种基于图像集的复杂场景分类方法   总被引:1,自引:0,他引:1  
保持局部图嵌入的流形鉴别分析方法将图像集所属子空间看作流形上的点,并使流形变换前后局部结构关系不变.然而在构造局部区域相似图矩阵时,用于描述节点局部区域范围的近邻节点个数会极大地影响算法的准确率,并会出现变换后流形的可分辨性相比变换前提升很小甚至更低的情况.针对该问题,提出了一种低秩描述下的Grassmannian流形鉴别分析方法.通过对图像集的低秩描述,流形变换中局部嵌入时仅保持同类别节点的最近邻局部结构以及所有节点间的相异类别信息,从而避免了对近邻节点个数的选择,并增强了变换后流形的可分辨性.由15类复杂自然场景和Caltech101图像数据集的实验结果表明,该方法是可行的,并且极大地提高了图像集分类的准确率.  相似文献   

16.
基于粗糙集-神经网络故障诊断技术的研究   总被引:2,自引:0,他引:2  
提出了一种基于粗糙集-神经网络故障诊断新方法,该方法利用粗糙集理论对数据样本进行数据浓缩,提取初步的映射规则.该规则通过神经网络进行粗映射,利用神经网络的分类逼近能力,建立输入状态空间到输出空间的精确映射,大大提高了神经网络的收敛速度和逼近精度.通过对一个电力电子电路进行实验,实验结果表明,该方法可以有效地减少输入层神经元个数,提高神经网络模型的学习效率和诊断的准确性,在故障诊断中有良好的应用前景.  相似文献   

17.
The abundance of single nucleotide polymorphisms (SNPs) makes the haplotype-based method instead of single-maker-oriented method the main approach to association studies on QTL mapping. The key problem in haploptype-based method is how to reconstruct haplotypes from genotype data. Directly assaying haplotypes in diploid individuals by experimental methods is too expensive, therefore the in silico haplotyping-determination methods are the major choice at the present. This paper presents a rapid and reliable algorithm for haplotype reconstruction for tightly linked SNPs in general pedigrees. It is based on six rules and consists of three steps. First, the parental origins of alleles in offspring are assigned conditional on genotypes in parent-offspring trios; second, the redundant haplotypes are eliminated based on the six rules; and finally, the most likely haplotype combinations are chosen via maximum likelihood method. Our method was verified and compared with PEDPHASE by simulated data with different pedigree sizes, numbers of loci, and proportions of missing genotypes. The result shows that our algorithm was superior to PEDPHASE in terms of computing time and accuracy of haplotype estimation. The computing time for 100 runs was 10―15 times less and the accuracy was 4%―10% higher than PEDPHASE. The result also indicates that our method was very robust and was hardly affected by pedigree size, number of loci, and proportion of missing genotypes.  相似文献   

18.
基于Schema的XML文档和关系模式的映射研究   总被引:2,自引:0,他引:2  
xML 逐渐成为 Internet 上数据描述和交换的标准,已经贯穿于Internet应用的各个领域之中.如何准确地实现xML与关系模式的转换已经成为一个重要的研究课题.在分析、比较了DTD与Sclnema的优缺点,基于结构、约束保持及语义保持等方面对映射规则进行研究的基础上,提出一系列基于schema的映射规则.  相似文献   

19.
DEA模型作为一种非参数评价方法,在很多领域得到广泛应用。传统的DEA方法经常会遇到多个决策单元同为DEA有效而无法区分相对优劣的情况。为了对决策单元进行全排序,本文从系统和相对效率的角度定义了相对潜力和潜力损失的概念,揭示潜力损失和强弱有效性之间的内在关联,并提出一个基于DEA系统潜力损失的决策单元全排序方法,来判定所有决策单元的优劣,最后用一个实例来说明本方法的计算步骤。  相似文献   

20.
多语种自然语言生成系统中的语言模型   总被引:1,自引:0,他引:1  
介绍了在多语种自然语言生成系统中如何用统一的模型来表示各种语种的语言知识。本文将语言知识分为语义资源和语法资源两个部分。前者通过Schema和优化规则确定文本的内容;后者根据子结构类,句法规则和词典确定文本的具体形式。该模型以复杂特征集为语言知识的载体,将表示抽象语义的数据扩展为生成不同语种文本所需的语言资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号