首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
企业信息检索系统所要解决的核心问题就是:提高检索关键字集合的规范性与完备性,通过对文本相似度计算及相关分类算法,达到检索关键字集合规范性及完备性提高的目的。本文给出了线性序列相似度的定义,讨论了匹配矩阵的性质,给出了一种计算线性序列相似度的算法,并对算法作出了优化。  相似文献   

2.
对于给定的两个字符串集合,基于相似度的连接操作可用于从中找出相似的字符串对,该操作是数据清洗、数据集成以及协同过滤等应用中的核心操作之一,其执行效率直接影响系统的整体性能。本文提出一种高效计算字符串集合间连接操作的算法Trie-TSS,该方法基于trie树进行处理,利用对称性来减少冗余计算。提出一种旨在减少冗余编辑距离计算操作的优化技术来进一步提升系统性能。最后通过实验验证了Trie-TSS算法的高效性。  相似文献   

3.
软件漏洞检测在信息物理融合系统中通常使用模糊测试(Fuzzing)技术。针对Fuzzing技术中存在大量冗余的测试样本,且样本探测异常的有效性较低的情况,提出一种面向软件漏洞检测的Fuzzing样本优化的方法。首先筛除随机样本中软件不接受的样本,并通过改进的动态规划算法获得初始样本的精简集,以减小初始样本的数量;然后在测试过程中跟踪污点传播路径,利用Simhash和海明距离的改进算法求解样本传播路径相似度,通过删除相似度较高的样本进一步降低样本冗余;最后对触发异常的样本进行遗传变异构建新的测试样本,以增加样本的有效性。通过实验结果可以看出,相较于利用基于贪心算法和基于异常分布导向的方法,这里提出的方法有效减小了测试样本冗余,并且提升了测试样本的有效性。  相似文献   

4.
针对目前散乱点云数据配准算法在精度、速度和优化等方面存在的问题,提出一种基于粒子群优化算法的点云数据配准算法.该算法首先根据数据点之间曲率的相似度函数,采用粒子群优化算法在两组点云数据中搜索可以匹配的点对集合,然后用最近点迭代算法进行二次配准,实现了两组散乱点云数据的精确配准.对比实验表明,该算法配准速度快,效果好.  相似文献   

5.
用于文本分类的快速KNN算法   总被引:1,自引:0,他引:1  
KNN(k Nearest Neighbor)算法是一种简单、有效、非参数的文本分类方法.传统的KNN方法有着样本相似度计算量大的明显缺陷,使其在具有大量高维样本的文本分类中缺乏实用性.提出了一种快速查找精确的k个最近邻的TKNN(Tree-k-Nearest-Neighbor)算法,该算法建立一棵用于查找的树,加速k个最近邻的查找.首先以整个样本集合中心为基准,按照距离中心的距离将所有样本进行排序,并等分L组,作为根结点的孩子,每个孩子以同样方式处理,直到每组样本数量在[k,2k]间为止.根据这棵树查找k个最近邻,减小了查找范围,极大地降低了相似度计算量.  相似文献   

6.
针对传统KNN算法忽略样本分布对分类的影响,易受到孤立样本、噪音等干扰,时间代价大等问题,提出了一种改进的近邻分类算法.该算法首先采用类维样本存储,打破了样本的整体性,转换了训练样本存储模式;其次按类维度寻求未知样本的类维近邻域,计算类维相似度进而得到未知样本的类别相似度;最后以最大类别相似度标识未知样本.该算法提高了分类效率,降低了独立样本对样本分类的影响.同时可处理连续型和标识型样本分类,并可适应各类样本分布情况,扩大了算法的应用范围.实验结果表明,该算法较传统的近邻算法与邻域分类算法在分类精度与分类时间上有了较大提升.  相似文献   

7.
基于文本最小相似度的中心选取方法   总被引:1,自引:0,他引:1  
基于划分的聚类算法是一种局部最优算法.聚类初始中心的选择对该聚类算法的收敛速度和聚类的性能都有很大的影响.初始中心点应该选择来自不同的类并且初始中心点文本之间的相似度应尽量小,为此提出了一种新的基于最小相似度的中心选取方法,该方法选择相似度最小的两个样本分别作为初始的两个中心,然后依次选择到已知中心相似度最小的样本作为其他类的中心.实验表明该方法能够选出来自不同类的样本作为聚类的初始中心,同其他初始中心选择方法比较,聚类算法的性能有明显提高.  相似文献   

8.
为实现视频纹理的有效识别, 提出一种基于 LBP(Local Binary Patterns)和 KNN(k-Nearest Neighbor)的视频纹理识别算法。 该算法将视频纹理视为一个图像纹理集合, 通过多个图像纹理集合的方式表示。 由于可计算任意两幅纹理图像的相似度, 对于两个视频纹理, 可以计算两个图像纹理集合中所有元素之间的相似度, 将这些相似度中的最小值作为这两个视频纹理的相似度, 若要实现视频纹理的识别, 则可通过 KNN 算法实现分类与匹配。 通过在 DynTex 动态纹理数据库中的相关实验, 证明了该算法的有效性。  相似文献   

9.
开发一套新的网络入侵检测系统来证实应用混沌差分优化算法入侵检测技术的有效性。这个系统联合了基于混沌差分优化算法的异常检测和基于专家系统的滥用检测,在开发异常检测的部分时,利用混沌差分挖掘技术来从正常的行为存储模式中寻找差异,根据混沌差分进化算法的全局搜索性选择一个合适的特征集合,滥用检测部分用于寻找特征集合中异常行为描述模式,这种模式很可能预示着入侵,网络的通信量和系统的数据被用做两个元件的输入。此系统的系统结构既支持异常检测又支持滥用检测、既适用于个人工作站又可以适用于复杂网络。  相似文献   

10.
蚂蚁的自我聚集的行为可以形成蚂蚁聚簇,根据此行为提出一种基于蚂蚁树的文本文件的聚簇算法.算法中将对象属性作为为关键词,提取文本文件关键词组成一个关键词集合,一个集合代表一个对象(蚂蚁).算法将计算关键词的相对频率和对象之间的相似度,然后比较对象相似度阈值和相异度阈值,最终完成文本文件对象的聚簇.  相似文献   

11.
为了提高相似最近邻搜索(ANN)算法的精度,提出了一种在度量空间下基于距离的相似最近邻搜索算法-优化的VP森林(OVF)算法。在传统VP树(VT)算法的基础上,首先采用改进的选择优势点的方法,通过从数据集采样优势点候选集,对其进行评估,选取其中区分度大的点作为优势点;然后提出构建多棵VP树的新方法,改进距离优势点远的子树中最近邻不紧凑问题;接着提出使用优先队列与剪枝搜索方法结合的新搜索方法查找最近邻,减少了很多不必要的距离计算。最后通过实验结果表明,本文方法在数据维度、数据集大小、返回不同邻居个数、不同的距离函数及建树个数方面精度有了很大的提高。  相似文献   

12.
In this paper, we propose an analogy based immune recognition method that focuses on the implement of the clone selection process and the negative selection process by means of analogy similarity. This method is applied in an IDS (Intrusion Detection System) following several steps. Firstly, the initial abnormal behaviours sample set is optimized through the combining of the AIS (Artificial Immune System) and the genetic algorithm. Then, the abnormity probability algorithm is raised considering the two sides of abnormality and normality. Finally, an intrusion detection system model is established based on the above algorithms and models.  相似文献   

13.
为了测量大型三维复杂形状工件系泊链的五环长,研究了基于相机基线长度的测量方法,利用相机主点在成像过程中的特殊性,将五环长测量任务转化为分别测量相机的基线长度和五环的左右边缘相对于所在相机主点的水平距离;提出了链条边缘提取算法和五环长测量算法.实验表明,该系统能准确地提取链条边缘并且计算五环长,相对误差小于0.2%,满足使用要求.
  相似文献   

14.
基于二维线性判别分析和非参数化判别分析的思想,提出了一种新颖的用于人脸识别的特征提取方法--二维非参数化判别分析方法. 该方法解决了传统判别分析方法中的小样本问题与高斯分布假设问题. 可以准确、高效地实现人脸识别. 通过在ORL标准人脸数据库上的实验结果表明,算法相对于传统线性判别分析方法有显著优势.  相似文献   

15.
二维非参数化判别分析方法中的人脸识别算法研究   总被引:1,自引:0,他引:1  
在使用传统线性判别分析方法计算类间散射矩阵时,使用类中心来近似表示各个类,类内散射矩阵的定义有一定的局限性,从而导致算法性能不稳定、小样本、数据的高斯分布假设及维数困扰等问题.提出了一种用于人脸识别的二维非参数化判别分析方法,对类间散射度矩阵和类内散射度矩阵进行了重新定义,考虑了各类数据的边界结构.通过在ORL标准人脸数据库上的实验结果,验证了算法相对于传统算法的鲁棒性和准确率.  相似文献   

16.
分区变形与多重约束结合的面皮层次点对应方法   总被引:1,自引:0,他引:1  
针对颅面统计复原中基于面貌形态几何特征建立三维面皮间生理点对应关系的难题,提出几何模板分区变形与多重约束结合的三维面皮层次点对应方法(HCRDM).该方法根据人脸生理结构特征点定义一套五官分区几何模板,以实现面皮分区半自动化;根据特征点的严格对应关系,利用径向基函数对样本面皮各分区变形;为近似重合的各分区建立体素模型,逐次选取特征显著的模板顶点作为待对应点,利用模板顶点间局部相对位置几何约束确定样本分区中对应点候选集;根据局部几何特征加权距离确定最优对应点;结合几何约束与微分特征距离约束实现边界区域点对应.实验结果表明,HCRDM较已有的三维面皮点对应算法准确率提高了10%以上.  相似文献   

17.
 针对基因表达数据中的高维小样本问题,提出了一种两阶段的识别框架:“偏最小二乘法(PLS)+极大间距准则(MMC)”。该方法首先使用PLS算法提取出带有分类信息的特征,然后使用MMC准则对样本进行分类。在六个公共的基因数据库上与一些常见的基因分类方法相比较,结果显示了该方法对基于基因表达数据的肿瘤分类有效且稳定。  相似文献   

18.
Non-Mendelian segregation of markers, known as distorted segregation, is a common biological phenomenon. Although segregation distortion affects the estimation of map distances and the results of quantitative trait loci (QTL) mapping, the effects of distorted markers are often ignored in the construction of linkage maps and in QTL mapping. Recently, we have developed a multipoint method via a Hidden Markov chain method to reconstruct linkage maps in an F2 population that corrects for bias of map distances between distorted markers. In this article, the method is extended to cover backcross, doubled haploid and recombinant inbred line (RIL) populations. The results from simulated experiments show that: (1) the degree that two linked segregation distortion loci (SDL) affect the estimation of map distances increases as SDL heritability and interval length between adjacent markers increase, whereas sample size has little effect on the bias; (2) two linked SDL result in the underesti- mation of linkage distances for most cases, overestimation for an additive model with opposite additive effects, and unbiased estimation for an epistatic model with negative additive-by-additive effects; (3) the proposed method can obtain the unbiased estimation of linkage distance. This new method was applied to a rice RIL population with severely distorted segregation to reconstruct the linkage maps, and a bootstrap method was used to obtain 95% confidence intervals of map distances. The results from real data analysis further demonstrate the utility of our method, which provides a foundation for the inheritance analysis of quantitative and viability traits.  相似文献   

19.
用于边缘检测的Snake模型   总被引:16,自引:0,他引:16  
在分析Snake原始模型存在问题的基础上,提出了一种新的用于边缘检测的Snake模型。在该模型中以物体轮廓采样点到其相邻两采样点中点的距离为内部能量函数,以每个采样点与相邻两采样点线段上所有的梯度的平均值为外部能量函数,并根据内、外部能量的比值动态调节权值参数,在该模型下物体边缘检测问题被转换成求总能量函数的最小值。试验结果表明,该模型克服了原始模型在迭代求解过程中轮廓紧缩到一点的倾向及易受噪声干  相似文献   

20.
针对多功能雷达行为状态复杂多变、难以识别的问题,构建了多功能雷达行为数据集,提出了一种基于神经网络的雷达行为辨识方法。首先对数据进行预处理,提取多功能雷达的参数特征与行为状态特征,并建立两者间的映射关系。然后通过基于贝叶斯准则的变化点检测算法对原始雷达信号脉冲序列进行分割,补齐有缺失的特征参数,构造完整的可用于训练的脉冲数组样本。最后通过数据推理丰富数据库,为数据驱动的智能识别方法提供可靠的数据准备,增强神经网络的泛化能力。针对处理后的雷达行为数据集的特点,设计BP神经网络进行训练与测试。仿真实验结果表明:训练完成的网络模型在识别过程中一定程度上克服了噪声变量等干扰的影响,正确率可以达到89%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号