首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
加权概念格是针对属性的重要程度,通过引入内涵权值而形成的一种格结构。采用加权概念格作为分类规则提取工具,通过引入加权外延支持度,给出了一种新的分类规则的提取算法CRAAF-WCL。最后,利用恒星光谱数据作为形式背景,实验验证了该算法具有较高的分类效果。  相似文献   

2.
提出了一种基于支持度和自适应加权的阵列式传感器数据融合方法。其特点是通过关联融合多组测量信号序列以降低静态数据的随机测量误差。对单传感器测量信号序列,采用支持度方法计算每个测量数据的综合支持度和加权因子,然后对测量信号序列进行加权融合。对阵列式传感器多组测量信号序列,基于单传感器数据融合,利用自适应加权方法,在总均方误差最小意义下进行多组测量信号序列数据融合。仿真结果表明,该阵列式传感器数据融合方法是有效的。  相似文献   

3.
开放源码关系数据库PostgreSQL目前还不支持对中文的全文索引.文章研究和分析了PostgreSQL的全文索引技术(TSearch2),通过对其核心函数的重写和配置文件的修改,将中文分词技术引入到了Post-greSQL的全文索引技术中,并加入了去除中文无用词的功能,从而首先实现了PostgreSQL的中文全文索引.  相似文献   

4.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

5.
在线数据融合方法在网络流量检测中一直有融合精确度低、接收点差的问题。提出一种新的网络流量监测中在线数据融合方法,采集网络流量监测中的实时在线数据,通过卡尔曼滤波法对在线数据进行预测,获取网络流量状态值;并以此为基础,通过时空综合分析,计算节点的量测实时方差;并依据最小二乘准则,对数据进行加权处理,求出加权系数,引入加权数据融合算法,实现在线数据的融合。实验结果表明,改进的融合方法不仅融合精度高,而且所需能耗低,适应能力较强。  相似文献   

6.
针对自训练半监督支持向量机算法中的低效问题,采用加权球结构支持向量机代替传统支持向量机,提出自训练半监督加权球结构支持向量机。传统支持向量机需要求解二次凸规划问题,在处理大规模数据时会消耗大量存储空间和计算时间,特别是在多分类问题上更加困难。利用球结构支持向量机进行多类别分类,大大缩短了训练时间,降低了算法复杂度。球结构支持向量机在不同类别样本数目不均衡时训练分类错误倾向于样本数目较小的类别,通过权值的引入,降低了球结构支持向量机对样本不均衡的敏感性,补偿了类别差异对算法推广性能造成的不利影响。在人工数据集和UCI(university of california irvine)数据集上的实验结果表明,该方法对有标记样本的鲁棒性较好,不仅能够提高效率,且分类精度也有显著提高。  相似文献   

7.
针对评估数据缺失的问题,提出了一种新的缺失数据填充方法.从信息熵的角度对评估系统进行描述,并提出一种建立在区间值信息系统上的加权广义信息熵,对这种信息熵的非负性、单调性和极值性进行证明.在此基础上,通过研究评估系统数据缺失前后信息熵的变化情况,建立一种基于加权广义信息熵的缺失数据填充方法,并从知识粒度的角度论述加权广义信息熵的机制.通过实例分析与现有的部分算法进行比较,进一步证明文中算法对评估系统缺失数据填充的有效性.  相似文献   

8.
对有序样品而言,每个样品与新样品关系的“密切”程度不同.预测时应该适当降低与次要数据的拟合精度,提高与重要数据的拟合精度,从而提高预测效果.在此思想下,本文提出有序样品加权最小二乘估计中权重的一种取法,即通过迭代的方法来确定一个区间,在此区间上取自然对数,以对数值作为权重来进行加权最小二乘估计.  相似文献   

9.
通过对全文索引的定义、功能、创建方法以及在网络环境中的性能和匹配等问题进行分析,通过合理使用相关参数,找出较为合理的提升全文索引性能的方法,以实现最大吞吐率和最佳性能的目的.  相似文献   

10.
结构模态参数识别的随机子空间法   总被引:1,自引:0,他引:1       下载免费PDF全文
随机子空间法(SSI)是时域识别的模态参数识别法,该法根据加权方法的不同可以有3种算法.通过 处理实桥动载实测数据,研究了这3种算法识别真实结构模态参数的问题.  相似文献   

11.
一种海量文本的动态索引方法   总被引:2,自引:0,他引:2  
研究海量文本动态索引的构造方法,通过对索引维护策略的研究和对比,设计了一个优化的索引模型,在保证检索效率的前提下,提供了实时索引的功能;提出了一种分代的动态索引构建方法,以减少索引合并代价,同时可以调节索引和检索的性能平衡,与以前方法相比,具有更高的性能和更好的规模可扩展性,并在理论和实践中验证了这种索引维护方法的高效性.  相似文献   

12.
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点。Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量。针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作。为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并。通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率。  相似文献   

13.
提出了用图像联合特征取代单一的图像特征表示内容的模型,通过把图像的相似性定义在欧氏空间,引入了空间数据索引结构,针对图像联合特征的高维性,提出用X树空间结构来索引图像联合特征从而实现对图像内容进行检索的方法,通过实验比较,证明该方法的检索不仅视觉效果良好,而且检索效率也明显提高。  相似文献   

14.
基于Lucene.Net框架,利用.NetRemoting技术,结合多种数据挖掘和推荐算法构建面向大规模文本数据的厦门人才网分布式全文检索与推荐系统.提出把大索引切割成小索引,采用多台服务器并行处理的分布式解决方案,完成招聘企业、职位、应聘人员信息的整合与聚集,实现信息的智能推荐.实验结果表明,本系统取得了较高的索引效率、较快的检索速度以及较为精准的推荐结果,并在实际应用中取得了良好的效果.  相似文献   

15.
检索体操运动员踏跳动作数据空间轨迹,有利于帮助运动员改善动作标准性,使其不易受伤且得分率更高。当前空间轨迹检索方法因索引机制不佳,只能检索较短的体操运动员踏跳动作数据空间轨迹,检索过程复杂且结果不可靠。提出一种新型体操运动员踏跳动作数据空间轨迹检索方法,采用层次化运动模型对体操运动员踏跳动作进行描述,将倾斜角度、最小外界矩形MER与紧密度、运动速度、外接矩形长宽和变化率等作为踏跳动作特征,对踏跳动作特征进行提取;依据提取的特征构建一个空间轨迹数据库,通过反向表技术完成索引。通过精确命中指标对相似度进行衡量,从而实现踏跳动作数据空间轨迹的匹配,完成体操运动员踏跳动作数据的空间轨迹检索。实验结果表明,所提方法索引性能强;且检索速度快、精度高,检索结果全面、稳定。  相似文献   

16.
当前图像检索技术普遍是从图像中提取一组局部视觉描述符来完成图像搜索,导致时耗严重以及所需的索引存储容量巨大,难以用于Web规模(1-millions)图像检索。对此,提出了基于紧凑局部描述符聚类矢量签名的Web规模图像检索机制。引入k-means聚类,计算每个聚类对应的描述符的均值μc与协方差矩阵Tc,得到每个聚类中的图像签名Tic;嵌入主成分分析,减小聚类协方差与图像描述符协方差之间的误差,优化图像签名Tic,增强表达能力;再基于Gram矩阵的低秩逼近,耦合子空间线性投影,设计紧凑局部张量聚类矢量签名机制,减小签名容量和增加识别能力;最后,对该紧凑矢量签名进行二值化处理,获取超小型签名,完成图像检索,减少索引存储容量。研究了不同参数对本文二值化紧凑矢量签名的影响。并在1-million图像数据中测试了本文图像检索机制性能。仿真结果表明:与当前检索技术相比,本文机制拥有更高的检索精度和效率;且索引存储容量更小,具备更好的可扩展性。  相似文献   

17.
Full-text indices are data structures that can be used to find any substring of a given string. Many full-text indices require space larger than the original string. In this paper, we introduce the canonical Huffman code to the wavelet tree of a string T[I...n]. Compared with Huffman code based wavelet tree, the memory space used to represent the shape of wavelet tree is not needed. In case of large alphabet, this part of memory is not negligible. The operations of wavelet tree are also simpler and more efficient due to the canonical Huffman code. Based on the resulting structure, the multi-key rank and select functions can be performed using at most nHo+│∑│(lglgn+lgn-lg│∑│)+O(nHo)bits and in O(Ho) time for average cases, where Ho is the zeroth order empirical entropy of T. In the end, we present an efficient construction algorithm for this index, which is on-line and linear.  相似文献   

18.
提出了一种新的高维查询空间过滤策略,通过将高维数据动态投影到低维的数据空间中,然后在投影空间中对查询空间进一步过滤,精练并快速缩小查询空间.同时提出了一种有效的投影策略基于最大间隔投影,这种投影策略能够提高投影空间的精练能力.而且,设计了一种新的高维索引结构MS-tree,并将新的过滤策略运用于MS-tree的范围查询.实验结果表明,这种查询空间精练策略能够有效的提高索引的性能,降低相似性查询的IO代价和CPU代价.  相似文献   

19.
This study, based on the theory of equivalence relations, proposes a novel multilevel index model for decentralized service repositories to eliminate redundant information and enhance the time-management quality of the service retrieval process of the service repository architecture. An efficient resource discovery algorithm based on Discrete Hash Tables is presented to enable efficient and effective retrieval services among different distributed repositories. The performance of the proposed model and the supporting algorithms have been evaluated in a distributed environment. Experimental results validate the effectiveness of our proposed indexing model and search algorithm.  相似文献   

20.
随着信息技术和网络技术的发展,图作为一种通用的数据结构被用于不同学科建模各种实体以及实体之间的关系,,图中各实体间隐藏了很多有价值的信息,为了挖掘图中隐藏的这些信息,图的相关研究成为了各领域的研究热点,但在大多数图研究中最关键的问题是如何有效地进行图查询。在图数据库中存在着两种图数据集:单图和图集。针对单图或图集进行图查询是相当费时的,为了加快图查询速度,图索引成为各种图查询算法的研究重点,而图索引的焦点在于利用图索引的结构模式来最小化搜索空间的大小。本文将图查询归为两种:子图查询和超图查询。在每种查询中,依据图索引建立时选择的图结构特性进行了细分,主要集中于图索引的构建思想,并对典型的索引方法进行了详细的叙述。针对不同的图索引分析了各自的优缺点,并比较了各种索引方法的特点,最后,总结并探讨了图索引的发展趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号