首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
一种改进逐字二分中文分词词典设计   总被引:2,自引:0,他引:2  
在研究了多种分词词典机制的基础上,提出一种改进的词典机制.在传统的首字哈希表中增加拼音首字母和次字哈希标志项,在首字哈希表中查询次字的拼音首字母,根据双字以上词的数量决定是否按次字拼音首字母散列到次字首字母哈希表中,以此决定次字的查询方式.在兼顾空间复杂度的同时,缩小次字查询范围能较大幅度地提升高频词的次字的整体查询效率.第3字及其后的字串的匹配仍然采用目前成熟的词典机制.通过实验测试,该机制在增加少量的存储空间情况下,时间效率可提升26%.  相似文献   

2.
传统的局部敏感哈希算法建立哈希表时往往需要较大的内存空间以及较长的建立时间. 在查询阶段,查询样本K个最近邻数据项的所需时间超过整个运行时间的95%. 针对这些问题,运用计算设备架构将局部敏感哈希算法移植至图形处理器,并用多线程并行计算数据项的哈希值来建立哈希表. 查询阶段在全局内存中引入基于工作队列的多样本查询,以提高算法的运行效率. 实验结果表明,所提出的算法与传统的局部敏感哈希算法相比,能在不降低运算精度的情况下将运算速度提高近12倍.  相似文献   

3.
多媒体数据内容检测系统关键技术研究   总被引:1,自引:1,他引:0  
采用感知哈希技术来实现基于多媒体数据库(MMDBMS)的内容查询是目前多媒体数据库管理的主要处理方法之一.该文在感知哈希计算过程中加入哈希表快速匹配,并利用改进的Sobel算子去除边缘特征点,在保证计算结果精度基本不变的前提下,过滤掉大量边缘特征点,提高了系统的整体效率.大量实验结果表明,该方法可对多媒体数据内容进行有效检测.  相似文献   

4.
布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloom filter,PCBF)构造方案,设计可并行计算的元素插入与查询机制并结合双重哈希及非加密哈希来实现快速插入与查询;基于开启过滤器单元与访问次数构建排序字符串表优先级,使用时间片轮询算法对过滤器单元进行自适应调整,实现了资源的合理分配。实验结果表明: PCBF具有较高的插入效率,并能减少20%左右的误报数量,适用于联盟链的高并发场景。  相似文献   

5.
提高P2P网络资源快速定位效率是Chord协议的应用之一.提出了一种基于DHT的轻量级Chord资源快速定位算法.该算法根据节点自身资源被访问次数建立资源管理表并利用哈希函数对资源号有序序列实现相同资源搜索时减少遍历次数,也就加快了热度资源查询与定位速度.仿真实验表明,该算法在小型P2P网络中用来提高资源定位效率是可行的.  相似文献   

6.
为提高拷贝检测系统的鲁棒性和效率,提出一种鲁棒图像哈希算法. 用Gabor变换系数构建图像内容结构图,将它从笛卡尔坐标系变换到极坐标系进行归一化. 将归一化的结构子图加权,求得特征向量,最后通过量化得到二值哈希码. 基于Gabor系数的内容结构图有很强的鲁棒性和独特性,量化中采用的失真哈希码融合和双密钥进一步提升了算法的鲁棒性、独特性、紧凑性. 利用公开数据库分别对所提出的算法和多种代表性算法进行对比实验,比较对象包括非负矩阵分解哈希、形状上下文哈希、圆环分割与不变向量距离哈希. 实验表明,该算法在查准率和查全率方面均表现突出,匹配效率也有大幅提升,整体性能优于对比算法.  相似文献   

7.
图像检索技术旨在大规模图像库中准确、快速地检索与查询图像相似的图像。基于此,对误差加权哈希Error Weighted Hashing(EWH)快速近似最近邻搜索算法进行分析,并将其与Locality Sensitive Hashing(LSH)局部敏感哈希、Multi-Index Hashing(MIH)多索引哈希进行分析比较,然后基于误差加权哈希(EWH)算法构建图像检索系统,设计分段哈希索引的结构以及该系统所需要实现的功能模块。  相似文献   

8.
词霸2001即将问世,其最突出的特点就是实现了四向查询,包括英英、英汉、汉英、汉语。在金山词霸.net2001中,共收录了 2亿6千万字,700多万条专业词汇。权威词典达到12部,专业词库达到32套。新增了2000多幅精美图片,让查词过程更加生动。在TTS发音的基础上,首先进行了语音语速的自由调节。新增加了辅助学习的生词本,会自动收录所有查过的单词,标明查询次数,提供详细解释及相关习题。它具有全球领先的国际内核,支持多种语言同屏显示,可挂接日语德语等其他语种词库后成为多语言词典。.net色彩保证…  相似文献   

9.
当直接采用安全哈希算法对用户的密码进行加密时,虽然对密码执行了哈希运算,解决了在数据库中以明文的形式存储用户密码的潜在安全隐患问题,但是这种加密策略在面对字典、彩虹表攻击时就显得有些脆弱了,并没有达到更高的安全性.为了解决上述问题,本文设计并实现了一种带有盐度值的安全哈希加密算法.通过带有盐度值的哈希运算,可以使得生成的密文进一步随机化,进而使得攻击者需要为每个盐度值创建一条字典记录,这将使得攻击变得非常复杂,最终使攻击者利用字典、彩虹表进行攻击的成功率降低.  相似文献   

10.
本文介绍一个在PowerBuilder(简称PB)下实现的通用查询窗口,可实现对任意表的查询,输出字段、排序字段、查询条件都可以随意指定。技术方案独特,使用方便灵活,可挂接到任何PB应用软件中,从而大大提高软件的开发效率。  相似文献   

11.
近年来,人工智能、大数据、物联网等领域的快速发展,使新原理信息存储器件的设计、制造成为半导体等产业的重点发展方向阻变存储器因具有优异的存储特性、良好的尺寸化能力、易于高密度集成等显著优点,被视为下一代非挥发性存储器的理想解决方案但是由于发生电阻转变的区域难以观测,阻变器件的转变机制一直存在争议该文利用飞行时间 二次离子质谱对阻变存储单元中元素的三维分布进行探测,有效地证明了电阻转变机制与金属电极原子的扩散无关,而是由氧化物薄膜本身的电学特性所决定的该文的工作对阻变存储器件的机理探究、设计制备和性能改进具有十分积极的意义  相似文献   

12.
一种基于精确欧氏位置敏感哈希的目标检索方法   总被引:1,自引:0,他引:1  
针对目标检索问题,常用方案是视觉词典法(bag of visual words,BoVW),但传统的BoVW方法具有时间效率低、内存消耗大以及视觉单词同义性和歧义性的问题. 针对这些问题,该文提出一种基于精确欧氏位置敏感哈希(exact Euclidean locality sensitive Hashing,E2LSH)的目标检索方法. 首先,采用E2LSH 对训练图像库 的局部特征点进行聚类,生成1 组支持动态扩充的随机化视觉词典组;然后,基于这组词典构建视觉词汇直方图和索引文件,并由tf-idf 算法对词频向量重新分配权重;最后,将目标直方图特征与索引文件进行相似性匹配,完成目标检索. 实验结果表明,相比于传统方法,该方法较大地提高了检索精度,对大规模数据库有较好的适用性.  相似文献   

13.
近体诗中,凡连续出现三个或以上仄声音节的诗句被称为"连仄句"。三仄句首字以平声为正,但首字用为仄声唐人亦不规避。四仄句其对句的第三字应为平声,以救出句之拗。五仄句的句法格式自清代才被学者提出并加以解释。  相似文献   

14.
基于结构的文本信息检索技术的设计与实现   总被引:2,自引:0,他引:2  
设计了文本信息检索的一些数据结构,包括结构化倒排索引、结构索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法。这些算法以计算机机群并行环境为基础,并行数据查询提高了查询的速度。  相似文献   

15.
为了有效地更新和查询XML数据,提出了一种新的XML编码方案-分数路径编码(简写为FAPE).FAPE充分利用在两个分数间可以插入无穷多个分数这一特点,支持XML结点数据的无限更新,同时FAPE将结点的相关信息保存在相应的表中,避免记录重复的信息.实验表明:FAPE节省了存储空间,提高了查询效率,更新所花的时间更少.  相似文献   

16.
受电网资源信息维度的限制,传统电网资源数字化集成系统存在集成丢包率高、资源查询速度慢的问题,为此,利用三维数据共享技术,从硬件、数据库和软件三个方面实现电网资源数字化集成系统的优化设计在传统硬件系统的基础上,扩大无线局域网,安装A/D转换器、中介器、三维视图合成器和集成器等硬件设备在此基础上,收集电网资源及三维数据,按照数据类型存储在系统数据库中利用硬件设备和数据库调取电网资源信息,在A/D转换器内实现对初始数据的数字化处理,利用三维数据共享技术传输电网资源数据,扩大集成数据的维度,从而实现电网资源的数字化集成实验结果表明:与传统集成系统相比,设计系统的集成丢包率降低了约11.7%,应用所设计系统可以有效地提高电网资源的查询速度  相似文献   

17.
针对开关电源实验项目单一,教学效果不佳等问题,提出了一种基于相关性分析的电源个性化实验项目自动生成方法依据电源管理复杂工程问题的特征点,在充分研究电源管理实验套件(PMLK)中每个实验的基础上,挖掘出电源中各因素之间的相互约束关系;使用仿真数据构建了电源管理中各因素之间的相关性系数表;运用贝叶斯网络,依据前期作品可观察数据进行认知诊断,找出知识或能力的弱项;最后,基于相关性系数表使用Java语言开发了一个电力电子电源实验项目自动生成系统,以“负载电流对效率的影响分析及优化设计”为例,结合题目设计电源并实验测试,通过分析实验结果验证了项目的适用性  相似文献   

18.
提出了一种解决分布式数据库透明性问题的模型方法.首先从分布式数据库的四个层次的透明性出发,着重分析了扩展的关系型数据库---oracle数据库在四个层次上的透明性的实现机制,接着,给出了一种基于全局关系查询服务和命名服务的解决方法,并针对复杂关系查询问题进一步进行了分析和模型建立,试图提高对分布式数据库的查询效率和效能.  相似文献   

19.
在数据库设计中,表的性能不仅取决于其物理特性,还取决于数据库特性。对数据库、表空间和表的创建标准进行优化,可以提高其表在插入、更新、删除和查询方面的性能。基于此,本文采用创建最优性能数据库、高效移除表中数据、重建跨多个数据块的数据行方法来提高表性能。  相似文献   

20.
Oralce数据库具有明显超越普通数据库的性能,不仅提升了存储空间,也扩大了使用范围。在一些大型数据库研究中,优质的SQL查询语句和劣质的SQL查询语句之间的速度差别很有可能达到上百倍之多。为了更好地缩短大数据量的信息查询和处理时间,提升数据库应用系统的工作效率,实现对Oralce数据库中SQL查询语句的优化具有非常重要的意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号