共查询到20条相似文献,搜索用时 15 毫秒
1.
一种改进逐字二分中文分词词典设计 总被引:2,自引:0,他引:2
在研究了多种分词词典机制的基础上,提出一种改进的词典机制.在传统的首字哈希表中增加拼音首字母和次字哈希标志项,在首字哈希表中查询次字的拼音首字母,根据双字以上词的数量决定是否按次字拼音首字母散列到次字首字母哈希表中,以此决定次字的查询方式.在兼顾空间复杂度的同时,缩小次字查询范围能较大幅度地提升高频词的次字的整体查询效率.第3字及其后的字串的匹配仍然采用目前成熟的词典机制.通过实验测试,该机制在增加少量的存储空间情况下,时间效率可提升26%. 相似文献
2.
3.
多媒体数据内容检测系统关键技术研究 总被引:1,自引:1,他引:0
采用感知哈希技术来实现基于多媒体数据库(MMDBMS)的内容查询是目前多媒体数据库管理的主要处理方法之一.该文在感知哈希计算过程中加入哈希表快速匹配,并利用改进的Sobel算子去除边缘特征点,在保证计算结果精度基本不变的前提下,过滤掉大量边缘特征点,提高了系统的整体效率.大量实验结果表明,该方法可对多媒体数据内容进行有效检测. 相似文献
4.
布隆过滤器常用于联盟链Hyperledger Fabric状态数据库LevelDB的读性能优化,但布隆过滤器本身存在误报现象,且LevelDB只能对布隆过滤器进行统一配置而无法自适应调整。为此,提出一种单元化的部分计数式布隆过滤器(partial counting Bloom filter,PCBF)构造方案,设计可并行计算的元素插入与查询机制并结合双重哈希及非加密哈希来实现快速插入与查询;基于开启过滤器单元与访问次数构建排序字符串表优先级,使用时间片轮询算法对过滤器单元进行自适应调整,实现了资源的合理分配。实验结果表明: PCBF具有较高的插入效率,并能减少20%左右的误报数量,适用于联盟链的高并发场景。 相似文献
5.
提高P2P网络资源快速定位效率是Chord协议的应用之一.提出了一种基于DHT的轻量级Chord资源快速定位算法.该算法根据节点自身资源被访问次数建立资源管理表并利用哈希函数对资源号有序序列实现相同资源搜索时减少遍历次数,也就加快了热度资源查询与定位速度.仿真实验表明,该算法在小型P2P网络中用来提高资源定位效率是可行的. 相似文献
6.
为提高拷贝检测系统的鲁棒性和效率,提出一种鲁棒图像哈希算法. 用Gabor变换系数构建图像内容结构图,将它从笛卡尔坐标系变换到极坐标系进行归一化. 将归一化的结构子图加权,求得特征向量,最后通过量化得到二值哈希码. 基于Gabor系数的内容结构图有很强的鲁棒性和独特性,量化中采用的失真哈希码融合和双密钥进一步提升了算法的鲁棒性、独特性、紧凑性. 利用公开数据库分别对所提出的算法和多种代表性算法进行对比实验,比较对象包括非负矩阵分解哈希、形状上下文哈希、圆环分割与不变向量距离哈希. 实验表明,该算法在查准率和查全率方面均表现突出,匹配效率也有大幅提升,整体性能优于对比算法. 相似文献
7.
8.
词霸2001即将问世,其最突出的特点就是实现了四向查询,包括英英、英汉、汉英、汉语。在金山词霸.net2001中,共收录了 2亿6千万字,700多万条专业词汇。权威词典达到12部,专业词库达到32套。新增了2000多幅精美图片,让查词过程更加生动。在TTS发音的基础上,首先进行了语音语速的自由调节。新增加了辅助学习的生词本,会自动收录所有查过的单词,标明查询次数,提供详细解释及相关习题。它具有全球领先的国际内核,支持多种语言同屏显示,可挂接日语德语等其他语种词库后成为多语言词典。.net色彩保证… 相似文献
9.
10.
11.
段伟杰 《湘潭大学自然科学学报》2020,(4):122-126
近年来,人工智能、大数据、物联网等领域的快速发展,使新原理信息存储器件的设计、制造成为半导体等产业的重点发展方向阻变存储器因具有优异的存储特性、良好的尺寸化能力、易于高密度集成等显著优点,被视为下一代非挥发性存储器的理想解决方案但是由于发生电阻转变的区域难以观测,阻变器件的转变机制一直存在争议该文利用飞行时间 二次离子质谱对阻变存储单元中元素的三维分布进行探测,有效地证明了电阻转变机制与金属电极原子的扩散无关,而是由氧化物薄膜本身的电学特性所决定的该文的工作对阻变存储器件的机理探究、设计制备和性能改进具有十分积极的意义 相似文献
12.
一种基于精确欧氏位置敏感哈希的目标检索方法 总被引:1,自引:0,他引:1
针对目标检索问题,常用方案是视觉词典法(bag of visual words,BoVW),但传统的BoVW方法具有时间效率低、内存消耗大以及视觉单词同义性和歧义性的问题. 针对这些问题,该文提出一种基于精确欧氏位置敏感哈希(exact Euclidean locality sensitive Hashing,E2LSH)的目标检索方法. 首先,采用E2LSH 对训练图像库
的局部特征点进行聚类,生成1 组支持动态扩充的随机化视觉词典组;然后,基于这组词典构建视觉词汇直方图和索引文件,并由tf-idf 算法对词频向量重新分配权重;最后,将目标直方图特征与索引文件进行相似性匹配,完成目标检索. 实验结果表明,相比于传统方法,该方法较大地提高了检索精度,对大规模数据库有较好的适用性. 相似文献
13.
李斐 《湘潭大学自然科学学报》2008,(3)
近体诗中,凡连续出现三个或以上仄声音节的诗句被称为"连仄句"。三仄句首字以平声为正,但首字用为仄声唐人亦不规避。四仄句其对句的第三字应为平声,以救出句之拗。五仄句的句法格式自清代才被学者提出并加以解释。 相似文献
14.
基于结构的文本信息检索技术的设计与实现 总被引:2,自引:0,他引:2
阚忠良 《黑龙江大学自然科学学报》2005,22(3):393-396
设计了文本信息检索的一些数据结构,包括结构化倒排索引、结构索引和词典等,并在此结构的基础上设计实现了基于内容和结构的查询算法。这些算法以计算机机群并行环境为基础,并行数据查询提高了查询的速度。 相似文献
15.
为了有效地更新和查询XML数据,提出了一种新的XML编码方案-分数路径编码(简写为FAPE).FAPE充分利用在两个分数间可以插入无穷多个分数这一特点,支持XML结点数据的无限更新,同时FAPE将结点的相关信息保存在相应的表中,避免记录重复的信息.实验表明:FAPE节省了存储空间,提高了查询效率,更新所花的时间更少. 相似文献
16.
受电网资源信息维度的限制,传统电网资源数字化集成系统存在集成丢包率高、资源查询速度慢的问题,为此,利用三维数据共享技术,从硬件、数据库和软件三个方面实现电网资源数字化集成系统的优化设计在传统硬件系统的基础上,扩大无线局域网,安装A/D转换器、中介器、三维视图合成器和集成器等硬件设备在此基础上,收集电网资源及三维数据,按照数据类型存储在系统数据库中利用硬件设备和数据库调取电网资源信息,在A/D转换器内实现对初始数据的数字化处理,利用三维数据共享技术传输电网资源数据,扩大集成数据的维度,从而实现电网资源的数字化集成实验结果表明:与传统集成系统相比,设计系统的集成丢包率降低了约11.7%,应用所设计系统可以有效地提高电网资源的查询速度 相似文献
17.
针对开关电源实验项目单一,教学效果不佳等问题,提出了一种基于相关性分析的电源个性化实验项目自动生成方法依据电源管理复杂工程问题的特征点,在充分研究电源管理实验套件(PMLK)中每个实验的基础上,挖掘出电源中各因素之间的相互约束关系;使用仿真数据构建了电源管理中各因素之间的相关性系数表;运用贝叶斯网络,依据前期作品可观察数据进行认知诊断,找出知识或能力的弱项;最后,基于相关性系数表使用Java语言开发了一个电力电子电源实验项目自动生成系统,以“负载电流对效率的影响分析及优化设计”为例,结合题目设计电源并实验测试,通过分析实验结果验证了项目的适用性 相似文献
18.
提出了一种解决分布式数据库透明性问题的模型方法.首先从分布式数据库的四个层次的透明性出发,着重分析了扩展的关系型数据库---oracle数据库在四个层次上的透明性的实现机制,接着,给出了一种基于全局关系查询服务和命名服务的解决方法,并针对复杂关系查询问题进一步进行了分析和模型建立,试图提高对分布式数据库的查询效率和效能. 相似文献
19.
在数据库设计中,表的性能不仅取决于其物理特性,还取决于数据库特性。对数据库、表空间和表的创建标准进行优化,可以提高其表在插入、更新、删除和查询方面的性能。基于此,本文采用创建最优性能数据库、高效移除表中数据、重建跨多个数据块的数据行方法来提高表性能。 相似文献
20.
Oralce数据库具有明显超越普通数据库的性能,不仅提升了存储空间,也扩大了使用范围。在一些大型数据库研究中,优质的SQL查询语句和劣质的SQL查询语句之间的速度差别很有可能达到上百倍之多。为了更好地缩短大数据量的信息查询和处理时间,提升数据库应用系统的工作效率,实现对Oralce数据库中SQL查询语句的优化具有非常重要的意义。 相似文献