首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向多源异构数据的跨模态存储与检索系统
引用本文:孔亚宁,李春山,初佃辉.面向多源异构数据的跨模态存储与检索系统[J].南京大学学报(自然科学版),2022(3):377-385.
作者姓名:孔亚宁  李春山  初佃辉
作者单位:哈尔滨工业大学计算机科学与技术学院
基金项目:国家重点研发计划(2018YFB1700400);;国家自然科学基金(61902090,61832004);
摘    要:制造业在设计、生产、销售和服务环节中产生了文本、图像、音视频等海量多源异构数据,高效地管理与利用这些数据资源为制造业再生产创造价值是当前制造企业面临的重大难题.传统的数据存储与检索系统将多模态数据按不同形式或模态进行分类并单独处理,导致不同模态的数据之间缺乏语义关联(文本、图像、音视频数据之间无法互检),无法支持制造企业的设计、服务等业务流程的智能化.设计并实现了一种面向文本、图片等多源异构数据的跨模态存储与检索系统,实现智能制造多源异构数据的高效管理与检索.具体地,该系统将制造企业生产运营过程中产生的多源异构数据投影到统一的高维语义空间进行表示产生语义向量,并按不同的查询需求将数据存储到不同的模式中;其次,该系统设计了三级结构+分层联通朴素构图算法的高效检索方法,将多源异构数据按照语义向量进行索引,以满足制造业用户的语义查询需求.在flickr30k数据集上进行了实验,实验结果表明:(1)该系统可支持百万级别的跨模态数据存储与检索;(2)百万级别数据下系统检索速率为毫秒级;(3)检索的正确率比现有的向量检索方法更高.

关 键 词:多源异构数据  跨模态检索  相似搜索框架  混合检索
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号