首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   2篇
  免费   0篇
综合类   2篇
  2024年   1篇
  2022年   1篇
排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
为解决现有卷积模块在实际应用中内存消耗高、计算效率低的问题,在Kronecker CANDECOMP/PARAFAC(KCP)张量分解的基础上,提出一种轻量、高效、瓶颈结构的卷积模块(KCPNet)。对普通卷积作2阶KCP分解,生成的因子张量分别映射为两层负责输入输出通道变化的1×1卷积和两层负责特征提取的变通道可分离卷积,再将这4层卷积组成含有瓶颈结构的KCPNet卷积模块。基于OpenCL并行编程框架将KCPNet部署于嵌入式GPU,并围绕pico-flexx深度相机开发了动态手势识别应用。实验结果表明:在ImageNet大规模标准数据集上,相比ResNet、ResNeXt等已有的张量分解卷积模块,KCPNet在准确率相近的情况下能够兼顾空间和计算复杂度的效率;在中等规模标准数据集CIFAR-10上,KCPNet能够在无明显精度损失的前提下将传统的VGG模型压缩至原先的16.1%并节约75.5%的计算量;在面向嵌入式GPU时,并行部署的KCPNet可使CIFAR-10的识别速度达到100帧/s。以KCPNet为核心开发的手势识别应用程序可达到99.5%的准确率和100帧/s以上的运...  相似文献   
2.
针对现有张量分解卷积核压缩方法难以兼顾时空轻量化、过于依赖卷积瓶颈结构等问题,提出一种具有可观压缩与加速能力的卷积核分层矩阵压缩方法(KCPStack)。首先,在矩阵乘法视角下,将卷积核按通道拆分为2阶克罗内克规范多项式(KCP)分解,所得因子张量组合为两层权重矩阵,使卷积计算转换为具有较高推理效率的双层轻量卷积结构;其次,对比所提KCPStack方法与其他典型张量分解卷积核压缩方法的参数约减空间复杂度与推理计算时间复杂度;最后,基于RK3588神经处理单元进行KCPStack方法的部署,面向实际场景目标检测识别需求开发相关应用。实验结果表明:与现有张量分解方法相比,在张量秩相同或者参数量相当的前提下,所提KCPStack方法具有最快的推理计算效率;在图像分类标准数据集CIFAR-10和ImageNet上,KCPStack方法能够将精度损失控制在1%左右,最高可减少85.0%的参数量和79.8%的计算量;在目标检测识别标准数据集COCO上,KCPStack方法相对于基线模型的平均精度下降不超过1%;采用所提KCPStack方法对实际场景进行目标检测识别,在RK3588神经处理单元上能达...  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号