期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	2篇
免费	0篇

专业分类

综合类

2篇

出版年

2024年	1篇
2022年	1篇

排序方式： 共有2条查询结果，搜索用时 15 毫秒

KCPNet:张量分解的轻量卷积模块设计、部署与应用

王鼎衡赵广社姚满李国齐《西安交通大学学报》2022,(3):135-146

为解决现有卷积模块在实际应用中内存消耗高、计算效率低的问题，在Kronecker CANDECOMP/PARAFAC(KCP)张量分解的基础上，提出一种轻量、高效、瓶颈结构的卷积模块(KCPNet)。对普通卷积作2阶KCP分解，生成的因子张量分别映射为两层负责输入输出通道变化的1×1卷积和两层负责特征提取的变通道可分离卷积，再将这4层卷积组成含有瓶颈结构的KCPNet卷积模块。基于OpenCL并行编程框架将KCPNet部署于嵌入式GPU,并围绕pico-flexx深度相机开发了动态手势识别应用。实验结果表明：在ImageNet大规模标准数据集上，相比ResNet、ResNeXt等已有的张量分解卷积模块，KCPNet在准确率相近的情况下能够兼顾空间和计算复杂度的效率；在中等规模标准数据集CIFAR-10上，KCPNet能够在无明显精度损失的前提下将传统的VGG模型压缩至原先的16.1%并节约75.5%的计算量；在面向嵌入式GPU时，并行部署的KCPNet可使CIFAR-10的识别速度达到100帧/s。以KCPNet为核心开发的手势识别应用程序可达到99.5%的准确率和100帧/s以上的运... 相似文献

KCPStack:张量分解的卷积核分层矩阵压缩方法

王鼎衡刘保荣杨维杨朝旭《西安交通大学学报》2024,(3):137-148

针对现有张量分解卷积核压缩方法难以兼顾时空轻量化、过于依赖卷积瓶颈结构等问题,提出一种具有可观压缩与加速能力的卷积核分层矩阵压缩方法(KCPStack)。首先,在矩阵乘法视角下,将卷积核按通道拆分为2阶克罗内克规范多项式(KCP)分解,所得因子张量组合为两层权重矩阵,使卷积计算转换为具有较高推理效率的双层轻量卷积结构;其次,对比所提KCPStack方法与其他典型张量分解卷积核压缩方法的参数约减空间复杂度与推理计算时间复杂度;最后,基于RK3588神经处理单元进行KCPStack方法的部署,面向实际场景目标检测识别需求开发相关应用。实验结果表明：与现有张量分解方法相比,在张量秩相同或者参数量相当的前提下,所提KCPStack方法具有最快的推理计算效率;在图像分类标准数据集CIFAR-10和ImageNet上,KCPStack方法能够将精度损失控制在1%左右,最高可减少85.0%的参数量和79.8%的计算量;在目标检测识别标准数据集COCO上,KCPStack方法相对于基线模型的平均精度下降不超过1%;采用所提KCPStack方法对实际场景进行目标检测识别,在RK3588神经处理单元上能达... 相似文献