CANN Conv3DBackpropInput说明-港品优选

Conv3DBackpropInput使用说明

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言，原生支持C和C++标准规范，主要由类库和语言扩展层构成，提供多层级API，满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

Ascend C提供一组Conv3DBackpropInput高阶API，便于用户快速实现卷积的反向运算，求解反向传播的误差。转置卷积Conv3DTranspose与Conv3DBackpropInput具有相同的数学过程，因此用户也可以使用Conv3DBackpropInput高阶API实现转置卷积算子。卷积的正反向传播如图1卷积层的前后向传播示意图，反向传播误差计算如图2 反向传播误差计算示意图。

Conv3DBackpropInput的计算公式为：

∂L/∂Y为卷积正向损失函数对输出Y的梯度GradOutput，作为求反向传播误差∂L/∂X的输入。
W为卷积正向Weight权重，即矩阵核Kernel，也是滤波器Filter，作为求反向传播误差∂L/∂X的输入，W^T表示W的转置。
∂L/∂X为特征矩阵的反向传播误差GradInput。

图1卷积层的前后向传播示意图
![](https://raw.gitcode.com/cann/asc-devkit/raw/4d58be33f1da028b6d716e1e6e7b8d9755ae049c/docs/api/figures/卷积层的前后向传播示意图.png "卷积层的前后向传播示意图"?utm_source=gitcode_repo_files)

图2反向传播误差计算示意图
![](https://raw.gitcode.com/cann/asc-devkit/raw/4d58be33f1da028b6d716e1e6e7b8d9755ae049c/docs/api/figures/反向传播误差计算示意图.png "反向传播误差计算示意图"?utm_source=gitcode_repo_files)

Kernel侧实现Conv3DBackpropInput求解反向传播误差运算的步骤概括为：

创建Conv3DBackpropInput对象。
初始化操作。
设置卷积的输出反向GradOutput、卷积的输入Weight。
完成卷积反向操作。
结束卷积反向操作。
[!NOTE]说明下文中提及的M轴方向，即为GradOutput矩阵纵向；K轴方向，即为GradOutput矩阵横向或Weight矩阵纵向；N轴方向，即为Weight矩阵横向。

使用Conv3DBackpropInput高阶API求解反向传播误差运算的具体步骤如下：

创建Conv3DBackpropInput对象。

#include "lib/conv_backprop/conv3d_bp_input_api.h" using weightDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::FRACTAL_Z_3D, weightType>; using inputSizeDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::ND, int32_t>; using gradOutputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, gradOutputType>; using gradInputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NCDHW, gradInputType>; ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_;

创建对象时需要传入权重矩阵Weight、卷积正向特征矩阵Input的shape信息InputSize、GradOutput和GradInput的参数类型信息，类型信息通过ConvType来定义，包括：内存逻辑位置、数据格式、数据类型。

template <TPosition POSITION, ConvFormat FORMAT, typename T> struct ConvType { constexpr static TPosition pos = POSITION; // Convolution输入或输出的逻辑位置 constexpr static ConvFormat format = FORMAT; // Convolution输入或输出的数据格式 using Type = T; // Convolution输入或输出的数据类型 };

下面简要介绍在创建对象时使用到的相关数据结构，开发者可选择性地了解这些内容。用于创建Conv3DBackpropInput对象的数据结构定义如下：

using Conv3DBackpropInput = Conv3DBpInputIntf< Conv3DBpInputCfg<WEIGHT_TYPE, INPUT_TYPE, GRAD_OUTPUT_TYPE, GRAD_INPUT_TYPE, CONV3D_CFG_DEFAULT>, Conv3DBpInputImpl>;

其中，Conv3DBpInputIntf、Conv3DBpInputCfg数据结构定义如下：

template <class Config_, template <typename, class> class Impl> struct Conv3DBpInputIntf {}

template < class WEIGHT_TYPE, class INPUT_TYPE, class GRAD_OUTPUT_TYPE, class GRAD_INPUT_TYPE, const Conv3dConfig& CONV3D_CONFIG = CONV3D_CFG_DEFAULT> struct Conv3DBpInputCfg : public ConvBpContext<WEIGHT_TYPE, INPUT_TYPE, GRAD_OUTPUT_TYPE, GRAD_INPUT_TYPE> {}

表1ConvType说明

| 参数 | 说明 | | --- | --- | | POSITION | 内存逻辑位置。
Weight矩阵可设置为TPosition::GM。
GradOutput矩阵可设置为TPosition::GM。
InputSize可设置为TPosition::GM。
GradInput矩阵可设置为TPosition::GM。 | | ConvFormat | 数据格式。
Weight矩阵可设置为ConvFormat::FRACTAL_Z_3D。
GradOutput矩阵可设置为ConvFormat::NDC1HWC0。
InputSize矩阵可设置为ConvFormat::ND。
GradInput矩阵可设置为ConvFormat::NDC1HWC0。 | | TYPE | 数据类型。
Weight矩阵可设置为half、bfloat16_t。
GradOutput矩阵可设置为half、bfloat16_t。
InputSize矩阵可设置为int32_t。
GradInput矩阵可设置为half、bfloat16_t。

注意：GradOutput矩阵和Weight矩阵数据类型需要一致，具体数据类型组合关系请参考表2。 |

表2Conv3DBackpropInput输入输出数据类型的组合说明

Weight	GradOutput	InputSize	GradInput	支持平台
half	half	int32_t	half	Atlas A3 训练系列产品/Atlas A3 推理系列产品 Atlas A2 训练系列产品/Atlas A2 推理系列产品
bfloat16_t	bfloat16_t	int32_t	bfloat16_t	Atlas A3 训练系列产品/Atlas A3 推理系列产品 Atlas A2 训练系列产品/Atlas A2 推理系列产品

初始化操作。

// 注册后进行初始化 ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_; gradInput_.Init(&(tilingData->conv3DDxTiling));

设置3D卷积的输出反向GradOutput、3D卷积的输入Weight。

gradInput_.SetSingleShape(singleShapeM_, singleShapeK_, singleShapeN_); // 设置单核计算的形状 gradInput_.SetStartPosition(dinStartIdx_, curHoStartIdx_); // 设置单核上gradOutput载入的起始位置 gradInput_.SetGradOutput(gradOutputGm_[offsetA_]); gradInput_.SetWeight(weightGm_[offsetB_]);

完成卷积反向操作。
调用Iterate完成单次迭代计算，叠加while循环完成单核全量数据的计算。Iterate方式，可以自行控制迭代次数，完成所需数据量的计算。
```
while (gradInput_.Iterate()) { gradInput_.GetTensorC(gradInputGm_[offsetC_]); }
```
结束卷积反向操作。
```
gradInput_.End();
```

需要包含的头文件

#include "lib/conv_backprop/conv3d_bp_input_api.h"

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

企业官网建设流程全解析

Conv3DBackpropInput使用说明

需要包含的头文件

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

Conv3DBackpropInput使用说明

需要包含的头文件

热门文章

文章分类

标签云

相关文章

FreeMoCap：5步开启你的免费动作捕捉之旅

从零到精通：Ryujinx Switch模拟器的完整实战指南

2026，手机自拍港澳通行证照片完整指南：规格、妆容、拍摄与修图全流程

需要专业的网站建设服务？