CANN Conv3DBackpropInput说明
2026/7/4 21:13:07 网站建设 项目流程

Conv3DBackpropInput使用说明

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

Ascend C提供一组Conv3DBackpropInput高阶API,便于用户快速实现卷积的反向运算,求解反向传播的误差。转置卷积Conv3DTranspose与Conv3DBackpropInput具有相同的数学过程,因此用户也可以使用Conv3DBackpropInput高阶API实现转置卷积算子。卷积的正反向传播如图1卷积层的前后向传播示意图,反向传播误差计算如图2 反向传播误差计算示意图。

Conv3DBackpropInput的计算公式为:

  • ∂L/∂Y为卷积正向损失函数对输出Y的梯度GradOutput,作为求反向传播误差∂L/∂X的输入。
  • W为卷积正向Weight权重,即矩阵核Kernel,也是滤波器Filter,作为求反向传播误差∂L/∂X的输入,WT表示W的转置。
  • ∂L/∂X为特征矩阵的反向传播误差GradInput。

图1卷积层的前后向传播示意图
![](https://raw.gitcode.com/cann/asc-devkit/raw/4d58be33f1da028b6d716e1e6e7b8d9755ae049c/docs/api/figures/卷积层的前后向传播示意图.png "卷积层的前后向传播示意图"?utm_source=gitcode_repo_files)

图2反向传播误差计算示意图
![](https://raw.gitcode.com/cann/asc-devkit/raw/4d58be33f1da028b6d716e1e6e7b8d9755ae049c/docs/api/figures/反向传播误差计算示意图.png "反向传播误差计算示意图"?utm_source=gitcode_repo_files)

Kernel侧实现Conv3DBackpropInput求解反向传播误差运算的步骤概括为:

  1. 创建Conv3DBackpropInput对象。

  2. 初始化操作。

  3. 设置卷积的输出反向GradOutput、卷积的输入Weight。

  4. 完成卷积反向操作。

  5. 结束卷积反向操作。

    [!NOTE]说明 下文中提及的M轴方向,即为GradOutput矩阵纵向;K轴方向,即为GradOutput矩阵横向或Weight矩阵纵向;N轴方向,即为Weight矩阵横向。

使用Conv3DBackpropInput高阶API求解反向传播误差运算的具体步骤如下:

  1. 创建Conv3DBackpropInput对象。

    #include "lib/conv_backprop/conv3d_bp_input_api.h" using weightDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::FRACTAL_Z_3D, weightType>; using inputSizeDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::ND, int32_t>; using gradOutputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NDC1HWC0, gradOutputType>; using gradInputDxType = ConvBackpropApi::ConvType<ConvCommonApi::TPosition::GM, ConvCommonApi::ConvFormat::NCDHW, gradInputType>; ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_;

    创建对象时需要传入权重矩阵Weight、卷积正向特征矩阵Input的shape信息InputSize、GradOutput和GradInput的参数类型信息,类型信息通过ConvType来定义,包括:内存逻辑位置、数据格式、数据类型。

    template <TPosition POSITION, ConvFormat FORMAT, typename T> struct ConvType { constexpr static TPosition pos = POSITION; // Convolution输入或输出的逻辑位置 constexpr static ConvFormat format = FORMAT; // Convolution输入或输出的数据格式 using Type = T; // Convolution输入或输出的数据类型 };

    下面简要介绍在创建对象时使用到的相关数据结构,开发者可选择性地了解这些内容。用于创建Conv3DBackpropInput对象的数据结构定义如下:

    using Conv3DBackpropInput = Conv3DBpInputIntf< Conv3DBpInputCfg<WEIGHT_TYPE, INPUT_TYPE, GRAD_OUTPUT_TYPE, GRAD_INPUT_TYPE, CONV3D_CFG_DEFAULT>, Conv3DBpInputImpl>;

    其中,Conv3DBpInputIntf、Conv3DBpInputCfg数据结构定义如下:

    template <class Config_, template <typename, class> class Impl> struct Conv3DBpInputIntf {}
    template < class WEIGHT_TYPE, class INPUT_TYPE, class GRAD_OUTPUT_TYPE, class GRAD_INPUT_TYPE, const Conv3dConfig& CONV3D_CONFIG = CONV3D_CFG_DEFAULT> struct Conv3DBpInputCfg : public ConvBpContext<WEIGHT_TYPE, INPUT_TYPE, GRAD_OUTPUT_TYPE, GRAD_INPUT_TYPE> {}

    表1ConvType说明

    | 参数 | 说明 | | --- | --- | | POSITION | 内存逻辑位置。
    Weight矩阵可设置为TPosition::GM。
    GradOutput矩阵可设置为TPosition::GM。
    InputSize可设置为TPosition::GM。
    GradInput矩阵可设置为TPosition::GM。 | | ConvFormat | 数据格式。
    Weight矩阵可设置为ConvFormat::FRACTAL_Z_3D。
    GradOutput矩阵可设置为ConvFormat::NDC1HWC0。
    InputSize矩阵可设置为ConvFormat::ND。
    GradInput矩阵可设置为ConvFormat::NDC1HWC0。 | | TYPE | 数据类型。
    Weight矩阵可设置为half、bfloat16_t。
    GradOutput矩阵可设置为half、bfloat16_t。
    InputSize矩阵可设置为int32_t。
    GradInput矩阵可设置为half、bfloat16_t。

    注意:GradOutput矩阵和Weight矩阵数据类型需要一致,具体数据类型组合关系请参考表2。 |

    表2Conv3DBackpropInput输入输出数据类型的组合说明

    WeightGradOutputInputSizeGradInput支持平台
    halfhalfint32_thalfAtlas A3 训练系列产品/Atlas A3 推理系列产品
    Atlas A2 训练系列产品/Atlas A2 推理系列产品
    bfloat16_tbfloat16_tint32_tbfloat16_tAtlas A3 训练系列产品/Atlas A3 推理系列产品
    Atlas A2 训练系列产品/Atlas A2 推理系列产品
  2. 初始化操作。

    // 注册后进行初始化 ConvBackpropApi::Conv3DBackpropInput<weightDxType, inputSizeDxType, gradOutputDxType, gradInputDxType> gradInput_; gradInput_.Init(&(tilingData->conv3DDxTiling));
  3. 设置3D卷积的输出反向GradOutput、3D卷积的输入Weight。

    gradInput_.SetSingleShape(singleShapeM_, singleShapeK_, singleShapeN_); // 设置单核计算的形状 gradInput_.SetStartPosition(dinStartIdx_, curHoStartIdx_); // 设置单核上gradOutput载入的起始位置 gradInput_.SetGradOutput(gradOutputGm_[offsetA_]); gradInput_.SetWeight(weightGm_[offsetB_]);
  4. 完成卷积反向操作。

    调用Iterate完成单次迭代计算,叠加while循环完成单核全量数据的计算。Iterate方式,可以自行控制迭代次数,完成所需数据量的计算。

    while (gradInput_.Iterate()) { gradInput_.GetTensorC(gradInputGm_[offsetC_]); }
  5. 结束卷积反向操作。

    gradInput_.End();

需要包含的头文件

#include "lib/conv_backprop/conv3d_bp_input_api.h"

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询