CANN/asc-devkit Conv3D IterateAll接口-港品优选

IterateAll

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言，原生支持C和C++标准规范，主要由类库和语言扩展层构成，提供多层级API，满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

Ascend 950PR/Ascend 950DT：不支持

Atlas A3 训练系列产品/Atlas A3 推理系列产品：支持

Atlas A2 训练系列产品/Atlas A2 推理系列产品：支持

Atlas 200I/500 A2 推理产品：不支持

Atlas 推理系列产品AI Core：不支持
Atlas 推理系列产品Vector Core：不支持

Atlas 训练系列产品：不支持

功能说明

通过设置结果矩阵Output在GM上的首地址，本接口一次性计算singleCo * singleDo * singleM大小的数据块，并写到结果矩阵Output中。

本接口提供单核内卷积计算能力，singleCo为多核切分后单个核内的输出通道大小；singleDo为多核切分后单个核内的Dout大小；singleM为多核切分后单个核内的M大小。singleCo、singleDo和singleM的大小通过SetSingleOutputShape接口设置。

函数原型

__aicore__ inline void IterateAll(const AscendC::GlobalTensor<OutputT>& output, bool enPartialSum = false)

参数说明

参数名	输入/输出	描述
output	输入	Output在GM上的地址。类型为GlobalTensor。结果矩阵Output支持的数据类型为：half、bfloat16_t。
enPartialSum	输入	预留参数。

返回值说明

无

约束说明

IterateAll接口仅支持处理单batch数据，在多batch计算场景中，需要通过batch次循环调用IterateAll接口完成计算。

for (uint64_t batchIter = 0; batchIter < singleCoreBatch; ++batchIter) { conv3dApi.SetInput(inputGm[batchIter * inputOneBatchSize]); conv3dApi.IterateAll(outputGm[batchIter * outputOneBatchSize]); conv3dApi.End(); }

IterateAll接口必须在初始化接口及输入输出配置接口之后进行调用，完成Conv3D计算，调用顺序如下。
```
Init(...); ... // 输入输出配置 IterateAll(...); End();
```

调用示例

TPipe pipe; conv3dApi.Init(&tiling); conv3dApi.SetWeight(weightGm); if (biasFlag) { conv3dApi.SetBias(biasGm); } conv3dApi.SetInputStartPosition(diIdxStart, mIdxStart); conv3dApi.SetSingleOutputShape(singleCoreCout, singleCoreDout, singleCoreM); for (uint64_t batchIter = 0; batchIter < singleCoreBatch; ++batchIter) { conv3dApi.SetInput(inputGm[batchIter * inputOneBatchSize]); conv3dApi.IterateAll(outputGm[batchIter * outputOneBatchSize]); conv3dApi.End(); }

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

企业官网建设流程全解析

IterateAll

产品支持情况

功能说明

函数原型

参数说明

返回值说明

约束说明

调用示例

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

IterateAll

产品支持情况

功能说明

函数原型

参数说明

返回值说明

约束说明

调用示例

热门文章

文章分类

标签云

相关文章

如何轻松备份微信聊天记录：WeChatMsg让你的珍贵对话永不丢失

NGA论坛优化脚本终极指南：如何通过150KB工具提升200%浏览效率

ngxtension 路由增强：查询参数、路由数据注入的完整解决方案

需要专业的网站建设服务？