CANN/asc-devkit:L0C到GM配置设置
2026/7/5 16:59:27 网站建设 项目流程

asc_set_l0c2gm_config

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

头文件路径:"c_api/cube_compute/cube_compute.h"

数据搬运过程中进行随路量化时,通过调用该接口设置量化流程中的矢量量化参数。

函数原型

__aicore__ inline void asc_set_l0c2gm_config(uint64_t relu_pre, uint64_t quant_pre, bool enable_unit_flag)

参数说明

参数名输入/输出描述
relu_pre输入ReLU操作前矢量的起始地址。
quant_pre输入量化操作前矢量的起始地址。
enable_unit_flag输入是否启用unit_flag。unit_flag是一种矩阵计算指令和矩阵搬运指令细粒度的并行,开启该功能后,硬件每计算完一个分形,计算结果就会被搬出,该功能不适用于L0C Buffer累加的场景。

返回值说明

流水类型

PIPE_S

约束说明

支持以下三种传参形式:

  • 同时设置relu_pre和quant_pre。
  • 仅传入relu_pre,quant_pre传入0。
  • 仅传入quant_pre,relu_pre传入0。

调用示例

constexpr uint64_t relu_pre = 0; constexpr uint64_t quant_pre = 0x1000;// 假设量化操作有效地址为0x1000 asc_set_l0c2gm_config(relu_pre, quant_pre, true);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询