CANN/ge LLM数据分布传输缓存键配置-港品优选

# TransferWithCacheKeyConfig

【免费下载链接】geGE（Graph Engine）是面向昇腾的图编译器和执行器，提供了计算图优化、多流并行、内存复用和模型下沉等技术手段，加速模型执行效率，减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力，并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

Atlas A3 训练系列产品/Atlas A3 推理系列产品：支持
Atlas A2 推理系列产品：支持
Atlas A2 训练系列产品：不支持

函数功能

构造TransferWithCacheKeyConfig。

函数原型

__init__(cache_key: Union[BlocksCacheKey, CacheKeyByIdAndIndex], src_layer_range: range = None, dst_layer_range: range = None, src_batch_index: int = 0)

参数说明

参数名	数据类型	取值说明
cache_key	Union[BlocksCacheKey, CacheKeyByIdAndIndex]	目的Cache所在实例的cluster_id。
src_layer_range	range	必选参数，本地要传输的层的范围，step只支持为1。
dst_layer_range	range	必选参数，远端要传输的层的范围，step只支持为1。
src_batch_index	int	本地cache的batch下标。当源Cache为非PA场景时可以设置。

调用示例

from llm_datadist import TransferWithCacheKeyConfig TransferWithCacheKeyConfig(BlocksCacheKey(1), range(0, 40), range(0, 40))

返回值

正常情况下返回TransferWithCacheKeyConfig的实例。

参数错误可能抛出TypeError、ValueError或LLMException。

约束说明

src_layer_range表示范围需等于dst_layer_range表示范围。
cache_key为BlocksCacheKey时，src_batch_index只能为0。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

企业官网建设流程全解析

产品支持情况

函数功能

函数原型

参数说明

调用示例

返回值

约束说明

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

产品支持情况

函数功能

函数原型

参数说明

调用示例

返回值

约束说明

热门文章

文章分类

标签云

相关文章

Mermaid在线编辑器：为什么这是你告别复杂绘图软件的最佳选择？

Ghidra与cwe_checker集成实战：打造自动化二进制漏洞审计工作流

解锁AMD Ryzen隐藏潜能：探索SMU调试工具的三大核心能力

需要专业的网站建设服务？