火山引擎更新6月大模型版本,开放低成本推理算力套餐
2026/6/26 8:04:54 网站建设 项目流程

火山引擎对旗下大模型进行了六月份月度版本更新,同时面向企业用户和开发者,推出了普惠型推理算力配套套餐。目前行业做大模型业务,普遍存在推理环节算力成本高、对接适配难度大的问题,火山引擎此次更新,针对性优化了模型能力以及算力相关服务,能够帮助各类用户降低AI业务落地的难度。

一、6月新版大模型完成能力迭代优化

通用场景能力升级

在本次六月份版本更新中,火山引擎结合以往行业落地积累的数据,调整优化了模型底层相关参数。本次更新提升了模型中文语义理解、长文本逻辑整理、多模态内容生成的基础能力,优化了知识库问答、业务指令回应的适配效果,能够满足企业办公互动、文案内容创作、线上智能咨询等常见业务使用。除此之外,平台还优化了不同模型之间的联动能力,可以实现多个模型配合调用,满足企业混合部署使用的需求。

推理架构轻量化改造

本次更新还重点改动了模型推理架构,通过优化算子、做模型量化、调整显存复用方式等技术手段,减少模型运行时占用的硬件资源,降低日常业务推理产生的能耗。新版本大模型可以适配轻量化算力环境运行,企业不用搭建高配专属算力集群,就能完成日常的模型调用工作,模型本身适配普惠算力运行标准,更适合中小规模用户日常使用AI相关业务。

火山引擎大模型完成能力迭代优化图

二、低成本推理算力套餐核心内容

分层算力适配全场景使用

结合用户开发测试、线上稳定运行业务、合规化生产三大使用场景,火山引擎本次上线的推理算力套餐,一共划分了三种使用规格,能够满足个人开发者、中小微企业、监管要求较高行业这几类不同用户的使用需求。这款算力套餐没有采用大额固定算力打包付费的模式,改用弹性计费方式,用户可以根据自身业务需求选择算力额度,随时调整使用规模,适配业务不同的访问并发量。

智能调度降低算力消耗

该算力套餐搭载平台统一算力调度体系,可分级处理紧急推理、常规推理任务,错峰调配闲置算力承接非紧急业务,减少算力闲置浪费。同时搭载业务缓存复用机制,重复业务指令可复用历史推理数据,减少重复算力消耗,助力压缩业务长期使用成本,保障业务运行稳定性。

三、配套服务及行业应用价值

合规运维配套完善

本次迭代模型及推理算力服务,配套标准化数据风控能力,支持推理数据脱敏、调用日志溯源留存,契合通用行业数据管理规范。同时配备基础运维适配服务,可完成部署调试、故障排查工作,降低企业AI业务运维人力投入。

助力AI业务普惠落地

现阶段算力成本,依旧是制约中小主体大模型规模化应用的主要因素。此次模型升级叠加普惠算力开放,补齐中端AI算力基础设施短板,一方面助力中小企业舒缓AI数字化改造成本压力,落地基础智能业务;另一方面助力大型企业整合算力资源,优化现有AI业务成本结构,推动大模型从试点试用转向常态化业务落地。

本文内容整理自火山引擎官方产品动态。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询