大模型已经够聪明了为什么95%的AI项目还是跑不出ROI?
2026/6/17 19:35:49 网站建设 项目流程

2026 年,AI 落地的故事正在上演一个奇特的悖论:模型能力突飞猛进,企业 AI 投入成本与日俱增,但然后呢?越来越多的案例和数据显示,真正进入生产并产生持续 ROI 的项目仍然是少数。Gartner 甚至预测,2026 年 60% 的 AI 项目将被放弃。
背后的原因不是模型不够好,而是数据没有准备好被 AI 消费。
当 AI 进入真实业务流程后,现实的卡点是能不能拿到正确的数据、理解正确的业务语义,并基于可信的数据完成任务。在 Agentic AI 时代,这种矛盾被进一步放大。过去,数据的消费者是人,如今,越来越多 Agent 开始参与分析、开发、治理等数据工作,人和 Agent 需要基于同一套数据体系协同工作。如果企业还在沿用上个时代专为人而设计的数据平台,很难支撑 Agent 在生产环境中稳定、准确、可信地运行。
在 6 月 5 日举行的腾讯云 AI 产业应用大会上,腾讯云宣布面向 Agent 升级全栈数据平台能力,试图解开的正是这个结。通过生产级数据智能体 DataBuddy、数据智能平台 WeData 和 AI 原生大数据底座三层架构,构建人和 Agent 协同工作的智能入口、统一控制面和数据底座。
这三层架构中,带给笔者最大惊喜的,是 Buddy 家族的新成员——DataBuddy。因为它瞄准的,是数据工作流本身。从数据工程、数据治理到数据分析,数据团队最难啃的脏活累活,它都按照 Agentic AI 时代的新范式,重构了一遍。
AI 落地是一个数据问题
当行业关注点从模型能力转向 AI 落地,数据成了越来越绕不开的话题。因为在真实的业务流程中,不管 AI 是做经营分析、生成报表还是最终执行,都需要完整跑通从数据接入到数据分析、数据治理,再到最终的业务输出,这样一整条链路。这中间,任何一个环节的不确定,都会放大结果的不可靠。
然而,企业现有的数据平台,大多并不是为这条链路设计的。
回顾大数据平台的发展历程就会发现,过去 20 年,大数据平台经历过两次完整的代际演进:在大数据时代(2006-2014),重点关注的是离线数仓、ETL、报表决策,把分布式存算和开发任务工具化;在湖仓一体时代(2014-2023),重点关注的是湖仓存算、数据治理,以及资产化。
本质上,这两个时代解决的,都是 人如何更高效地使用数据 这个问题。业务方提一个数据需求,分析师先理解业务口径,再写 SQL 取数、对齐指标,最后做出一份报表。如果底层数仓不能满足,还需要数仓工程师对数仓分层做调整。这些需求从提出到交付,少则两三天,多则一两周。
这件事过去 20 年都没怎么变。整流程虽然效率不高,但基本能够运转。
但当 Agent 开始开始批量上岗后,数据平台终于迎来了新的使用者:Agent。Agent 对数据的时效性、准确性和语义一致性提出了更高的要求,原本可以依靠人工经验弥补的断层,在 Agent 面前变成了硬伤。
AI 时代带来了新的问题,同时,很多旧时代的问题,如数据孤岛、治理缺失等也被再次放大。新旧问题交织在一起,老办法已经不够用了。
“平台效率与数据质量的短板,正成为企业 AI 落地的最大瓶颈”,腾讯云大数据总经理周清认为,真正的 AI-Native 数据平台,不等于 AI+ 数据平台。在 GUI 旁边加一个 Copilot 侧边栏,也不会让一个平台真正进入 AI 时代。真正能带来改变的,是将交互、研发、运行时、治理这四个范式同时重构:
交互范式:在 AI 时代,自然语言成为新的交互方式,真正的产物是 AI 生成的,UI 是 AI 产物的投影;
研发范式:从人写代码转向 Spec-Driven,从数据需求的 Spec 来驱动 AI 去理解主动生成产物,人来做评审;
运行时范式:Agent 是一等运行时公民,与任务共生命周期;
治理范式:元数据将成为 Agent 可调用的语义 API。
当交互、研发、运行时和治理四个范式同时发生改变时,最直观的变化,将从“人使用工具”,变成“Agent 完成工作”。过去大家关注数据平台有多少功能,现在关注的,是一项数据工作能否真正交付。
DataBuddy 瞄准的,是全流程和交付
对比过去和现在的数据团队工作模式,会发现一个非常典型的问题。
过去的数据工作从需求拆解到结果分析,几乎每一步都需要不同的角色在不同的系统中完成,响应慢、易出错、成本高。在人机协作的 Agentic AI 时代,能不能把一条数据需求,变成一次端到端的交付?
DataBuddy 瞄准的正是这件事。
DataBuddy 是腾讯云于今年 5 月发布的生产级数据智能体,也是 Buddy 家族的第三位成员。如果说 CodeBuddy 面向的是开发者,WorkBuddy 面向的是职场人士,那么 DataBuddy 面向的,就是企业数据基础设施建设中最重要的角色:数据分析师、数据治理人员、数仓工程师。
它基于腾讯 WorkBuddy 同源 Agent 底层能力打造,继承了 WorkBuddy 的 Harness。 第三方数据显示,WorkBuddy 已经成为当前国内日活跃用户数(DAU)第一的效率型 Agent,这也从侧面印证了整套 Agent 底层架构的稳定性。DataBuddy 相当于站在 WorkBuddy 的肩膀上,复用了这套经过海量用户验证的成熟 Agent 底层架构。同时,DataBuddy 还 通过 Skill 引入腾讯云大数据服务内外部十几年大规模经验,以及与数据智能平台 WeData 原生深度联动,最终实现数据垂直领域的 Agent 化。
据介绍,DataBuddy 一共内置了三个数据专家,能够针对数据工程、数据治理、数据分析三大数据场景实现对话即交付。用户只需要通过自然语言对话,就能端到端完成大数据全链路任务。
在数据工程场景中,过去完全依靠人工搭建,现在 DataBuddy 能自动完成数仓方案设计、代码生成和工作流编排,将重复开发工作量降低 80%,整体研发效率提升 5-10 倍。重点不是快了,而是人不再需要关心中间每一步怎么做,新手就能直接起步。
比如在这个案例中,只需要几句话,就能让 DataBuddy 基于数据源内的原始表,从 0 到 1 设计数仓建设方案。甚至还能生成项目规范,并根据项目规范更新技术方案。
此外,DataBuddy 还提供完整的 AIOps 能力,能自动解析日志、代码、资源、上游依赖分析失败原因,输出根因判断,再基于内置的运维知识库及 Skills,推荐可信的修复方案,一键执行修复。
在数据治理场景中,过去是人工治理:敏感数据靠人工标记,质量规则凭经验拍脑袋,问题诊断止于“表象”,人工巡检覆盖率低。DataBuddy 的打法是,以 AI 实现智能守护。可以在没有预设规则的条件下,自主分析数仓中存在的问题,输出完整的质量报告。比如,它会分析哪些是敏感字段需要脱敏,哪些字段在业务层面不合逻辑,等等。
在上面这个案例中,DataBuddy 能根据信息输出当前数仓数据治理情况的分析报告,如果遇到元数据不完整或数据质量没有监控到的,能够自动推荐处理策略,用户确认后即可自动执行。
最终生成数仓数据治理分析报告非常详实,覆盖元数据完整性、血缘健康度、语义模型一致性、数据质量、数据安全合规以及存储与成本六大维度。在治理改进建议与推荐策略中,还按照紧急程度进行了划分,哪些需要立即处理的,哪些可以晚点处理的,都呈现得明明白白。
在数据分析场景中,过去业务提一个需求,排期可能得等上 1-3 天,报告完全依靠人工制作,异动归因靠经验,费时费力。DataBuddy 充当的,是一个随身的数据分析师角色。它能实现对话即交付,不会写 SQL 的业务人员和分析师,也能用 DataBuddy 实现智能问数、指标归因分析、报告生成和可视化看板搭建。同时结合 WeData 的数据语义层,DataBuddy 能大提升准确性,解决数据口径问题。比如在这个案例中,DataBuddy 能快速对 1000 个游戏用户进行行为分析。
最终生成的分析报告,不仅有核心总结,还有下一步的建议动作,参考指数非常高。
大家对 Data Agent 的期待,从来不是一个只能对话的 ChatBot,而是一个能够直接参与业务交付的数据 Agent。从 DataBuddy 落地的三大场景来看,它瞄准的正是交付这件事。
但当 Agent 开始分析数据、调用工具甚至参与业务决策时,企业最担心的往往不再是能力,而是边界。
根据 Gartner 调研,75% 的企业已经在组织内部试点、部署或使用某种形式的 AI Agent,但只有 15% 正在考虑或部署真正具备自主能力的 Agent。
相比模型能力本身,企业更关心的是另一个问题:Agent 能否在可控范围内运行?
为什么多数 Data Agent 项目都止步于幻觉?
2026 年,幻觉仍是 AI 最大的顽疾。
过去一年,很多企业的 Data Agent 项目最后都止步于“幻觉” 。“如果底层数据没准备好,上面跑什么 Agent 都是白搭。”腾讯云 WeData 产品总监唐晨表示,当下 Agent 存在两种路线:一种是 Wrapper 型 Agent,这种 Agent 实际是大模型套壳,没有数据底座,也就决定了它的上限不会太高;另一种是数据平台原生 Agent,更像是数据平台在 AI 时代的有机延伸。
DataBuddy 属于后者,它完全搭载在腾讯云全新升级的一站式数据智能平台 WeData 上。真正值得关注的,不是产品增加了多少功能,而是腾讯云在这次升级背后,对 Data+AI 时代企业数据平台演进方向的判断:Agentic AI 时代的数据平台,www.jpbara.com可能需要按照全新的范式重构。
正如前文所说,数据平台的消费者已经从人变成了 Agent。数据平台承担的也不再只是传统的元数据管理,而是直接决定 Agent 会不会产生幻觉。
腾讯云认为,统一语义正在成为 AI 时代新的数据护城河。
没有统一语义,NL2SQL 会反复掉进三个陷阱:指标歧义,系统里一个“收入”有八种口径,Agent 随机选一个;JOIN 错乱,关联键靠猜,SQL 跑得通但数据全错;查询条件随意匹配,比如过滤条件是“上季度”或者“华东区”,大模型很难理解“华东区”到底指什么。这也是多数 Data Agent 项目止步于幻觉的根因。
但语义本身并不是一个孤立模块。要让 Agent 真正做到可信、可控、可交付,还需要能够访问数据、调用能力、执行任务,并最终进入生产环境。这也从侧面解释了,为什么腾讯云没有把 DataBuddy 设计成一个独立的 Agent 产品,而是把它放进了整个 WeData 的架构体系中。
从架构上来看,DataBuddy 位于三层架构的顶层,即应用层,包括三类原生 Agent、Memory + Skill Store、MCP 协议层。
在它下面一层,叫做治理层或数据层,解决的是 AI-Ready 最关键的 Unity Catalog、统一语义、MCP。把平台所有的能力、数据,通过 MCP、Skills 暴露出来,最终让 Agent 能调得到、读得懂、用得对。
再往下是工程层,即 DIOps 全栈工程。用统一的 IDE 把数据负载和 AI 负载放在同一个 Workflow 里编排,再通过 Bundle 的发布机制解决开发到生产的发布问题,使得生产更加严谨、可信。
从应用层到数据层再到工程层,三层缺一不可。工程层接住任务,治理层接住语义,应用层接住对话,理解用户的意图。三层加在一起,才是数据平台 Agent-Native 真正的形态。 这也解释了为什么,DataBuddy 能在 WeData 上跑得起来。
把这套架构放到真实的业务场景中,价值体现得会更加清晰。
以新零售行业为例,这个行业的瓶颈从来不是数据太少,而是数据太散、报表太慢。线上线下、ERP、CRM 的数据分散在不同系统中,BI 的时效性跟不上大促节奏。此外,AI 模型上线慢,推荐系统和用户分群模型从开发到投产动辄需要 1-2 个月。非结构化数据也用不起来,商品图、客服对话、用户评价沉淀在对象存储,或者其他系统里面,无法跟大数据系统打通,缺少数据准备的链路,没法喂给 RAG。
WeData 通过全域数据接入和多源异构集成,把分散的全域数据收拢成一份统一口径,让大促决策从“等报表”变成“实时看”。其中,Unity Catalog 做全域血缘,能从一张报表追到上游每一张表;从 GMV、复购率、转化率到 ROI,统一指标口径; MLOps 全闭环承接推荐、用户增长、智能补货模型;最上面的 DataBuddy,能让企业用自然语言直接问数。
基于这一套方案,WeData 把“全域数据 + 智能模型 + 业务决策”打造成了一条工程化流水线,数据资产可以复用,营销 ROI 可以持续量化优化。
当 AI 落地的真正瓶颈来到数据层,所有数据平台都值得按照 Agentic AI 时代新的范式要求,重新做一遍。本质上,腾讯云这次升级就是在从两个视角回答同一个问题:Agentic AI 时代的数据平台,到底应该长什么样?
DataBuddy 回答的是“Agent 能做什么”,WeData 回答的是“为 Agent 准备了什么底座”。两个视角加在一起,构成了 Agentic AI 时代企业数据智能平台的完整方案。
如果把这次升级放在更长的时间轴上看,它代表的,或许是一次人机分工的重新划线。过去,数据平台是为人设计的操作台;现在,Agent 正在成为合法的“一等用户”。而这场变化,才刚刚开始。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询