demo 阶段一切美好,一上线就原形毕露。把我这一年踩过的坑列出来,你照着躲,能少熬好几个夜。
坑 1:变量没对齐,模型拿空值硬编。工作流里上游字段没映射到下游,模型拿到空值不报错,给你一本正经编一个。连节点就配映射,别等画完统一弄。
坑 2:检索为空,下游照样瞎答。RAG 召回空的时候,没约束的模型会自己编。设定里写死"无依据不作答"。
坑 3:超时阈值按普通接口设。Agent 链路有大模型、有检索,比普通接口慢得多。超时按 RESTful 那套设,高峰必报错。
坑 4:知识库改了没重建索引。以为改了,其实它还按旧的答。改完必须重新索引 + 验证。
坑 5:对外不限流,被脚本刷爆。大模型按量付费,对外接口不防刷,账单能让你心梗。
坑 6:输出格式不稳,下游解析崩。要它返回 JSON,它今天纯 JSON 明天加段解释。设定里把格式按死,接收端再加容错。
坑 7:上线不留监控,出问题两眼黑。用户说"答错了",你连是哪条、它怎么想的都不知道。日志记下过程,不然没法修。
这些坑的共性:demo 不会教你,生产会狠狠教你。我现在搭 Agent 用的是一个零代码平台,省了不少底层功夫,但上面这些工程化的坑,平台给了能力、不替你负责,还得自己一个个补。
每个坑的具体解法我放评论区了。你们上线 Agent 还踩过哪些没列的?