交付样例
以下展示一份标准 Agent 交付包的目录结构、核心内容和验收视角,内容已做匿名化处理。
交付包目录结构
README.md -> 项目概述与快速开始
agent-spec.json -> Agent 目标、边界、输入输出定义
system-prompt.md -> 系统提示词全文
workflow.md -> 工作流步骤、判断逻辑、异常处理
test-cases/ -> 26+ 条测试用例(normal / edge / error / high-risk / adversarial)
platform-adapters/ -> Claude Code / Codex / OpenClaw / n8n 部署说明
user-guide.md -> 客户图文使用手册
Agent Spec 示例(摘要)
Agent 名称
客服 FAQ 自动回复 Agent
业务目标
自动处理 80% 常见问题,把复杂问题升级给人工
目标用户
电商客服团队
风险边界
不承诺退款金额、不修改订单、不发送对外正式承诺
System Prompt 示例(片段)
你是一个专业的客服助手。你的职责是:
1) 根据 FAQ 知识库回答常见问题
2) 识别需要人工介入的复杂问题并分类打标
3) 绝不承诺退款金额或修改订单
4) 当不确定答案时,回复“我需要确认后回复您”
Workflow 步骤摘要
011. 接收客户消息 -> 提取关键信息
022. 匹配 FAQ 知识库 -> 置信度 > 0.85 自动回复
033. 置信度 < 0.85 -> 判断问题类型(物流 / 退款 / 规格 / 其他)
044. 物流 / 规格 -> 查询系统后回复
055. 退款 -> 标记转人工,生成工单摘要
066. 人工审核节点:退款确认、异常投诉
如何验收一个交付包
- 先看 Agent Spec 是否把目标、输入输出和禁止动作写清楚。
- 再看 Workflow 是否包含异常路径和人工审核节点。
- 确认 Test Cases 覆盖 normal、edge、error、high-risk、adversarial。
- 最后检查平台适配说明是否足够让客户团队独立落地或 review。
测试用例示例
常见问题
- 只有 Prompt,没有完整 Workflow 和升级边界。
- 测试只覆盖正常输入,没有高风险场景。
- 交付后还依赖作者口头解释才能运行。
- 把必须人工复核的动作写成了自动化承诺。