业务指标
Agent 产品的指标体系区别于传统 SaaS 的根本原因——计量单位从"使用量"转到"工作量"。三层指标框架与章节导读。
度量单位:从”使用量”切到”任务”
一个一天用 5 次但每次失败的客户,比一个一周用 1 次但全部成功的客户更危险——MAU、DAU、session 时长都无法表达这种差异。Agent 产品的度量单位必须从”使用量”切到任务:agent 是否做成了它被要求做的事、做得有多好、对业务产生了多少价值。
底层原因:每次任务执行都消耗真实的 token 与基础设施成本(见 economics/cost-model),用得越多边际成本越高。MAU 高但任务完成率低的产品,实质上比 MAU 略低但任务高完成率的产品更差——这是传统使用量指标无法发出的健康度警报。
三层指标框架
按从粗到细的层次:
工作量层(Volume)
衡量 agent 在做多少事。
- 任务发起数——每用户每月发起的任务数,反映需求渗透
- 任务完成数——成功结束的任务数,与发起数的比值即完成率
质量层(Quality)
衡量 agent 做得怎么样。
- 完成率——任务发起后成功结束的占比,agent 推理质量的直接体现
- HITL 介入率——多少任务需要人工兜底,越低越接近”全自主”
- 错误恢复率——失败任务被重试或 fallback 救回的比例,agent 韧性度量
- 首次正确率(first-pass accuracy)——任务在第一次执行就正确的比例
价值层(Value)
衡量 agent 对业务的实际贡献。
- 节省人时——agent 完成一个任务对应的人工时长,乘以任务量
- 单任务价值——节省人力成本 − agent 成本(即 economics/controls-and-roi 中的”单任务节省”字段)
- 客户 ROI——客户视角的总节省 ÷ 总投入
工作量层是基础,质量层是健康度,价值层是 ROI 闭环。任一层数据缺失,决策都会失真——例如只看工作量不看完成率,团队会被引导去推高总任务数而不在意失败率。
北极星指标的选定
不存在适用所有 agent 产品的统一北极星——按商业模式不同,候选差异显著。详见 north-star。
单位经济的特殊性
传统 SaaS 的 LTV / CAC 公式套不进 agent 产品——后者的边际成本非零,gross margin 必须按任务级摊销,且不同使用强度的用户毛利率差异巨大。详见 unit-economics。
与其他章节的衔接
- 价值层数据依赖 economics/cost-model 的成本拆解
- 工作量与质量层指标的采集对接 operations/dashboards
- 北极星指标的设计与 growth 的激活路径直接耦合
这页有帮助吗? 谢谢反馈。