【AI Agent 知识库】06-评估与回归测试-详解版
模块六:评估与回归测试(详解版) 覆盖:Golden Set、离线评估、在线 A/B、LLM-as-Judge 目录 必须掌握的概念 关键设计点 常见坑与解决方案 面试高频问法 记忆要点 最小 Dem…
目标 路径 时间 结果 信息 定位 闭环 复盘 精力 极限 稳态 框架
模块六:评估与回归测试(详解版) 覆盖:Golden Set、离线评估、在线 A/B、LLM-as-Judge 目录 必须掌握的概念 关键设计点 常见坑与解决方案 面试高频问法 记忆要点 最小 Dem…