内容纲要
普通RAG vs Agentic RAG
维度 | 普通 RAG | Agentic RAG |
---|---|---|
架构特点 | 固定流程:预定义的检索+⽣成 | 动态流程:Agent 具备计划与执⾏能⼒ |
检索⽅式 | 固定轮数检索 | 多轮检索策略,可⾃我反思检索效果 |
上下⽂构建 | 固定 top-k 或基于得分排序 | Agent 可根据任务主动选择相关 chunk |
灵活性 | 可扩展性较弱,流程刚性 | ⾼度可扩展,可接⼊更多⼯具和策略 |
可维护性 | 可维护性较强,规则清楚,易定位和解决问题 | 可维护性较弱,Agent 计划不可控,调试和定位问题相对 困难 |
使⽤成本 | 实现简单,资源开销低 | 落地复杂度⾼,消耗更多 token 和计算资源 |
响应速度 | 响应速度⽐较稳定,相对较快 | 响应速度不稳定,根据不同情况时快时慢 |
场景适配策略与设计考量
1.根据任务复杂度判断
场景特征 | 使⽤策略 |
---|---|
问题范围明确、问题类型单⼀、信息集中 | 使⽤普通RAG:轻量、响应快 |
问题范围模糊、问题类型不可预测、信息分散 | 使⽤Agentic RAG:可规划推理、动态检索 |
2. 根据信息结构来判断
信息特征 | 使⽤策略 |
---|---|
单⼀集中化(如内部⽂档、规章制度) | 普通RAG更擅⻓快速定位答案 |
异构 + 多源(如⽹⻚、报告、图⽚、数据库) | Agentic RAG可使⽤⼯具理解和串联多种内容 |
3. 根据准确率/成本要求来判断
需求 | 推荐 |
---|---|
对准确率要求不⾼,成本要求⾼ | 选择普通RAG(Fast + Simple) |
对准确率和理解⼒要求⾼ | Agentic RAG更智能,更精细但成本更⾼ |