Agent系统架构
单Agent架构 多Agent架构
目标 路径 时间 结果 信息 定位 闭环 复盘 精力 极限 稳态 框架
单Agent架构 多Agent架构
普通RAG vs Agentic RAG 维度 普通 RAG Agentic RAG 架构特点 固定流程:预定义的检索+⽣成 动态流程:Agent 具备计划与执⾏能⼒ 检索⽅式 固定轮数检索 多轮检索…
一、模型上下文协议 MCP 就像 AI 应用程序的 USB-C 端口。 正如 USB-C 标准化设备连接一样;MCP 标准化了 AI 应用程序与数据源和工具的连接。 二、LLM 中的转换器与专家混合 …
本文档旨在提供在自然语言处理(尤其是大型语言模型,LLM)场景下准备三类数据集(知识库数据集、微调数据集、预训练数据集)的规范指导。主要内容涵盖各类数据集的定义与适用场景、数据格式要求、数据构成比例建…
英文原网页:https://raw.githubusercontent.com/asgeirtj/system_prompts_leaks/refs/heads/main/claude.txt 中文版…
标签:模型压缩, 知识蒸馏, 神经网络优化, 模型部署, 深度学习, 模型加速, 小模型, Teacher-Student架构, 边缘AI, 模型优化 一、什么是模型蒸馏? 模型蒸馏(Knowledg…
标签:数据蒸馏, 数据压缩, 数据增强, 小样本学习, 元学习, 机器学习优化, 模型训练加速, 数据子集选择, 隐私计算, AI数据优化 📍前情回顾:数据蒸馏是什么? 简而言之:数据蒸馏(Datas…
来源: Agents 实用构建指南 OpenAI – A practical guide to building agents https://cdn.openai.com/business-guid…
标签:RAG, Modular RAG, HyDE, Rerank, Prompt Engineering, 检索增强, 多阶段检索, 系统设计, LLM系统工程, 知识库问答 🎼 引子:RAG 不再…
标签:RAG, Rerank, LLM, 检索增强, 检索重排序, 双塔模型, Cross-Encoder, 多阶段检索, 文本相似度, 信息检索优化 本篇继续深入检索增强生成(RAG)体系的另一个灵…
标签:RAG, HyDE, LLM, 向量检索, 检索增强, Prompt Engineering, 文档嵌入, 信息检索, AI助手, AI搜索引擎 🪂 前言:RAG 的“检索短板”,终于有人补上了…
本文全面搜集了关于“模型上下文协议(MCP)”的资料,包括它的起源、设计理念、协议结构、核心功能(如采样、数据传输、工具调用等),与现有协议(如OpenAI Function Calling、Lang…
图片来源: RAG技术演进的四大核心命题
图片来源: RAG技术演进的四大核心命题
图片来源: RAG技术演进的四大核心命题
数据来源: RAG技术演进的四大核心命题
本文整理了一份全面深入的RAG策略研究报告,涵盖其演进历程、核心理念、常见技术方案、各类策略对比(包括表格)、应用场景、存在的瓶颈与挑战、以及实际选择策略的建议。重点聚焦通用问答系统以及多模态大模型实…
完美了兄弟!这就是我要的设计方向:算法动画 ≈ 游戏体验,学算法不再是“看教学”,而是“在玩游戏”中把原理一口一口吃下去。 来,我给你升级一版更完整、更“美感导向”的提示词,适配 GPT-4、Copi…
Spark-TTS 是SparkAudio 团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具,无需额外的生成模型,直接从 LLM 预测的编码中重建音频,实现零样本文本到语音的转换。S…