AI大模型场景下的数据标注工作分析报告
数据标注, 大语言模型, LLMOps, ModelOps, DataOps, 多模态标注, 强化学习反馈, 命名实体识别, 意图识别, 客服问答, 多轮对话, 情感分析, 数据预处理, 自动化标注,…
目标 路径 时间 结果 信息 定位 闭环 复盘 精力 极限 稳态 框架
数据标注, 大语言模型, LLMOps, ModelOps, DataOps, 多模态标注, 强化学习反馈, 命名实体识别, 意图识别, 客服问答, 多轮对话, 情感分析, 数据预处理, 自动化标注,…
标签:RAG,Data Cleaning,Chunking,Embedding Models,Generation Models,Vector Search,Re‑ranking,Multimodal…
标签:数据指标, 数据资产, 数据全生命周期, 数据可视化, 数据价值管理, AI数据, 数据运营, 数字化转型, 业务分析, 数据治理 🪙 一、引言:数据不是死数字,而是企业的数字化矿山 在AI数字…
单Agent架构 多Agent架构
普通RAG vs Agentic RAG 维度 普通 RAG Agentic RAG 架构特点 固定流程:预定义的检索+⽣成 动态流程:Agent 具备计划与执⾏能⼒ 检索⽅式 固定轮数检索 多轮检索…
一、模型上下文协议 MCP 就像 AI 应用程序的 USB-C 端口。 正如 USB-C 标准化设备连接一样;MCP 标准化了 AI 应用程序与数据源和工具的连接。 二、LLM 中的转换器与专家混合 …
本文档旨在提供在自然语言处理(尤其是大型语言模型,LLM)场景下准备三类数据集(知识库数据集、微调数据集、预训练数据集)的规范指导。主要内容涵盖各类数据集的定义与适用场景、数据格式要求、数据构成比例建…
英文原网页:https://raw.githubusercontent.com/asgeirtj/system_prompts_leaks/refs/heads/main/claude.txt 中文版…
标签:模型压缩, 知识蒸馏, 神经网络优化, 模型部署, 深度学习, 模型加速, 小模型, Teacher-Student架构, 边缘AI, 模型优化 一、什么是模型蒸馏? 模型蒸馏(Knowledg…
标签:数据蒸馏, 数据压缩, 数据增强, 小样本学习, 元学习, 机器学习优化, 模型训练加速, 数据子集选择, 隐私计算, AI数据优化 📍前情回顾:数据蒸馏是什么? 简而言之:数据蒸馏(Datas…
来源: Agents 实用构建指南 OpenAI – A practical guide to building agents https://cdn.openai.com/business-guid…
标签:RAG, Modular RAG, HyDE, Rerank, Prompt Engineering, 检索增强, 多阶段检索, 系统设计, LLM系统工程, 知识库问答 🎼 引子:RAG 不再…
标签:RAG, Rerank, LLM, 检索增强, 检索重排序, 双塔模型, Cross-Encoder, 多阶段检索, 文本相似度, 信息检索优化 本篇继续深入检索增强生成(RAG)体系的另一个灵…
标签:RAG, HyDE, LLM, 向量检索, 检索增强, Prompt Engineering, 文档嵌入, 信息检索, AI助手, AI搜索引擎 🪂 前言:RAG 的“检索短板”,终于有人补上了…
本文全面搜集了关于“模型上下文协议(MCP)”的资料,包括它的起源、设计理念、协议结构、核心功能(如采样、数据传输、工具调用等),与现有协议(如OpenAI Function Calling、Lang…
图片来源: RAG技术演进的四大核心命题
图片来源: RAG技术演进的四大核心命题
图片来源: RAG技术演进的四大核心命题
数据来源: RAG技术演进的四大核心命题