从“种草”到生成式AI:构建面向LLM应用的小红书高价值多模态数据集综合框架
第一部分:小红书数据生态系统:AI价值的基石 在人工智能(AI),特别是大型语言模型(LLM)飞速发展的今天,高质量、高维度、高价值的数据集已成为驱动模型能力进化的核心燃料。在众多社交媒体平台中,小红…
目标 路径 时间 结果 信息 定位 闭环 复盘 精力 极限 稳态 框架
第一部分:小红书数据生态系统:AI价值的基石 在人工智能(AI),特别是大型语言模型(LLM)飞速发展的今天,高质量、高维度、高价值的数据集已成为驱动模型能力进化的核心燃料。在众多社交媒体平台中,小红…
报告摘要 小红书(Xiaohongshu)已崛起为当代数字生态中一个极具价值的数据金矿,其独特的用户生成内容(UGC)为训练下一代人工智能(AI)和大型语言模型(LLM)提供了前所未有的机遇。本报告旨…
执行摘要 在基础模型时代,人工智能(AI)和机器学习(ML)工作负载对数据处理基础设施提出了前所未有的要求。传统的数据工程范式已难以应对海量、高质量、多模态数据集的挑战。本报告深入分析了代表AI数据处…
一、介绍 提供给机器学习从业者的开源标注工具 github:https://github.com/doccano/doccano?tab=readme-ov-file 文档:https://docca…
截至 2025 年 6 月,以 ChatGPT 系列核心模型的性能从高到低排序如下: ✅ 最新最强模型排行 o3(或称为 o3‑pro) — OpenAI 最新旗舰模型,继 o1 后推出,显著提升结构…
I. 执行摘要 2024至2025年标志着人工智能(AI)加速发展的新阶段。其主要特征表现为:AI在各项全新且更严苛的基准测试中性能显著提升;功能强大且高效的小型模型迅速普及;生成式AI和智能体AI(…
I. AI智能体框架引言 交互页面可访问:agents.qingyang.ai A. AI智能体定义及其框架的关键作用 人工智能(AI)智能体(Agent)是指能够感知环境、进行决策并执行动作的智能实…
在 Cursor 中有那么多模型,我该选哪个? 在选择模型时,我们经常会遇到一个问题:那么多模型,我该如何选择? 这不仅关系到我们的工作效率,更直接影响最终的任务完成效果。幸运的是,Cursor 已经…
数据标注, 大语言模型, LLMOps, ModelOps, DataOps, 多模态标注, 强化学习反馈, 命名实体识别, 意图识别, 客服问答, 多轮对话, 情感分析, 数据预处理, 自动化标注,…
标签:RAG,Data Cleaning,Chunking,Embedding Models,Generation Models,Vector Search,Re‑ranking,Multimodal…
标签:数据指标, 数据资产, 数据全生命周期, 数据可视化, 数据价值管理, AI数据, 数据运营, 数字化转型, 业务分析, 数据治理 🪙 一、引言:数据不是死数字,而是企业的数字化矿山 在AI数字…
单Agent架构 多Agent架构
普通RAG vs Agentic RAG 维度 普通 RAG Agentic RAG 架构特点 固定流程:预定义的检索+⽣成 动态流程:Agent 具备计划与执⾏能⼒ 检索⽅式 固定轮数检索 多轮检索…
一、模型上下文协议 MCP 就像 AI 应用程序的 USB-C 端口。 正如 USB-C 标准化设备连接一样;MCP 标准化了 AI 应用程序与数据源和工具的连接。 二、LLM 中的转换器与专家混合 …
本文档旨在提供在自然语言处理(尤其是大型语言模型,LLM)场景下准备三类数据集(知识库数据集、微调数据集、预训练数据集)的规范指导。主要内容涵盖各类数据集的定义与适用场景、数据格式要求、数据构成比例建…
英文原网页:https://raw.githubusercontent.com/asgeirtj/system_prompts_leaks/refs/heads/main/claude.txt 中文版…
标签:模型压缩, 知识蒸馏, 神经网络优化, 模型部署, 深度学习, 模型加速, 小模型, Teacher-Student架构, 边缘AI, 模型优化 一、什么是模型蒸馏? 模型蒸馏(Knowledg…
标签:数据蒸馏, 数据压缩, 数据增强, 小样本学习, 元学习, 机器学习优化, 模型训练加速, 数据子集选择, 隐私计算, AI数据优化 📍前情回顾:数据蒸馏是什么? 简而言之:数据蒸馏(Datas…
来源: Agents 实用构建指南 OpenAI – A practical guide to building agents https://cdn.openai.com/business-guid…
标签:RAG, Modular RAG, HyDE, Rerank, Prompt Engineering, 检索增强, 多阶段检索, 系统设计, LLM系统工程, 知识库问答 🎼 引子:RAG 不再…