分类： AI

开源项目怎么免费接入 AI？用 GitHub 自带的就行

account_circle 林清杨 schedule2025年8月5日 (Updated 2025年8月5日)folder_open2025, AIcomment无评论

原文：Solving the inference problem for open source AI projects with GitHub Models 本文介绍如何利用 GitHub 免费提供…

Agent面试考察八大维度

account_circle 林清杨 schedule2025年8月3日 (Updated 2025年8月4日)folder_open2025, Agentcomment无评论

引言：超越 RAG——智能体系统的工程必要性近年来，人工智能工程领域正在经历一场深刻的范式转移，其核心是从以知识增强为目标的检索增强生成（Retrieval-Augmented Generation…

Agent架构和Claude Code原理（构建高效智能体）

account_circle 林清杨 schedule2025年7月17日folder_open2025, AIcomment无评论

一、前言我们在过去的一年中，与来自各行各业的数十个团队合作，共同构建大语言模型（LLM）智能体。我们发现，那些最成功的落地实践，并不是依赖复杂的框架或专用库，而是采用了简单、可组合的模式。在这篇文…

构建高效智能体

account_circle 林清杨 schedule2025年7月16日folder_open2025, Agent, AIcomment无评论

利用低置信度预测实现模型持续优化的闭环机制

account_circle 林清杨 schedule2025年7月2日folder_open2025, AIcomment无评论

标签：模型推理, 置信度, 主动学习, 数据回流, 微调训练, AI工程在人工智能系统中，模型训练并不是一劳永逸的过程。尤其在实际部署后，模型会遇到各种“边界样本”“难分类样本”或“新型数据分布”。…

从“种草”到生成式AI：构建面向LLM应用的小红书高价值多模态数据集综合框架

account_circle 林清杨 schedule2025年7月1日folder_open2025, AIcomment无评论

第一部分：小红书数据生态系统：AI价值的基石在人工智能（AI），特别是大型语言模型（LLM）飞速发展的今天，高质量、高维度、高价值的数据集已成为驱动模型能力进化的核心燃料。在众多社交媒体平台中，小红…

从社区到语料库：构建源自小红书的高价值AI数据集战略蓝图

account_circle 林清杨 schedule2025年7月1日folder_open2025, AIcomment无评论

报告摘要小红书（Xiaohongshu）已崛起为当代数字生态中一个极具价值的数据金矿，其独特的用户生成内容（UGC）为训练下一代人工智能（AI）和大型语言模型（LLM）提供了前所未有的机遇。本报告旨…

构建下一代AI数据栈：DataJuicer、Daft与Lance的深度剖析与比较分析

account_circle 林清杨 schedule2025年7月1日 (Updated 2025年7月2日)folder_open2025, AIcomment无评论

执行摘要在基础模型时代，人工智能（AI）和机器学习（ML）工作负载对数据处理基础设施提出了前所未有的要求。传统的数据工程范式已难以应对海量、高质量、多模态数据集的挑战。本报告深入分析了代表AI数据处…

数据标注工具-Doccano

account_circle 林清杨 schedule2025年6月20日folder_open2025, AI, 开源工具, 数据标注, 数据标注comment无评论

一、介绍提供给机器学习从业者的开源标注工具 github：https://github.com/doccano/doccano?tab=readme-ov-file 文档：https://docca…

chatgpt模型从强到弱排序

account_circle 林清杨 schedule2025年6月19日folder_open2025, AIcomment无评论

截至 2025 年 6 月，以 ChatGPT 系列核心模型的性能从高到低排序如下： ✅ 最新最强模型排行 o3（或称为 o3‑pro） — OpenAI 最新旗舰模型，继 o1 后推出，显著提升结构…

2025年人工智能发展态势：技术演进与未来趋势综合分析

account_circle 林清杨 schedule2025年6月9日folder_open2025, AIcomment无评论

I. 执行摘要 2024至2025年标志着人工智能（AI）加速发展的新阶段。其主要特征表现为：AI在各项全新且更严苛的基准测试中性能显著提升；功能强大且高效的小型模型迅速普及；生成式AI和智能体AI（…

主流AI智能体框架全景对比与深度剖析

account_circle 林清杨 schedule2025年6月9日 (Updated 2025年6月9日)folder_open2025, AIcomment无评论

I. AI智能体框架引言交互页面可访问：agents.qingyang.ai A. AI智能体定义及其框架的关键作用人工智能（AI）智能体（Agent）是指能够感知环境、进行决策并执行动作的智能实…

在 Cursor 中有那么多模型，我该选哪个？

account_circle 林清杨 schedule2025年6月2日 (Updated 2025年6月4日)folder_open2025, AI, Cursorcomment无评论

在 Cursor 中有那么多模型，我该选哪个？在选择模型时，我们经常会遇到一个问题：那么多模型，我该如何选择？这不仅关系到我们的工作效率，更直接影响最终的任务完成效果。幸运的是，Cursor 已经…

AI大模型场景下的数据标注工作分析报告

account_circle 林清杨 schedule2025年5月24日 (Updated 2025年5月24日)folder_open2025, AIcomment无评论

数据标注, 大语言模型, LLMOps, ModelOps, DataOps, 多模态标注, 强化学习反馈, 命名实体识别, 意图识别, 客服问答, 多轮对话, 情感分析, 数据预处理, 自动化标注,…

别让 RAG 只剩“三件套”

account_circle 林清杨 schedule2025年5月24日folder_open2025, AIcomment无评论

标签：RAG,Data Cleaning,Chunking,Embedding Models,Generation Models,Vector Search,Re‑ranking,Multimodal…

🌟 0 级数据指标全景文档

account_circle 林清杨 schedule2025年5月24日folder_openAIcomment无评论

标签：数据指标, 数据资产, 数据全生命周期, 数据可视化, 数据价值管理, AI数据, 数据运营, 数字化转型, 业务分析, 数据治理 🪙 一、引言：数据不是死数字，而是企业的数字化矿山在AI数字…

Agent系统架构

account_circle 林清杨 schedule2025年5月18日folder_open2025, AIcomment无评论

单Agent架构多Agent架构

普通RAG vs Agentic RAG

account_circle 林清杨 schedule2025年5月18日 (Updated 2025年5月18日)folder_open2025, AIcomment无评论

普通RAG vs Agentic RAG 维度普通 RAG Agentic RAG 架构特点固定流程：预定义的检索+⽣成动态流程：Agent 具备计划与执⾏能⼒检索⽅式固定轮数检索多轮检索…

面向 AI 工程师的 MCP、LLM 和 AI Agent 备忘单（带视觉效果）

account_circle 林清杨 schedule2025年5月18日folder_open2025, AIcomment无评论

一、模型上下文协议 MCP 就像 AI 应用程序的 USB-C 端口。正如 USB-C 标准化设备连接一样；MCP 标准化了 AI 应用程序与数据源和工具的连接。二、LLM 中的转换器与专家混合 …

自然语言处理场景下 AI 知识库、微调及预训练数据集准备规范

account_circle 林清杨 schedule2025年5月17日folder_open2025, AI, 数据集comment无评论

本文档旨在提供在自然语言处理（尤其是大型语言模型，LLM）场景下准备三类数据集（知识库数据集、微调数据集、预训练数据集）的规范指导。主要内容涵盖各类数据集的定义与适用场景、数据格式要求、数据构成比例建…