分类： 2025

🔬数据蒸馏全解：从浓缩数据到驱动未来AI的隐形引擎

account_circle 林清杨 schedule2025年5月8日folder_open2025, AI, 数据集comment无评论

标签：数据蒸馏, 数据压缩, 数据增强, 小样本学习, 元学习, 机器学习优化, 模型训练加速, 数据子集选择, 隐私计算, AI数据优化 📍前情回顾：数据蒸馏是什么？简而言之：数据蒸馏（Datas…

客户生命周期与业务价值：在14亿人的土地上，重新定义你的产品意义

account_circle 林清杨 schedule2025年5月8日 (Updated 2025年5月8日)folder_open2025, 业务comment无评论

标签：客户生命周期, 市场营销, 营销漏斗, 用户运营, 商业分析, 产品价值, 客户分群, 数据驱动, 业务建模, 商业策略一、生意的本质：不是产品，是人心在现实的中国土地上，有14亿颗活生生跳…

什么叫产品？

account_circle 林清杨 schedule2025年5月8日folder_open2025, 产品comment无评论

标签：产品定义, 产品思维, 用户价值, 商业模型, 产品哲学, 创业思维, 产品经理, 市场需求, 创新, 商业化, 用户体验, 系统思维一、什么是“产品”？别再以为是“实物” 如果你还以为“产品…

🚂 一辆AI小火车的旅行：场景驱动 vs 数据驱动

account_circle 林清杨 schedule2025年5月8日folder_open2025, 数据科学comment无评论

标签：系统性思维, AI项目管理, 场景驱动, 数据驱动, 思维模型, 产品策略, 项目落地, 双轮驱动, 智能中台, 因果回路, 杠杆点, AI场景设计, 数据中台, 模型复用始发站在一个叫「数…

构建智能体的实用指南

account_circle 林清杨 schedule2025年4月26日 (Updated 2025年4月26日)folder_open2025, AIcomment无评论

来源： Agents 实用构建指南 OpenAI – A practical guide to building agents https://cdn.openai.com/business-guid…

不断地修正自己的直觉，你就能成为顶尖高手

account_circle 林清杨 schedule2025年4月25日 (Updated 2025年4月25日)folder_open2025comment无评论

怎么找方向？你只要盯住世界上最厉害的几个人，看他们做什么就行了。 Learn from the best

云原生时代的系统弹性：超越扩容，探讨更多趋势

account_circle 林清杨 schedule2025年4月25日folder_open2025comment无评论

云原生时代的系统弹性：超越扩容，探讨更多趋势在云原生时代，除了“按需付费”这一基础能力，即通过弹性扩容与缩容应对流量波动之外，还有许多趋势正在悄然兴起，改变着我们对分布式系统的理解与应用。这些趋势不…

保障分布式系统稳定性的三板斧：熔断、限流和降级

account_circle 林清杨 schedule2025年4月25日folder_open2025comment无评论

在现代分布式系统中，稳定性和高可用性是系统设计中的核心要求。而在实际生产环境中，由于网络波动、资源瓶颈、硬件故障或流量激增等原因，系统往往面临极大的压力。在这种情况下，熔断、限流和降级这三种机制被广泛…

日常工作中，在哪些场景会选择漏桶，哪些场景会选择令牌桶？——漏桶与令牌桶算法的选择与应用场景分析

account_circle 林清杨 schedule2025年4月25日folder_open2025comment无评论

在分布式系统中，流量控制是确保系统稳定性与高可用性的关键因素之一。面对日益增加的并发请求，如何有效管理流量，避免系统过载并保证良好的用户体验，成为了每个开发团队需要解决的重要问题。为此，限流算法应运而…

CAP定理：分布式系统的三难选择

account_circle 林清杨 schedule2025年4月25日 (Updated 2025年4月25日)folder_open2025comment无评论

在分布式系统的设计和架构中，CAP定理（也称为布鲁尔定理）是一个至关重要的概念。它揭示了在一个分布式系统中，存在三种基本的约束条件：一致性（Consistency）、可用性（Availability）…

🧠 RAG 三重奏：HyDE + Rerank + Prompt Optimization 的最强策略实践（进阶版）

account_circle 林清杨 schedule2025年4月20日folder_open2025, AIcomment无评论

标签：RAG, Modular RAG, HyDE, Rerank, Prompt Engineering, 检索增强, 多阶段检索, 系统设计, LLM系统工程, 知识库问答 🎼 引子：RAG 不再…

🧠 一文看懂 RAG 中的 Rerank：从“检”到“选”的质变飞跃

account_circle 林清杨 schedule2025年4月19日folder_open2025, AIcomment无评论

标签：RAG, Rerank, LLM, 检索增强, 检索重排序, 双塔模型, Cross-Encoder, 多阶段检索, 文本相似度, 信息检索优化本篇继续深入检索增强生成（RAG）体系的另一个灵…

🧠 一文看懂 RAG HyDE：让“假回答”替你找到真知识

account_circle 林清杨 schedule2025年4月19日folder_open2025, AIcomment无评论

标签：RAG, HyDE, LLM, 向量检索, 检索增强, Prompt Engineering, 文档嵌入, 信息检索, AI助手, AI搜索引擎 🪂 前言：RAG 的“检索短板”，终于有人补上了…

存储与网络中的 GB、MB、KB、B：到底是 1000 还是 1024？

account_circle 林清杨 schedule2025年4月17日 (Updated 2025年4月17日)folder_open2025comment无评论

标签：存储单位, 网络单位, GB换算, MB换算, 1024和1000的区别, 技术常识, 数字单位, 数据传输, 操作系统一、为什么会有“1000 vs 1024”的混乱？你是不是遇到过这种情…

MCP简介、设计理念和核心目标

account_circle 林清杨 schedule2025年4月11日folder_open2025, AIcomment无评论

本文全面搜集了关于“模型上下文协议（MCP）”的资料，包括它的起源、设计理念、协议结构、核心功能（如采样、数据传输、工具调用等），与现有协议（如OpenAI Function Calling、Lang…

《我认识的最优秀的程序员》-Hacker News

account_circle 林清杨 schedule2025年4月11日 (Updated 2025年4月11日)folder_open2025comment无评论

来源：The Best Programmers I Know | Matthias Endler 死磕官方文档 (Read the Reference)：这点我觉得太对了！遇到问题，别老是第一个就跑…

多层次知识库构建

account_circle 林清杨 schedule2025年4月11日folder_open2025, AIcomment无评论

图片来源： RAG技术演进的四大核心命题

RAG 数据增强

account_circle 林清杨 schedule2025年4月11日folder_open2025, AIcomment无评论

图片来源： RAG技术演进的四大核心命题

RAG 整体方案

account_circle 林清杨 schedule2025年4月11日folder_open2025, AIcomment无评论

图片来源： RAG技术演进的四大核心命题

大模型发展历程

account_circle 林清杨 schedule2025年4月11日 (Updated 2025年4月11日)folder_open2025, AIcomment无评论

数据来源： RAG技术演进的四大核心命题