标签： LLM

account_circle 林清扬 schedule2025年9月12日folder_open2023comment无评论

一、提示工程的核心定义提示工程就是通过设计输入（Prompt）来影响大模型的输出行为。大模型（LLM）是一个条件概率分布函数： $$ P(\text{输出}|\text{输入}, \text{上下…

account_circle 林清杨 schedule2025年5月24日folder_open2025, AIcomment无评论

标签：RAG,Data Cleaning,Chunking,Embedding Models,Generation Models,Vector Search,Re‑ranking,Multimodal…

account_circle 林清杨 schedule2025年5月18日folder_open2025, AIcomment无评论

一、模型上下文协议 MCP 就像 AI 应用程序的 USB-C 端口。正如 USB-C 标准化设备连接一样；MCP 标准化了 AI 应用程序与数据源和工具的连接。二、LLM 中的转换器与专家混合 …

account_circle 林清杨 schedule2025年4月19日folder_open2025, AIcomment无评论

标签：RAG, HyDE, LLM, 向量检索, 检索增强, Prompt Engineering, 文档嵌入, 信息检索, AI助手, AI搜索引擎 🪂 前言：RAG 的“检索短板”，终于有人补上了…

account_circle 林清杨 schedule2025年3月23日folder_open2025, AIcomment有2条评论

这一篇我们就直接硬刚——从 Transformer 开始，整一份全景图式的进化剖析，理清 BERT 和 ChatGPT 的演化脉络，最后揭开 ChatGPT 背后的秘密武器：预训练 + 微调 + RL…

account_circle 林清杨 schedule2025年1月9日folder_openAIcomment无评论

大型语言模型（LLM）所使用的 tokenizer 主要差异来自于子词切分算法（BPE、WordPiece、SentencePiece 等）、多语言支持程度、词表规模及 OOV（未登录词）处理方式。选…

引言数据增强（Data Augmentation, DA）是一种广泛使用的技术。尤其在低资源条件下，数据增强增加了训练数据的规模，这样不仅可以防止模型过拟合，还能够提高深度神经网络的鲁棒性。最初，数…

account_circle 林清杨 schedule2024年8月6日folder_openAIcomment无评论

LLM 在复杂任务解决中显示出巨大潜力，但目前 LLM Agent 通常需要手动设计工作流来指导其操作，这需要大量人力和专业知识。论文提出了 AutoFlow 框架，可以自动为LLM Agent 生…

参会位置：北京市海淀区中关村南三街与科翔路交叉口西北120米，谷歌信息技术中国有限公司 Note：为什么会标注这个，因为按软件内提供的活动地址，点击后自动导航，跑到了长春桥…提个醒活动宣传图北…

会议日程 1. 《开源揭秘：35k+ Stars ChatGPT 桌面应用》 ✨ 陈鑫（lencx） 8 年前端开发经验，喜欢折腾，热衷开源，业余学习 Rust，Tauri 等。 🎙️ 分享内容：《开…