标签：大模型

提示工程（Prompt Engineering）原理

account_circle 林清扬 schedule2025年9月12日folder_open2023

一、提示工程的核心定义提示工程就是通过设计输入（Prompt）来影响大模型的输出行为。大模型（LLM）是一个条件概率分布函数： $$ P(\text{输出}|\text{输入}, \text{上下…

打造更聪明的语义搜索：融合 RAG、Re-ranking 与 Prompt 增强的实战指南

account_circle 林清杨 schedule2025年3月23日folder_open2025, AI

这篇我们就冲进语义搜索 + 大模型的世界，做一件真正「懂用户」的事：引入 RAG（检索增强生成）、Re-ranking 重排序和 Prompt 指令增强，打造一个像 ChatGPT 那样“理解+回答…

驯服巨兽：一场关于AI大模型训练平台的冒险之旅

account_circle 林清杨 schedule2024年10月16日folder_open模型训练平台

这场关于AI大模型训练平台的冒险，虽然充满了挑战与冲突，但正是这些波折造就了一个功能强大、前景广阔的AI训练平台。对于团队来说，这不仅是技术的胜利，也是智慧、协作与毅力的象征。每一次的挣扎与突破，都是…

MacBookPro M3 Max 64GB 用ollama跑llama3.1 8B 和 70B

account_circle 林清杨 schedule2024年8月9日folder_openAI

llama3.1 8B mac M3 Max 64GB，用ollama跑llama3.1 8B，速度飞快，和gpt3.5响应速度差不多 llama3.1 70b 问答前后对比，64GB内存刚好够用，速…

大模型训练超参数文档

account_circle 林清杨 schedule2024年6月20日 (Updated 2024年6月20日)folder_open技术教程

大模型训练超参数文档数据来源：https://huggingface.co/docs/transformers/v4.41.3/en/main_classes/trainer#transformer…

中国大模型产品罗盘@202405

account_circle 林清杨 schedule2024年5月14日folder_openAI

如果要跑大模型，显卡显存计算

account_circle 林清杨 schedule2024年4月11日 (Updated 2024年10月23日)folder_openAI, AutoDL, 大模型

问题 1、要跑大模型，要多少显存 2、6B如果要自己搭建，显存要多少回答 1、显存大小 = 大模型多少B 2 +2GB富余空间用于存储对话记忆等内容 2、6B 2 + 2 = 14GB以上显存可支…

国内近200家大模型总结

account_circle 林清杨 schedule2024年4月1日folder_open大模型

国内近200家大模型总结本文总结了188家国内现有大模型企业，以及各企业开发的模型和所处行业。受公众号排版限制不能使用表格，需要购买表格版的朋友请私信我。序号公司大模型省市类别 1 百度 …

AI提示词和AI网站信息汇总@20240321

account_circle 林清杨 schedule2024年3月21日 (Updated 2024年3月21日)folder_open2024, AI

2024年3月21日微信文章 Prompt工程师压箱底绝活——Prompt的基本组成部分、格式化输出与应用构建提示词编写规则提示词编写示例测试提示词方法和平台要测试提示词，使用国内任何一家提…

大模型微调训练营-毕业证书-极客时间

account_circle 林清杨 schedule2024年2月27日 (Updated 2024年4月11日)folder_open2024, AI, 极客时间-AI大模型微调训练营

完成大模型微调训练营第0期的学习，拿到毕业证书啦！！！回味无穷，没有辜负购课时候的目标🎯，工作中都用上了，但是还得继续不断消化实践，推荐～

大模型微调训练营-毕业总结

account_circle 林清杨 schedule2024年2月25日folder_openAI, 课程-专栏comment有2条评论

在极客时间 AI 大模型微调训练营学习一学期下来，目前就要结束了，现对于整个学期做个总结如下： 1、目前在什么岗位做什么？目前在做 1、AI业务场景落地 2、提效AI开发的产品平台。 2、为什么选择…

AI 大模型基础知识问题

account_circle 林清杨 schedule2024年2月7日 (Updated 2024年2月7日)folder_openAI

一、选择题 1、n-gram 模型中的“n”通常代表什么？ A. 神经网络的层数 B. 词汇表的大小 C. 上下文中的词数 D. 可选的参数数量 2、最大似然估计在 n-gram 模型中的主要目的是什…

26 条有效的提示词技巧

account_circle 林清杨 schedule2023年12月29日 (Updated 2023年12月29日)folder_openAI

作者写了一篇论文：Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 总结下来就是 26 条有效…

保存Google Colab数据文件或目录到Google Drive云盘

account_circle 林清杨 schedule2023年12月21日 (Updated 2023年12月21日)folder_openAI

一、背景在Google Colab上使用T4 GPU完成微调训练的模型，保存了模型和训练状态的文件存放在Google Colab /content目录内，需要备份。考虑到下载到本地需要大量的流量，且…

北京大学 – 多模态大模型

account_circle 林清杨 schedule2023年6月12日folder_open大模型

【清华NLP】刘知远团队大模型公开课全网首发｜带你从入门到实战

account_circle 林清杨 schedule2023年6月12日folder_open大模型

OpenBMB携手清华大学自然语言处理实验室，共同推出《大模型交叉研讨课》，意在为对大模型感兴趣的同学提供相关资源，为大模型领域的探索打下基础。本课程将手把手带领同学从深度学习开始快速了解大模型的相关…

讯飞星火大模型指令集

account_circle 林清杨 schedule2023年5月8日folder_open讯飞星火大模型

https://xinghuo.xfyun.cn/desk