【AI Agent 知识库】25-大模型微调(SFT)
大模型微调(SFT) 目录 微调概述 数据准备 微调方法 LoRA微调 PEFT技术 微调评估 模型部署 实现示例 1. 微调概述 1.1 什么是微调 微调(Fine-tuning)是在预训练大模型基…
目标 路径 时间 结果 信息 定位 闭环 复盘 精力 极限 稳态 框架
大模型微调(SFT) 目录 微调概述 数据准备 微调方法 LoRA微调 PEFT技术 微调评估 模型部署 实现示例 1. 微调概述 1.1 什么是微调 微调(Fine-tuning)是在预训练大模型基…
一、PEFT常见的超参数 1. 通用超参数(所有PEFT方法常用) 学习率(learning_rate) Batch Size(batch_size) Epoch数量(num_epochs) 优化器类…
随着大语言模型(LLM,如GPT系列、LLaMA系列)的飞速发展和广泛应用,模型的微调技术也随之备受关注。然而,庞大的模型参数带来的算力消耗、存储需求以及部署难度,也成了使用者的巨大挑战。 为了解决这…