标签：人类反馈

一、SFT（Supervised Fine-Tuning，监督微调） 1. 原理核心思路：基于已有的大模型（通常是预训练语言模型），在标注好的高质量指令数据集上进行监督学习。训练目标：最小化模型输…

account_circle 林清杨 schedule2025年3月23日folder_open2025, AI

在人工智能时代快速发展的今天，大语言模型（如GPT系列、Claude、Gemini等）虽强大，但如果没有“对齐”，它们就像一匹脱缰的野马——会跑，但不一定往你希望的方向跑。于是，RLHF（Reinfo…