喜讯!成功拿到智谱AI和极客时间联合授予的大模型微调技能认证证书!!!

喜讯!成功拿到智谱AI和极客时间联合授予的大模型微调技能认证证书!!! 大模型微调技能认证证书 – 2024年4月 AI大模型微调训练营毕业证书 – 2024年2月

大模型分布式训练框架Microsoft DeepSpeed,调整ZeRO-3 配置文件,使其支持 T5-3B 甚至 T5-11B 模型训练

任务介绍 调整 ZeRO-3 配置文件,使其支持 T5-3B 甚至 T5-11B 模型训练。 作业提交方式: 提交运行起来后 NVIDIA-smi 和 htop 的输出截图即可,跟视频里给老师大家展示…

智谱章节-使用AdvertiseGen广告数据集lora微调ChatGLM3-6B作业

作业描述 使用官方提供的示例,成功微调出广告数据集,要求使用 Lora 进行微调: 你能看到 loss 的下降,并在最终回到 3.2 左右。 你需要自己适配 inference.py 中的代码,并迁移…

close
arrow_upward