stanford-cs336¶
- 大模型从0到1|第一讲:概述和tokenization
- 大模型从0到1|第七讲:详解大模型并行化策略
- 大模型从0到1|第三讲:详解现代LLM基础架构
- 大模型从0到1|第九讲:扩展定律基础
- 大模型从0到1|第二讲:pytorch手把手搭建LLM
- 大模型从0到1|第五讲:详解
- GPU
- 架构与性能优化
- 大模型从0到1|第八讲:手撕大模型并行训练
- 大模型从0到1|第六讲:手写高性能算子
- 大模型从0到1|第十一讲:如何用好Scaling
- Law
- 大模型从0到1|第十七课:手把手讲解GRPO
- 大模型从0到1|第十三课:训练数据策略
- 大模型从0到1|第十二课:模型评估详解
- 大模型从0到1|第十五课:详解SFT、RLHF
- 大模型从0到1|第十六课:详解大模型RL算法
- 大模型从0到1|第十四课:实战数据过滤和去重
- 大模型从0到1|第十讲:详解模型推理
- 大模型从0到1|第四讲:详解MoE架构