WuJing's Blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

大模型从0到1|第三讲:详解现代LLM基础架构

大模型从0到1|第三讲:详解现代LLM基础架构课程信息:CS336 | 讲师:Tatsu H | 幻灯片总数:68 Part 1: 课程概览 (Introduction)Page 1: 标题页 内容: 课程名称 “Lecture 3: Everything you didn’t want to know about LM architecture and training”。 解析: 这一讲主
2025-11-23
linux > drivers > gpu > stanford-cs336
#architect #drivers #git #go #gpu #linux #log #mm #stanford-cs336

大模型从0到1|第八讲:手撕大模型并行训练

大模型从0到1|第八讲:手撕大模型并行训练 课程链接:Stanford CS336 Spring 2025 - Lecture 8: Distributed Training Implementation 课程概述上周回顾: 单个 GPU 内的并行化本周重点: 多 GPU 跨节点的并行化 统一主题: 在两种情况下,计算单元(算术逻辑单元)都远离数据(输入/输出) 核心思想: 编排计
2025-11-24
linux > drivers > gpu > stanford-cs336
#architect #fs #git #gpu #kernel #log #perf #performance #python #sources #mm #net #proc #sync #stanford-cs336

大模型从0到1|第二讲:PyTorch手把手搭建LLM

大模型从0到1|第二讲:PyTorch手把手搭建LLM 课程链接:Stanford CS336 Spring 2025 - Lecture 2 课程概述上节课回顾: 课程概述、Tokenization 本讲概览: 讨论训练模型所需的所有原语(primitives) 自底向上:从张量 → 模型 → 优化器 → 训练循环 密切关注效率(资源使用) 两类资源: 内存(Memory) - GB
2025-11-22
linux > drivers > gpu > stanford-cs336
#git #go #gpu #log #perf #performance #python #mm #proc #sync #stanford-cs336

大模型从0到1|第七讲:详解大模型并行化策略

大模型从0到1|第七讲:详解大模型并行化策略课程信息: CS336 | 讲师: Tatsu H | 主题: 大规模训练系统的并行化基础 Part 1: 扩展的动机与硬件基础 (Motivation & Hardware) Page 1: 课程标题 深度解析: 课程正式开始。本节课的主题是 Parallelism Basics。在单卡算力逼近物理极限的今天,训练一个 SOTA 大模型(如
2025-11-23
linux > drivers > gpu > stanford-cs336
#3d #drivers #fs #git #go #gpu #linux #log #mm #net #sync #stanford-cs336

大模型从0到1|第六讲:手写高性能算子

大模型从0到1|第六讲:手写高性能算子 课程链接:Stanford CS336 Spring 2025 - Lecture 6: Writing Fast Kernels 课程概述上节课回顾: GPU 的高层次概述和性能分析本节课重点: 性能测试/分析 + 手写 GPU 算子 核心内容: Benchmarking 和 Profiling 技术 Kernel Fusion(算子融合)
2025-11-23
linux > drivers > gpu > stanford-cs336
#architect #cpp #fs #git #go #gpu #kernel #log #perf #python #sources #develop #mm #thread #proc #sync #stanford-cs336

大模型从0到1|第五讲:详解 GPU 架构与性能优化

大模型从0到1|第五讲:详解 GPU 架构与性能优化讲师: Tatsu H核心主题: 深入剖析 GPU 的底层硬件原理、性能分析方法论(Roofline Model),以及如何通过 Tiling、Fusion、Coalescing 等技巧优化深度学习负载,最后以 FlashAttention 为例进行融会贯通。 Part 1: GPU 深度解析 (GPUs in Depth) Page 1: 课
2025-11-23
linux > drivers > gpu > stanford-cs336
#drivers #fs #gpu #kernel #linux #log #perf #performance #thread #proc #power #stanford-cs336

大模型从0到1|第四讲:详解MoE架构

大模型从0到1|第四讲:详解MoE架构课程信息: CS336 | 讲师: Tatsu H | 主题: 混合专家模型 (Mixture of Experts) 课程链接:Stanford CS336 Spring 2025 - Lecture 4: MoEs Part 1: MoE 的背景与崛起 (Introduction & Context) Page 1: 课程开篇 【视觉内容】
2025-11-23
linux > drivers > gpu > stanford-cs336
#architect #drivers #git #go #gpu #linux #log #perf #performance #mm #net #struct #stanford-cs336

📚 技术笔记与资源库

📚 技术笔记与资源库 Stay hungry. Stay foolish. - Steve Jobs 个人技术学习笔记与资源整理,涵盖操作系统、编程语言、架构设计等多个技术领域。 🗂️ 目录结构🐧 LinuxLinux系统技术文档,包含内核开发、性能调优、虚拟化等内容 kernel - Linux内核开发与源码分析 performance - 性能分析工具 (perf, BPF, sta
2022-08-14
#3d #acpi #algorithm #architect #assembly #binary-analysis #books #boot #bpf #cpp #deb #debug #deepin #distro #docker #drivers #fs #gdb #git #go #gpu #grub #java #javascript #jenkins #k8s #kdump #kernel #kvm #linux #log #ltp #markdown #monitoring #nginx #patent #perf #performance #pkg #python #qemu #redis #shell #sound #sources #stap #svn #task #testing #tools #vim #virt #xisai

Linux内核开发与系统技术文档

Linux内核开发与系统技术文档目录结构说明📂 boot系统启动相关技术 grub: GRUB引导加载器配置和调试 🔍 debug纯调试工具和技术 assembly: 汇编语言调试 binary-analysis: 二进制分析 gdb: GDB调试器使用 kdump: 内核转储分析 📊 performance性能分析和优化工具 perf: Linux perf 性能分析 bpf:
2025-11-18
linux
#assembly #binary-analysis #books #boot #bpf #deb #debug #deepin #distro #docker #drivers #fs #gdb #git #gpu #grub #k8s #kdump #kernel #kvm #linux #log #ltp #monitoring #perf #performance #pkg #shell #sources #stap #task #testing #tools #vim #virt #mm #net #mutex #security #container #irq

设备驱动

设备驱动 设备驱动 一篇文章汇总嵌入式处理器相关的知识 【干货】一文搞懂芯粒(Chiplet)技术 【干货】一文掌握ARM基础及架构演变 Linux内核入门篇之驱动的前世今生 当我用几道题考了一遍做Linux驱动的同事…… 盘一盘各种”xPU” 服务器中的BMC是个啥玩意儿 元器件 常用电子产品接口大全(很全,值得收藏) 搞懂元器件,就搞懂了电路的一半 disk 【干货】一文看懂机械硬盘和固态
2025-11-21
linux > drivers
#3d #acpi #books #boot #deb #debug #fs #git #go #grub #kernel #linux #log #python #task #tools #vim #virt #develop #mm #net #sync #power #irq #console #disk #phytium #tick
1…56789…27

搜索

Hexo Fluid
总访问量 次 总访客数 人