WuJing's Blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

大模型从0到1|第六讲:手写高性能算子

大模型从0到1|第六讲:手写高性能算子 课程链接:Stanford CS336 Spring 2025 - Lecture 6: Writing Fast Kernels 课程概述上节课回顾: GPU 的高层次概述和性能分析本节课重点: 性能测试/分析 + 手写 GPU 算子 核心内容: Benchmarking 和 Profiling 技术 Kernel Fusion(算子融合)
2025-11-23
linux > drivers > gpu > stanford-cs336
#architect #cpp #fs #git #go #gpu #kernel #log #perf #python #sources #develop #mm #thread #proc #sync #stanford-cs336

大模型从0到1|第五讲:详解 GPU 架构与性能优化

大模型从0到1|第五讲:详解 GPU 架构与性能优化讲师: Tatsu H核心主题: 深入剖析 GPU 的底层硬件原理、性能分析方法论(Roofline Model),以及如何通过 Tiling、Fusion、Coalescing 等技巧优化深度学习负载,最后以 FlashAttention 为例进行融会贯通。 Part 1: GPU 深度解析 (GPUs in Depth) Page 1: 课
2025-11-23
linux > drivers > gpu > stanford-cs336
#drivers #fs #gpu #kernel #linux #log #perf #performance #thread #proc #power #stanford-cs336

大模型从0到1|第四讲:详解MoE架构

大模型从0到1|第四讲:详解MoE架构课程信息: CS336 | 讲师: Tatsu H | 主题: 混合专家模型 (Mixture of Experts) 课程链接:Stanford CS336 Spring 2025 - Lecture 4: MoEs Part 1: MoE 的背景与崛起 (Introduction & Context) Page 1: 课程开篇 【视觉内容】
2025-11-23
linux > drivers > gpu > stanford-cs336
#architect #drivers #git #go #gpu #linux #log #perf #performance #mm #net #struct #stanford-cs336

📚 技术笔记与资源库

📚 技术笔记与资源库 Stay hungry. Stay foolish. - Steve Jobs 个人技术学习笔记与资源整理,涵盖操作系统、编程语言、架构设计等多个技术领域。 🗂️ 目录结构🐧 LinuxLinux系统技术文档,包含内核开发、性能调优、虚拟化等内容 kernel - Linux内核开发与源码分析 performance - 性能分析工具 (perf, BPF, sta
2022-08-14
#3d #acpi #algorithm #architect #assembly #binary-analysis #books #boot #bpf #cpp #deb #debug #deepin #distro #docker #drivers #fs #gdb #git #go #gpu #grub #java #javascript #jenkins #k8s #kdump #kernel #kvm #linux #log #ltp #markdown #monitoring #nginx #patent #perf #performance #pkg #python #qemu #redis #shell #sound #sources #stap #svn #task #testing #tools #vim #virt #xisai

Linux内核开发与系统技术文档

Linux内核开发与系统技术文档目录结构说明📂 boot系统启动相关技术 grub: GRUB引导加载器配置和调试 🔍 debug纯调试工具和技术 assembly: 汇编语言调试 binary-analysis: 二进制分析 gdb: GDB调试器使用 kdump: 内核转储分析 📊 performance性能分析和优化工具 perf: Linux perf 性能分析 bpf:
2025-11-18
linux
#assembly #binary-analysis #books #boot #bpf #deb #debug #deepin #distro #docker #drivers #fs #gdb #git #gpu #grub #k8s #kdump #kernel #kvm #linux #log #ltp #monitoring #perf #performance #pkg #shell #sources #stap #task #testing #tools #vim #virt #mm #net #mutex #security #container #irq

power_button

power_button linux下获取按键响应事件 linux下获取按键响应事件 1cd /sys/bus/acpi/drivers/button 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647// drivers/acpi/button.c:398static vo
2025-11-21
linux > drivers > acpi
#acpi #deb #debug #drivers #kernel #linux #log #mm #net #struct #mutex #thread #proc #sync #power #irq

显示功能学习comments

显示功能学习comments一、显示过程(一)开机过程中的显示变换1、固件logo到grub菜单这个时候由固件UEFI提供的GOP驱动来支持显示,GOP驱动是由显卡厂商提供给固件厂商的,GOP驱动比较简单, 通常只有有限的分辨率,有限的像素深度。只是为了设置固件和显示grub菜单。 2、grub菜单被选择之后到出现内核console日志这个时候显示由内核efifb提供,efifib创建了/
2025-11-21
linux > drivers > gpu
#3d #deepin #go #gpu #grub #linux #log #sources #mm #net #console #kms

算子(Operator) vs 核函数(Kernel) 框架图

算子(Operator) vs 核函数(Kernel) 框架图1. 整体架构框架图1234567891011121314151617181920212223242526272829303132333435363738394041┌─────────────────────────────────────────────────────────────────────────┐│
2025-11-21
linux > drivers > gpu
#gpu #kernel #tools #mm #thread

Linux内核模块开发

Linux内核模块开发编译1make 加载12sudo insmod a/a.kosudo insmod b/b.ko -f // 在debian10上不加-f报错Invalid parameters 日志: 1sudo dmesg | tail 卸载12sudo rmmod b/b.kosudo rmmod a/a.ko
2025-11-21
linux > drivers > modules
#deb #linux #mm

seq_open可以替换成single_open吗

seq_open可以替换成single_open吗是的,seq_open 可以替换成 single_open,但前提是你的需求是只需要输出一段静态或简单的动态内容,而不需要迭代器(start、next、stop)来遍历数据。 single_open 的适用场景 如果你的数据是一次性生成的,且不需要分页或迭代(例如,输出一段固定的内容或简单的动态内容),可以使用 single_open。 sing
2025-11-21
linux > drivers > proc
#fs #linux #mm #struct #proc
1…7891011…28

搜索

Hexo Fluid
总访问量 次 总访客数 人