大模型从0到1|第十三课:训练数据策略 大模型从0到1|第十三课:训练数据策略 课程链接:Stanford CS336 Spring 2025 - Lecture 13 上一讲:如何给定数据训练模型接下来的两讲:我们应该在什么数据上训练? 1. 简介 (Introduction)暴论:数据是训练语言模型中最重要的一环。 一个理由:让我们看看公司披露了什么。开放权重模型(例如 Llama 3)对架构甚至训练过程完全透明,但基本没有关于数 2025-12-12 linux > drivers > gpu > stanford-cs336 #architect #books #git #go #log #sources #task #mm #net #struct #stanford-cs336 #tick
大模型从0到1|第十二课:模型评估详解 大模型从0到1|第十二课:模型评估详解 课程链接:Stanford CS336 Spring 2025 - Lecture 12 Evaluation: 给定一个固定的模型,它到底有多”好“? 1. 所见即所得 (What you see)基准分数 (Benchmark scores) DeepSeek-R1 Llama 4 OLMo 2 (32B) 最近的语言模型都在类似但 2025-12-12 linux > drivers > gpu > stanford-cs336 #3d #git #go #log #python #task #testing #mm #net #struct #stanford-cs336
Markdown文档编写与工具集 Markdown文档编写与工具集Markdown基础 Markdown 官方教程 Markdown代码块支持的语言 Markdown数学公式语法 Cmd Markdown 公式指导手册 markdown latex公式 MarkDown流程图全指导 当 Markdown 遇上 UML 【Markdown高级技巧】写出高大上的流程图、时序图、类图 在VS Code中使用 Picgo 2023-04-21 markdown #books #git #go #log #markdown #python #net
大模型从0到1|第十一讲:如何用好 Scaling Law (Scaling - Case Study and Details) 大模型从0到1|第十一讲:如何用好 Scaling Law (Scaling - Case Study and Details) 课程链接:Stanford CS336 Spring 2025 - Lecture 11 课程信息 课程: CS336 讲师: Tatsu H 主题: 深入探讨 Scaling Law 在实际工程中的应用,包括 muP 参数化、WSD 学习率调度以及 Chinchi 2025-12-03 linux > drivers > gpu > stanford-cs336 #drivers #git #gpu #linux #log #mm #stanford-cs336
git教程 git教程密码 GitLab使用手册配置Git永久记住密码,免去重复输入的烦恼 - 心向阳 - 博客园 (cnblogs.com) 向gitlab提交代码时记住用户名和密码_胡桃夹夹子的博客-CSDN博客_gitlab记住密码 为git设置代理解决远程仓库无法连接问题 github配置了公钥依旧提示git@github.com‘s password: Permission denied, p 2023-04-21 git #3d #cpp #fs #git #go #java #kernel #linux #log #svn #task #testing #develop #mm #net #pthread #thread #proc #proxy #rcu
大模型从0到1|第十讲:详解模型推理 大模型从0到1|第十讲:详解模型推理 课程链接:Stanford CS336 Spring 2025 - Lecture 10 Inference: 给定一个固定的模型,根据提示词(prompts)生成响应。 1. 理解推理负载 (Understanding the inference workload)概览 (Landscape)推理出现在很多地方: 实际应用:聊天机器人、代码补全、批量 2025-12-02 linux > drivers > gpu > stanford-cs336 #algorithm #deepin #git #go #log #net #stanford-cs336
CTYunOS 4 Docker 内核编译环境 CTYunOS 4 Docker 内核编译环境基于 CTYunOS 4 (4-25.07-250905) 的 Docker 容器化内核编译环境,支持 AMD64 和 ARM64 架构的内核编译和 RPM 打包。 特性 自动化构建流程:通过 Makefile 一键完成镜像构建、容器管理和内核编译 用户权限映射:容器内用户自动映射为 host 用户,避免文件权限问题 多架构支持:支持 AMD64 和 2025-12-01 linux > virt > container > docker > ctyunos > ctyunos4 #boot #docker #git #kernel #linux #log #shell #develop #container
CTYunOS 3 Docker 内核编译环境 CTYunOS 3 Docker 内核编译环境基于 CTYunOS 3 (23.01) 的 Docker 容器化内核编译环境,支持 AMD64 和 ARM64 架构的内核编译和 RPM 打包。 特性 自动化构建流程:通过 Makefile 一键完成镜像构建、容器管理和内核编译 用户权限映射:容器内用户自动映射为 host 用户,避免文件权限问题 多架构支持:支持 AMD64 和 ARM64 (交叉 2025-11-25 linux > virt > container > docker > ctyunos > ctyunos3 #boot #docker #git #kernel #linux #log #shell #develop #container
cgroup v1 和 cgroup v2 的核心区别 cgroup v1 和 cgroup v2 的核心区别以下是 cgroup v1 和 cgroup v2 的核心区别总结,基于本次聊天记录的讨论内容,从架构设计、功能实现到实际应用进行全面对比: 1. 架构设计 特性 cgroup v1 cgroup v2 层级结构 多棵树:每个控制器(如 CPU、内存)独立挂载,形成多套层级 单一树:所有控制器统一挂载到一棵层级树中 进程归属 2025-11-25 linux > virt > container #bpf #docker #fs #redis #task #net #proc