Resources

pytroch

动手学深度学习

童哥指定NLP学习路线

[x] 如何自己从零实现一个神经网络?
[x] 史上最详细循环神经网络讲解（RNN/LSTM/GRU）
[x] 完全图解RNN、RNN变体、Seq2Seq、Attention机制
[x] 从零开始实现循环神经网络（无框架）
[x] 损失函数（Loss Function）
[x] 从0开始词嵌入（Word embedding）
[x] 自然语言处理中N-Gram模型介绍
[x] 秒懂词向量Word2vec的本质
[x] ResNet论文逐段精读
[x] Transformer论文逐段精读
[x] BERT 论文逐段精读
[x] [GPT文章解析](https://medium.com/@sntaus/understanding-self-attention-gpt-models-80ec894eebf0)

VLLM

[x] VLLM论文
[ ] VLLM官方文档
[x] 大模型推理框架 vLLM 源码解析（一）：框架概览
[x] 大模型推理框架 vLLM 源码解析（二）：Block 模块分配和管理
[x] VLLM推理流程梳理（一）
[x] [VLLM推理流程梳理（二）](https://zhuanlan.zhihu.com/p/649977422)

transformer

[x] 李沐Transformer论文逐段精读
[ ] Pytorch Transformers from Scratch (Attention is all you need)
[ ] 对应源码

PEFT

[ ] LLM从0到1之PEFT

Mamba

to be continue

DeepSpeed-流水线系列

[ ] deepspeed入门教程
[ ] LLM（十二）：DeepSpeed Inference 在 LLM 推理上的优化探究
[ ] DeepSpeed 流水线实战
[ ] DeepSpeed Pineline文档1
[ ] [DeepSpeed Pineline文档2](https://deepspeed.readthedocs.io/en/latest/pipeline.html)

ML-system入坑指南

[ ] Prof Yang You 的 HPC-AI lab中的学生给出的ML System入坑指南

图解大模型训练系列

分布式训练技术分享系列

大模型分布式训练并行技术

《从零实现BERT、GPT及Diffusion类算法》系列

BBuf 的CUDA笔记系列

有意思的系列

[ ] **优雅玩转实验室服务器（七）优雅地使用ssh或者http访问内网服务器——frp内网穿透教程**

CUDA

[ ] CUDA C++ Best Practices Guide
[ ] CUDA C++ Programming Guide
[ ] Optimizing Matrix Transpose in CUDA

升学

results matching ""

No results matching ""