DeepSpeed

模型设置

训练 API

训练 API

推理 API

推理 API
- 前向传播

检查点 API

ZeRO API

ZeRO

专家混合 (MoE)

专家混合 (MoE)
- 层规范

Transformer 内核 API

Transformer 内核
- DeepSpeed Transformer 配置
- DeepSpeed Transformer 层

流水线并行

流水线并行

优化器

优化器

学习率调度器

学习率调度器

浮点运算分析器

浮点运算分析器

自动调优

自动调优
- 自动调优器

内存使用

内存需求
- 内存使用估计 API
- 讨论

监控

监控
- TensorBoard
- WandB
- Comet
- CSV 监控器

索引和表格