自动调优
模型训练中的一个痛点是找出良好的性能相关配置,例如微批次大小,以充分利用硬件并实现高吞吐量。此配置探索过程通常是手动完成的,但非常重要,因为模型训练会重复多次,并且受益于使用良好的配置。手动调整过程不仅耗时,而且结果还依赖于硬件。这意味着在一个硬件上的良好配置可能不是在另一个不同硬件上的最佳配置。因此,用户必须再次手动调整配置。使用 DeepSpeed,还有更多配置参数可能会影响训练速度,因此手动调整配置变得更加繁琐。
DeepSpeed 自动调优器缓解了这个痛点,并自动发现提供良好训练速度的最佳 DeepSpeed 配置。自动调优器使用模型信息、系统信息和启发式方法来有效地调整影响计算和内存效率的系统旋钮,例如 ZeRO 优化阶段、微批次大小以及许多其他 ZeRO 优化配置。它不仅减少了用户花费在调整上的时间和资源,还可以发现比手动调整方法更好的配置。
请参阅 自动调优教程 以获取使用详细信息。
自动调优器
- deepspeed.autotuning.autotuner
<module ‘deepspeed.autotuning.autotuner’ from ‘/home/docs/checkouts/readthedocs.org/user_builds/deepspeed/checkouts/latest/deepspeed/autotuning/autotuner.py’> 的别名