最近训练 72B 的 LLM,在挑选机器的时候显存是一个重要指标,下面是一个参考
我的训练使用了 A100 SMX 40GB x8,共计 320GB 显存,用来存储模型,梯度,优化器,这样批次可以给的比较大

训练方法精度7B13B30B70B8x7B
全参数AMP120GB240GB600GB1200GB900GB
全参数1660GB120GB300GB600GB400GB
GaLore1616GB32GB64GB160GB120GB
部分参数1620GB40GB80GB200GB160GB
LoRA1616GB32GB64GB160GB120GB
QLoRA810GB20GB40GB80GB60GB
QLoRA46GB12GB24GB48GB30GB
QLoRA24GB8GB16GB24GB18GB
让我们陷入困境的不是无知,而是看似正确的谬误论断。