模型的训练后量化¶

训练后模型优化是指应用无需重新训练或进行微调的特殊方法，将模型转换为对硬件更友好的表示的过程。该领域最受欢迎、应用最广泛的方法是 8 位训练后量化，因为该方法：

8 位整数量化将权重和激活的精度降低到 8 位，从而使模型占用空间减少近四分之三，并显著提高推理速度（这主要是由于推理所需的吞吐量较低）。这个降低精度的步骤是在进行实际推理之前离线完成的，因此模型会转换为量化表示。该过程不需要深度学习框架源码中的训练数据集或训练管道。

要应用 OpenVINO 中的训练后方法，您需要具备以下条件：

OpenVINO 目前提供两个具有训练后量化功能的工作流程：