模型优化指南¶
模型优化是一个可选的离线步骤,通过应用量化、修剪、预处理优化等特殊优化方法来提升模型的最终性能。OpenVINO™ 在模型开发的不同步骤中提供了几种工具来优化模型:
Model Optimizer 在默认情况下对模型实施大多数优化参数。 但您可以自由配置均值/标度值、批次大小、RGB 和 BGR 输入通道对比以及其他参数,加快模型的预处理 (Embedding Preprocessing Computation)。
Post-training Quantization 旨在通过应用不需要模型重新训练或微调的训练后方法(如训练后 8 位整数量化)来优化深度学习模型的推理。
Training-time Optimization 是一套用于 PyTorch 和 TensorFlow 2.x 等深度学习框架内训练时间模型优化的高级方法。它支持量化感知训练和过滤器修剪等方法。经过 NNCF 优化的模型可以利用所有可用工作流程使用 OpenVINO 进行推理。