48 Star 507 Fork 1.3K

Ascend/ModelZoo-PyTorch

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

在线推理是指依赖深度学习框架执行推理的场景,一般用于模型训练与验证,例如调用PyTorch模型的forward接口进行推理。

在应用场景中部署模型时,一般会对模型进行离线优化,将模型转换为与硬件亲和的格式,此时模型已经脱离厚重的框架且得到优化,可以快捷地部署到推理硬件上进行推理,即为离线推理

因离线推理硬件、推理后端的不同,模型的转换与优化过程也无法统一。此教程旨在介绍如何将PyTroch模型转为ONNX模型,ONNX模型如何转为OM模型, 如何在昇腾NPU上进行推理。其他框架可能会涉及,但不作重点讲解。

ONNX离线推理流程:

  1. 在线推理:打通在线模型的推理过程,区分数据预处理、模型推理、数据后处理,为后续适配离线推理做准备
  2. ONNX的导出:使用常见框架的ONNX导出方法,得到ONNX模型
  3. ONNX转OM:使用ATC工具将ONNX转为OM模型
  4. 离线模型推理:适配OM模型进行离线推理
  5. 性能优化:常用的性能优化方案
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/ascend/ModelZoo-PyTorch.git
git@gitee.com:ascend/ModelZoo-PyTorch.git
ascend
ModelZoo-PyTorch
ModelZoo-PyTorch
master

搜索帮助