代码拉取完成,页面将自动刷新
GearTrain 提供了灵活的推理框架, 支持视频、图片推理方式
基于 GearTrain 用户可像齿轮一样自由组合各种Pipeline,实现各种推理任务
export PYTHONPATH=$PYTHONPATH:/workspace/gear-train-py
根据需求选择不同框架, 目前已实现框架只有 ORT
onnxruntime
:
pip install onnxruntime-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple
Argument | Type | Default | Description |
---|---|---|---|
framework |
str |
ort |
Target format for the exported model, such as 'onnx', 'torchscript', 'tensorflow', or others, defining compatibility with various deployment environments. |
half |
bool |
False |
Enables FP16 (half-precision) quantization, reducing model size and potentially speeding up inference on supported hardware. |
int8 |
bool |
False |
Activates INT8 quantization, further compressing the model and speeding up inference with minimal accuracy loss, primarily for edge devices. |
device |
str |
cpu |
Device for running backend |
Format | framework Agument |
device Agument |
Model | Arguments |
---|---|---|---|---|
ONNX | ort |
cpu ,cuda |
model.onnx | half |
TensorRT | engine |
cuda |
model.engine | half ,int8 |
RKNN | rknn |
cpu |
model.rknn | half |
Pipeline
也可以作为另一个 Pipeline
的 model
, 从而实现管道的无限延长拼接在一个 pipeline
中同时调用多个 model
流水线并行方案
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
1. 开源生态
2. 协作、人、软件
3. 评估模型