组织介绍

概述

这是一个中小型的模型训练平台

用途

  • 可以训练中小型公司的业务需求(模型需求量不是很大,且垂直)
  • 用于学生参加kaggle类型的竞赛(快速训练模型为目标)

平台组成

采集系统

  • 网络数据采集
  • 网络相机采集(暂时不支持,估计用处不大)

标注系统

标注系统主要采用开源第三方工具

  • 表格csv数据集标注(主要用于训练表格类数据,例如股票预测,订单预测)
  • 图片分类标注
  • 图片目标检测标注
  • 图片分割标注

训练系统

训练部分

这部分采用自动机器学习,网络自动搜索NAS方法训练模型

  • 表格数据分类模型
  • 表格数据回归模型
  • 图像分类模型
  • 图像目标检测模型

业务

  • 部署:直接可以部署使用的服务
  • 下载:可以将服务代码或者镜像下载或者模型下载(避免繁琐后处理部分)

技术

  • 异步任务

    • 训练,以及训练日志,数据同步等功能非常耗时,需要回调显示在前端,采用celery调度
  • 后端

    • 由于需要交互celery,所以采用python后端服务
  • 前端

    • 阶段一:使用python渲染页面
    • 阶段二:使用react构建前端,与标注系统融合

总结

  • 采集系统

    • python streamlit --> 前后端
    • 反爬措施设计
    • 采集到的数据同步至标注系统
  • 标注系统

    • label studio --> 前后端
  • 训练系统

    • 从标注系统同步数据
    • python streamlit celery --> 前后端
    • autokeras yolov3 等
  • 备注

    • 每个系统独立可独立使用
    • 系统直接直接相互使用
成就
0
Star
0
Fork
成员(1)
7491869 lijiacai 1755230063
河流

搜索帮助