# label-studio **Repository Path**: get-resource/label-studio ## Basic Information - **Project Name**: label-studio - **Description**: Label Studio是一个开源的,可配置的数据注释工具 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 20 - **Created**: 2025-08-10 - **Last Updated**: 2025-08-31 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Label Studio 介绍 ![GitHub](https://img.shields.io/github/license/heartexlabs/label-studio?logo=heartex) ![label-studio:build](https://github.com/HumanSignal/label-studio/workflows/label-studio:build/badge.svg) ![GitHub release](https://img.shields.io/github/v/release/heartexlabs/label-studio?include_prereleases) [官网](https://labelstud.io/) • [文档](https://labelstud.io/guide/) • [加入 S](https://slack.labelstud.io/?source=github-1)[lack 社](https://slack.labelstud.io/?source=github-1)[区 ](https://slack.labelstud.io/?source=github-1) ## 什么是 Label Studio? Label Studio 是一个开源的数据标注工具。它让你能够标注音频、文本、图像、视频和时间序列等数据类型,拥有简单直观的用户界面,并能导出为多种模型格式。它可用于准备原始数据或改进现有训练数据,以获得更准确的机器学习模型。 * [试用 Label Studio](#try-out-label-studio) * [Label Studio 的功能特点](#what-you-get-from-label-studio) * [Label Studio 中包含的数据标注模板](#included-templates-for-labeling-data-in-label-studio) * [在 Label Studio 中设置机器学习模型](#set-up-machine-learning-models-with-Label-Studio) * [将 Label Studio 与现有工具集成](#integrate-label-studio-with-your-existing-tools) ## 功能需求 * 基于角色的访问控制 * 自动任务分配 * 翻译 * 增强的质量工作流程与报告 * 高级分析与标注员绩效仪表盘 ![Label Studio标注不同类型数据的演示动图](/images/annotation_examples.gif) 有自定义数据集?你可以定制 Label Studio 以满足需求。阅读[介绍性博客文章](https://towardsdatascience.com/introducing-label-studio-a-swiss-army-knife-of-data-labeling-140c1be92881)了解更多信息。 ## 试用 Label Studio 在本地安装 Label Studio 或将其部署在云实例中。[或者注册我们的 Starter Cloud 版本免费试用!](https://humansignal.com/platform/starter-cloud/) 你可以在[这里](https://labelstud.io/guide/label_studio_compare)了解每个版本提供的功能。 * [使用 Docker 在本地安装](#install-locally-with-docker) * [使用 Docker Compose 运行(Label Studio + Nginx + PostgreSQL)](#run-with-docker-compose) * [使用 pip 在本地安装](#install-locally-with-pip) * [使用 poetry 在本地安装](#install-locally-with-poetry) * [使用 Anaconda 在本地安装](#install-locally-with-anaconda) * [为本地开发安装](#为本地开发安装) * [在云实例中部署](#deploy-in-a-cloud-instance) ### 使用 Docker 在本地安装 官方 Label Studio Docker 镜像位于[这里](https://hub.docker.com/r/heartexlabs/label-studio),可以使用`docker pull`下载。 在 Docker 容器中运行 Label Studio,并在`http://localhost:8080`访问它。 ``` docker pull heartexlabs/label-studio:latest docker run -it -p 8080:8080 -v \$(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest ``` 你可以在`./mydata`目录中找到所有生成的资产,包括 SQLite3 数据库存储`label_studio.sqlite3`和上传的文件。 #### 覆盖默认 Docker 安装 你可以通过附加新参数来覆盖默认启动命令: ``` docker run -it -p 8080:8080 -v \$(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest label-studio --log-level DEBUG ``` #### 使用 Docker 构建本地镜像 如果你想构建本地镜像,请运行: ``` docker build -t heartexlabs/label-studio:latest . ``` ### 使用 Docker Compose 运行 Docker Compose 脚本提供了生产就绪的堆栈,包括以下组件: * Label Studio * [Nginx](https://www.nginx.com/) - 用于加载各种静态数据(包括上传的音频、图像等)的代理 Web 服务器 * [PostgreSQL](https://www.postgresql.org/) - 替代性能较差的 SQLite3 的生产级数据库 要从`http://localhost`开始使用应用程序,请运行以下命令: ``` docker-compose up ``` ### 使用 Docker Compose + MinIO 运行 你也可以附加 MinIO 服务器运行以实现本地 S3 存储。当你想在本地系统上测试 S3 存储行为时,这特别有用。要以这种方式启动 Label Studio,你需要运行以下命令: ``` \# 在Linux上如果不是docker组的成员,请添加sudo docker compose -f docker-compose.yml -f docker-compose.minio.yml up -d ``` 如果你没有静态 IP 地址,必须在主机文件中创建一个条目,以便 Label Studio 和浏览器都能访问 MinIO 服务器。有关详细说明,请参阅[我们的数据存储指南](docs/source/guide/storedata.md)。 ### 使用 pip 在本地安装 ``` \# 需要Python >=3.8 pip install label-studio \# 在http://localhost:8080启动服务器 label-studio ``` ### 使用 poetry 在本地安装 ``` \### 安装poetry pip install poetry \### 设置poetry环境 poetry new my-label-studio cd my-label-studio poetry add label-studio \### 激活poetry环境 poetry shell \### 在http://localhost:8080启动服务器 label-studio ``` ### 使用 Anaconda 在本地安装 ``` conda create --name label-studio conda activate label-studio conda install psycopg2 pip install label-studio ``` ### 为本地开发安装 你可以在本地运行最新版本的 Label Studio,而无需从 pypi 安装包。 ``` \# 安装所有包依赖 pip install poetry poetry install Invoke-Expression (poetry env activate) eval $(poetry env activate) \# 运行数据库迁移 python label_studio/manage.py migrate python label_studio/manage.py collectstatic \# 在开发模式下在http://localhost:8080启动服务器 python label_studio/manage.py runserver ``` ### 在云实例中部署 你可以一键在 Heroku、Microsoft Azure 或 Google Cloud Platform 中部署 Label Studio: #### 应用前端更改 有关更新前端的信息,请参见[label-studio/web/README.md](web/README.md#安装说明)。 #### 在 Windows 上安装依赖 要在 Windows 上运行 Label Studio,请从[Gohlke builds](https://www.lfd.uci.edu/\~gohlke/pythonlibs)下载并安装以下 wheel 包,以确保使用正确的 Python 版本: * [lxml](https://www.lfd.uci.edu/\~gohlke/pythonlibs/#lxml) ``` \# 升级pip pip install -U pip \# 如果你在Win64上运行Python 3.8,请安装从Gohlke下载的包: pip install lxml‑4.5.0‑cp38‑cp38‑win\_amd64.whl \# 安装label studio pip install label-studio ``` ### 运行测试套件 要将测试依赖项添加到本地安装: ``` poetry install --with test ``` 或者,可以从安装了测试依赖项的 Docker 容器中运行单元测试: ``` make build-testing-image make docker-testing-shell ``` 在任何情况下,要运行单元测试: ``` cd label\_studio \# sqlite3 DJANGO\_DB=sqlite DJANGO\_SETTINGS\_MODULE=core.settings.label\_studio pytest -vv \# postgres(假设默认postgres用户、数据库、密码。在Docker测试容器中没有额外配置将无法工作) DJANGO\_DB=default DJANGO\_SETTINGS\_MODULE=core.settings.label\_studio pytest -vv ``` ## Label Studio 的功能特点 [https://github.com/user-attachments/assets/525ad5ff-6904-4398-b507-7e8954268d69](https://github.com/user-attachments/assets/525ad5ff-6904-4398-b507-7e8954268d69) * **多用户标注**:注册和登录后,创建的标注会与你的账户关联。 * **多个项目**:在一个实例中处理所有数据集。 * **流线型设计**:帮助你专注于任务,而不是如何使用软件。 * **可配置的标签格式**:让你能够自定义视觉界面以满足特定的标注需求。 * **支持多种数据类型**:包括图像、音频、文本、HTML、时间序列和视频。 * **从文件或云存储导入**:支持 Amazon AWS S3、Google Cloud Storage,或 JSON、CSV、TSV、RAR 和 ZIP 归档文件。 * **与机器学习模型集成**:让你能够可视化和比较不同模型的预测,并执行预标注。 * **嵌入到数据管道中**:REST API 使其易于成为你管道的一部分 ## Label Studio 中包含的数据标注模板 Label Studio 包含各种模板来帮助你标注数据,你也可以使用专门设计的配置语言创建自己的模板。最常见的标注模板和用例包括以下情况: ## 在 Label Studio 中设置机器学习模型 使用 Label Studio 机器学习 SDK 连接你喜爱的机器学习模型。遵循以下步骤: 1. 启动你自己的机器学习后端服务器。参见[更详细的说明](https://github.com/HumanSignal/label-studio-ml-backend)。 2. 在项目设置中的模型页面上,将 Label Studio 连接到服务器。 这让你能够: * **预标注**:使用模型预测标注数据。 * 进行**在线学习**:在创建新标注时重新训练模型。 * 进行**主动学习**:仅标注数据中最复杂的示例。 ## 将 Label Studio 与现有工具集成 你可以将 Label Studio 用作机器学习工作流的独立部分,或将前端或后端集成到现有工具中。 ## 生态系统 | 项目 | 描述 | | -------------------------------------------------------------------------------------------------------------------- | ---------------------------------------------------------- | | label-studio | 作为 pip 包分发的服务器 | | [前端库](web/libs/editor/) | Label Studio 前端库。使用 React 构建 UI,使用 mobx-state-tree 进行状态管理。 | | [数据管理器库](web/libs/datamanager/) | 数据管理器(我们的数据探索工具)的库。 | | [label-studio-converter](https://github.com/HumanSignal/label-studio-sdk/tree/master/src/label_studio_sdk/converter) | 以你喜爱的机器学习库格式编码标签 | | [label-studio-transformers](https://github.com/HumanSignal/label-studio-transformers) | 已连接并配置用于 Label Studio 的 Transformers 库 | ## 引用 在文章的**参考文献**部分包含 Label Studio 的引用: ``` @misc{Label Studio, title={{Label Studio}: 数据标注软件}, url={https://github.com/HumanSignal/label-studio}, note={开源软件可从https://github.com/HumanSignal/label-studio获取}, author={ Maxim Tkachenko and Mikhail Malyuk and Andrey Holmanyuk and Nikolai Liubimov}, year={2020-2025}, } ``` ## 许可证 本软件根据[Apache 2.0 LICENSE](/LICENSE)授权 © [Heartex](https://www.heartex.com/)。2020-2025