# label-tools

**Repository Path**: huangjinwangpu/label-tools

## Basic Information

- **Project Name**: label-tools
- **Description**: 标注工具
- **Primary Language**: Python
- **License**: MIT
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-02-27
- **Last Updated**: 2026-02-27

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 数据标注工具汇总

本仓库整理了主流的开源数据标注工具，涵盖计算机视觉（CV）、自然语言处理（NLP）、点云和文本等多个领域。

## 📋 目录

- [综合类标注工具](#综合类标注工具)
- [计算机视觉（CV）专用工具](#计算机视觉cv专用工具)
- [自然语言处理（NLP）专用工具](#自然语言处理nlp专用工具)
- [点云（Point Cloud）专用工具](#点云point-cloud专用工具)
- [服务端/自托管平台](#服务端自托管平台)
- [轻量级/嵌入式工具](#轻量级嵌入式工具)
- [商业平台（支持自托管）](#商业平台支持自托管)
- [医学影像专用工具](#医学影像专用工具)
- [多模态标注平台](#多模态标注平台)
- [音频/语音专用工具](#音频语音专用工具)
- [遥感与地理信息专用工具](#遥感与地理信息专用工具)
- [工业检测专用工具](#工业检测专用工具)
- [图结构与知识图谱专用工具](#图结构与知识图谱专用工具)
- [表格数据处理专用工具](#表格数据处理专用工具)
- [代码与程序分析专用工具](#代码与程序分析专用工具)
- [其他专用工具](#其他专用工具)
- [工具选择建议](#工具选择建议)
- [行业趋势与展望](#行业趋势与展望)

---

## 综合类标注工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| Label Studio | [GitHub](https://github.com/HumanSignal/label-studio) | 26.5k+ stars / 3.3k+ forks | Apache-2.0 | Python, React | CV, NLP, Audio, Video, Text, Time-series | 最灵活的多模态标注平台，支持图像、文本、音频、视频等多种数据类型，提供标准化输出格式，适合企业级应用 |
| CVAT | [GitHub](https://github.com/cvat-ai/cvat) | 15.4k+ stars / 3.1k+ forks | MIT | Python, Django, React | CV, Video, Image | 业界领先的计算机视觉标注工具，支持图像和视频标注，提供自动标注、跟踪等高级功能，适合任何规模的团队 |
| Labelme | [GitHub](https://github.com/wkentaro/labelme) | 15.6k+ stars / 3.6k+ forks | GPLv3 | Python, Qt | CV, Image | Python 图像多边形标注工具，支持多边形、矩形、圆形、线条、点和图像级标注，轻量级且易于使用 |
| LabelImg | [GitHub](https://github.com/HumanSignal/labelImg) | 23k+ stars / 6.4k+ forks | MIT | Python, Qt | CV, Image | 经典的图像边界框标注工具，专注于目标检测任务，支持 PASCAL VOC 和 YOLO 格式（已归档，不再维护） |
| Supervisely | [官网](https://supervisely.com) | 商业产品（部分开源） | 专有 | Python, Web | CV, Video, Image, Point Cloud | 端到端计算机视觉平台，支持图像、视频和点云标注，提供深度学习集成和协作功能 |

## 计算机视觉（CV）专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| AnyLabeling | [GitHub](https://github.com/vietanhdev/anylabeling) | 3.2k+ stars / 400+ forks | GPLv3 | Python, Qt | CV, Image, Video | AI 辅助标注工具，集成 YOLO、SAM、SAM2 和 MobileSAM，支持自动标注和多种标注类型 |
| X-AnyLabeling | [GitHub](https://github.com/CVHub520/X-AnyLabeling) | 8.2k+ stars / 900+ forks | GPLv3 | Python, Qt | CV, Image, OCR | 增强版 AnyLabeling，支持 Segment Anything 和多种 AI 模型，专注于工业级自动标注 |
| makesense.ai | [官网](https://makesense.ai) | 3k+ stars | GPLv3 | TypeScript, React | CV, Image | 免费在线图像标注工具，无需安装，支持目标检测、图像分类和语义分割，适合快速原型开发 |
| COCO Annotator | [GitHub](https://github.com/jsbroks/coco-annotator) | 3k+ stars / 700+ forks | MIT | Python, Vue.js | CV, Image | Web 图像分割标注工具，专为目标检测、定位和关键点标注设计，输出 COCO 格式（不活跃维护） |
| VGG Image Annotator (VIA) | [GitLab](https://gitlab.com/vgg/via) | 2.5k+ stars | BSD-2-Clause | JavaScript | CV, Image, Video | 轻量级的图像和视频标注工具，完全在浏览器中运行，支持多种标注类型 |
| VoTT | [GitHub](https://github.com/microsoft/VoTT) | 4.5k+ stars / 1k+ forks | MIT | TypeScript, React, Electron | CV, Image, Video | 微软开源的视觉对象标注工具，Electron 应用，支持端到端目标检测模型构建（已归档） |
| Sloth | [GitHub](https://github.com/cvhciKIT/sloth) | 1k+ stars / 300+ forks | MIT | Python, Qt | CV, Image, Video | 图像和视频数据标注工具，专为计算机视觉研究设计（不活跃维护） |
| Yolo_mark | [GitHub](https://github.com/AlexeyAB/Yolo_mark) | 1.5k+ stars / 600+ forks | MIT | C++, OpenCV | CV, Image | YOLO 专用标注工具，GUI 界面，用于标注边界框训练 Darknet YOLO 模型（不活跃维护） |
| ImgLab | [GitHub](https://github.com/NaturalIntelligence/imglab) | 1k+ stars / 200+ forks | MIT | JavaScript, Vue.js | CV, Image | Web 图像标注工具，支持多种格式（不活跃维护） |
| JS Segment Annotator | [GitHub](https://github.com/kyamagu/js-segment-annotator) | 521+ stars / 159+ forks | BSD-3-Clause | JavaScript | CV, Image | 基于图像分割的 JavaScript 标注工具，纯前端实现（已归档） |
| RectLabel | [官网](https://rectlabel.com) | 商业产品 | 专有 | Swift, macOS | CV, Image | macOS 专用离线图像标注工具，支持边界框、多边形、关键点等，输出 COCO/YOLO/VOC 格式 |
| Roboflow Annotate | [官网](https://roboflow.com/annotate) | 商业产品（部分开源） | 专有 | Web, AI | CV, Image, Video | AI 辅助标注工具，支持自动标注和主动学习，可利用 50,000+ 公开模型加速标注过程 |

## 自然语言处理（NLP）专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| doccano | [GitHub](https://github.com/doccano/doccano) | 10.6k+ stars / 1.9k+ forks | MIT | Python, Django, Vue.js | NLP, Text | 开源文本标注工具，专为 NLP 任务设计，支持序列标注、文本分类、序列到序列任务等 |
| brat | [GitHub](https://github.com/nlplab/brat) | 1.8k+ stars / 500+ forks | MIT | Python, JavaScript | NLP, Text | 快速标注工具，基于 Web 的文本标注、可视化和编辑工具，专为结构化标注设计（不活跃维护） |
| Argilla | [GitHub](https://github.com/argilla-io/argilla) | 4.9k+ stars / 450+ forks | Apache-2.0 | Python, FastAPI, Vue.js | NLP, Text, LLM, RLHF | 面向 LLM 和 NLP 的协作标注平台，支持 RLHF 数据标注、数据质量监控和模型评估 |
| WebAnno | [GitHub](https://github.com/webanno/webanno) | 800+ stars / 200+ forks | Apache-2.0 | Java, Spring | NLP, Text | 通用 Web 文本标注工具，支持多种语言学标注（不活跃维护，已迁移到 INCEpTION） |
| ActiveTigger | [GitHub](https://github.com/emilienschultz/activetigger) | 31+ stars | 开源 | Python, BERT | NLP, Text | 为计算社会科学研究设计的轻量级文本标注工具，集成微调模型和主动学习，支持 LLM 即服务进行提示式标注 |
| tagtog | [文档](https://docs.tagtog.com) | 商业产品 | 专有 | Web | NLP, Text, NER | Web 文本标注工具，专注于语义标注和 NER，支持协作和自动标注（官网访问受限） |
| Prodigy | [官网](https://prodi.gy) | 商业产品 | 专有 | Python | NLP, Text, Image | 由 spaCy 团队开发的高效标注工具，支持主动学习，可与 Python 工作流深度集成，适合快速迭代 |
| Argilla | [GitHub](https://github.com/argilla-io/argilla) | 3.5k+ stars / 350+ forks | Apache-2.0 | Python, FastAPI, Vue.js | NLP, Text, LLM | 面向 LLM 和 NLP 的协作标注平台，支持数据质量监控和模型评估 |
| LabelLLM | [GitHub](https://github.com/opendatalab/LabelLLM) | 1k+ stars / 100+ forks | Apache-2.0 | Python, Vue.js | NLP, Text, LLM | 专为大语言模型设计的开源标注平台，支持对话、指令等多种 LLM 数据标注 |

## 点云（Point Cloud）专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| labelCloud | [GitHub](https://github.com/ch-sa/labelCloud) | 769+ stars / 150+ forks | GPLv3 | Python, Qt | Point Cloud, 3D | 轻量级 3D 点云边界框标注工具，支持多种点云格式，界面友好 |
| SUSTechPOINTS | [GitHub](https://github.com/naurril/SUSTechPOINTS) | 1.1k+ stars / 200+ forks | MIT | Python, Qt | Point Cloud, 3D | 专为自动驾驶设计的 3D 点云标注平台，支持激光雷达数据标注 |
| Scalabel | [GitHub](https://github.com/scalabel/scalabel) | 543+ stars / 112+ forks | Apache-2.0 | TypeScript, React | CV, 2D, 3D | 多功能 Web 标注工具，支持 2D 和 3D 数据标注，BDD100K 数据集使用此工具标注 |
| 3D Annotation Tool | [GitHub](https://github.com/strayrobots/3d-annotation-tool) | 300+ stars / 60+ forks | MIT | Python, Three.js | Point Cloud, 3D | 图形化 3D 点云和数据标注工具，支持多种 3D 数据格式 |
| Supervisely Point Cloud | [GitHub](https://github.com/supervisely-ecosystem/pointcloud-labeling-tool) | 200+ stars / 40+ forks | MIT | Python, Web | Point Cloud, 3D, Video | 支持激光雷达/雷达传感器的综合 3D 场景标注，带 AI 目标跟踪和点云分割功能 |
| Kognic Platform | [官网](https://www.kognic.com) | 商业产品 | 专有 | Web, AI | Point Cloud, 3D, Semantic Segmentation | 专注于自动驾驶和机器人的企业级平台，支持 3D 语义/实例分割质量分析和程序化检查（2026年1月更新） |

## 服务端/自托管平台

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| Diffgram | [GitHub](https://github.com/diffgram/diffgram) | 1.8k+ stars / 300+ forks | MIT | Python, Vue.js | CV, NLP, Multi-modal | AI 数据存储平台，支持模式、预测和人工监督，可自托管部署，提供完整的数据工作流 |
| INCEpTION | [GitHub](https://github.com/inception-project/inception) | 800+ stars / 200+ forks | Apache-2.0 | Java, Spring | NLP, Text | 语义标注平台，提供智能标注辅助和知识管理，支持自托管部署，适合学术研究和企业应用 |
| Tator | [GitHub](https://github.com/cvisionai/Tator-Native) | 34+ stars / 7+ forks | AGPL-3.0 | C++, Qt | CV, Video, Image | 视频分析 Web 平台，支持大规模视频和图像标注，提供 AI 辅助标注和自定义工作流（已归档，被 Tator Online 取代） |
| Scalabel | [GitHub](https://github.com/scalabel/scalabel) | 543+ stars / 112+ forks | Apache-2.0 | TypeScript, React | CV, 2D, 3D | 多功能 Web 标注工具，支持 2D 和 3D 数据标注，BDD100K 数据集使用此工具标注 |
| LabelFlow | [GitHub](https://github.com/labelflow/labelflow) | 500+ stars / 80+ forks | AGPL-3.0 | TypeScript, Next.js | CV, Image | 开放的图像标注平台，支持协作和自托管，提供现代化的 Web 界面 |
| Ango Hub | [imerit.net/ango-hub](https://imerit.net/ango-hub) | 商业产品（部分开源） | 专有 | Web | CV, NLP, Multi-modal | 数据标注和模型微调平台，支持多传感器融合和 3D 标注，适合自动驾驶等生产级应用 |

## 轻量级/嵌入式工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| Universal Data Tool | [GitHub](https://github.com/UniversalDataTool/universal-data-tool) | 2k+ stars / 200+ forks | MIT | JavaScript, React | CV, NLP, Text, Image | 通用数据标注工具，支持多种数据类型，提供 Web 界面和桌面应用，易于协作 |
| Annotorious | [GitHub](https://github.com/annotorious/annotorious) | 600+ stars / 90+ forks | BSD-3-Clause | JavaScript | Image, Web | JavaScript 图像标注库，只需几行代码即可为网页添加标注功能，轻量级且易于集成 |
| Recogito | [GitHub](https://github.com/recogito/recogito-js) | 800+ stars / 100+ forks | BSD-3-Clause | JavaScript | Text, Image | 文本和图像交互式标注 JavaScript 库，支持协作标注，适合数字人文项目 |
| Pigeon | [GitHub](https://github.com/agermanidis/pigeon) | 700+ stars / 100+ forks | Apache-2.0 | Python, Jupyter | Jupyter, Text, Image | Jupyter Notebook 标注小部件，快速标注数据集，支持文本、图像和回归任务，100% 本地运行 |
| Universal Data Tool | [GitHub](https://github.com/UniversalDataTool/universal-data-tool) | 2k+ stars / 200+ forks | MIT | JavaScript, React | CV, NLP, Text, Image | 通用数据标注工具，支持多种数据类型，提供 Web 界面和桌面应用，易于协作 |
| Pigeon | [GitHub](https://github.com/agermanidis/pigeon) | 700+ stars / 100+ forks | Apache-2.0 | Python, Jupyter | Jupyter, Text, Image | Jupyter Notebook 标注小部件，快速标注数据集，支持文本、图像和回归任务，100% 本地运行 |
| ipyannotations | [PyPI](https://pypi.org/project/ipyannotations) | 200+ stars / 30+ forks | MIT | Python, Jupyter | Jupyter, Image | Jupyter 富标注库，专为图像数据设计，提供交互式标注界面 |

## 商业平台（支持自托管）

| 名称 | 地址 | 部署方式 | 价格模式 | 技术栈 | 支持类型 | 说明 |
|------|------|---------|---------|---------|---------|------|
| V7 Darwin | [官网](https://www.v7labs.com) | SaaS + 私有化 | 按用户席位 + 企业定制 | Web, AI | CV, Video, Image, Medical | 企业级视觉 AI 平台，支持 SAM 3 自动分割，提供视频标注和医学影像（DICOM）标注，适合生产环境 |
| Encord | [官网](https://encord.com) | SaaS + VPC + 私有化 | 按标注量 + 企业定制 | Web, AI | CV, NLP, Multi-modal, 3D, LiDAR | AI 辅助数据标注平台，支持图像、视频、音频、文档、3D 和 LiDAR 数据，提供 HITL 工作流 |
| SuperAnnotate | [官网](https://www.superannotate.com) | SaaS + 私有化 | 按用户席位 + 标注量 | Web, AI | CV, NLP, Multi-modal | 端到端数据标注平台，支持主动学习和数据管理，提供质量控制和团队协作功能 |
| Scale AI | [官网](https://scale.com) | SaaS + 托管服务 | 按标注量 + 服务费 | Web, AI | CV, NLP, Multi-modal | 领先的 AI 数据平台，提供高质量标注服务和工具，支持大规模数据处理 |
| Segments.ai | [文档](https://docs.segments.ai) | SaaS | 免费 + 按用户席位 | Web | CV, 2D, 3D, Point Cloud | 多传感器数据标注平台，支持 2D 图像和 3D 点云同步标注，适合机器人和自动驾驶（YC W21） |
| Labellerr | [官网](https://www.labellerr.com) | SaaS + 私有化 | 按标注量 + 企业定制 | Web, AI | CV, NLP, Video | 数据标注平台，支持自托管，提供 AI 辅助标注，声称可减少 80% 标注时间 |
| VisionRepo | [官网](https://averroes.ai) | SaaS | 按项目定价 | Web | CV, Image, Video | 数据标注和视觉数据管理平台，支持 AI 辅助工作流和数据版本控制 |
| Playment | [YC](https://www.ycombinator.com/companies/playment) | 托管服务 | 按标注量 | Web | CV, Image, Video, Sensor | 全托管数据标注平台，专注于自动驾驶、无人机和地图等领域（2021年被 TELUS International 收购） |
| Hive Data | [官网](https://thehive.ai) | SaaS + API | 按 API 调用 + 服务费 | Web, AI | CV, NLP, Multi-modal | AI 数据标注和内容审核平台，支持图像、视频和文本标注 |
| Kili Technology | [官网](https://kili-technology.com) | SaaS + 私有化 + VPC | 按用户席位 + 企业定制 | Web, AI | CV, NLP, Video, Geospatial | 企业级标注平台，支持本地部署，提供多模态标注、质量控制和协作功能。2026年1月更新：增强批量标注管理（提速60%）和节点编辑器 |
| Hasty (CloudFactory) | [官网](https://www.cloudfactory.com/platform/ai-cv-tool) | SaaS | 按用户席位 | Web, AI | CV, Image, Video | AI 驱动的视觉标注工具，可自动化 90% 的质量控制任务，随使用越来越快 |
| Dataloop | [官网](https://dataloop.ai) | SaaS + 私有化 | 按用户席位 + MLOps 功能 | Web, AI | CV, NLP, Multi-modal | 端到端数据管理和标注平台，支持自托管，提供 MLOps 集成 |
| Labelbox | [官网](https://labelbox.com) | SaaS + 私有化 + VPC | 按用户席位 + 企业定制 | Web, AI | CV, NLP, Multi-modal | 领先的训练数据平台，支持企业级部署，提供完整的数据管理和标注解决方案 |
| Dataturks | [GitHub](https://github.com/DataTurks) | 已停止维护 | 曾免费开源 | Java, Web | CV, NLP, Text, Image | 人机协作标注平台，支持图像、视频和文本标注（项目已归档，网站已下线） |

## 医学影像专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| NimbusImage | [官网](https://docs.nimbusimage.com/new-features) | 商业产品 | 专有 | Web, AI | Medical Imaging, Biology | 面向科研的生物影像标注和分析平台，支持圆形/椭圆标注、合并多边形、SAM1/SAM2 辅助分割（2026年2月更新） |
| Cytomine | [官网](https://cytomine.org) | 开源项目 | Apache-2.0 | Java, Groovy, JavaScript | Pathology, Whole-slide | 开源的大规模病理学图像协作标注平台，集成 AI 辅助细胞/区域标注和基于内容的图像检索（CBIR），适合数字病理学 |
| 3D Slicer | [官网](https://www.slicer.org) | 开源软件 | BSD | C++, Python, Qt | Medical Segmentation, DICOM, 3D | 专业医学影像分析平台，支持 DICOM/NIfTI，提供分割、配准、可视化等功能，广泛用于医学研究和临床应用 |

## 多模态标注平台

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| AutoDive+ | [论文](https://arxiv.org/abs/2310.12024) | 学术研究 | 研究项目 | Python, AI | Multi-modal, PDF | 增强版多模态在线标注工具，支持 PDF 文档直接标注，通过主动学习提高效率，适合材料科学、生物合成等领域 |
| Appen 多模态工具 | [官网](https://tw.appendata.com/blogs/multimodal-labeling-tool) | 商业产品 | 专有 | Web, AI | Multi-modal, Semantic | 专业多模态标注平台，支持语义层级的跨模态关联（如将文字描述关联到影像区域），适合医疗 AI、智能客服等场景 |

## 音频/语音专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| Audino | [GitHub](https://github.com/midas-research/audino) | 970+ stars / 110+ forks | MIT | Python, React | Audio, Speech | 开源语音和音频标注工具，支持 ASR 数据标注、说话人识别、音频分类等，提供 Web 界面和协作功能 |
| Montreal Forced Aligner | [GitHub](https://github.com/MontrealCorpusTools/Montreal-Forced-Aligner) | 1.1k+ stars / 200+ forks | MIT | Python | Audio, Speech | 强制对齐工具，用于将语音与文本对齐，生成音素级标注，广泛用于语音数据集准备 |
| ELAN | [GitHub](https://github.com/liepa-project/elan) | 专业软件 | GPL-3.0 | Java | Audio, Video | 专业语言标注工具，支持多层标注，适用于语音、手语、对话等复杂标注，输出多种格式 |
| Praat | [官网](https://www.fon.hum.uva.nl/praat/) | 专业软件 | GPL | C++ | Audio, Speech | 语音学分析软件，可用于手工标注音段、音高、共振峰等，功能强大，学术界广泛使用 |

## 遥感与地理信息专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| RoboSat | [GitHub](https://github.com/mapbox/robosat) | 2k+ stars / 400+ forks | MIT | Python, PyTorch | Remote Sensing, Image | 遥感图像语义分割工具，包含数据准备、训练和评估，支持从 OpenStreetMap 生成标注 |
| label-maker | [GitHub](https://github.com/developmentseed/label-maker) | 400+ stars / 80+ forks | MIT | Python | Remote Sensing, Image | 从卫星图像和 OpenStreetMap 数据生成训练标签，用于深度学习模型 |
| geojson.io | [官网](https://geojson.io) | 开源项目 | MIT | JavaScript | Geospatial | 在线 GeoJSON 编辑器，可手工标注地理特征（点、线、面），导出标准 GeoJSON 格式 |
| QGIS | [官网](https://qgis.org) | 开源软件 | GPL | C++, Python | Geospatial, Image | 专业 GIS 软件，支持通过插件或内置工具进行地理数据标注，适合复杂地理标注任务 |

## 工业检测专用工具

工业检测领域的标注通常复用通用计算机视觉工具。以下工具因其对缺陷标注、工业图像格式、AI 辅助分割的良好支持，在工业界广泛应用：

- **AnyLabeling / X-AnyLabeling**：集成 YOLO、Segment Anything 等模型，支持工业级自动标注，可大幅提升缺陷标注效率（详见[计算机视觉专用工具](#计算机视觉cv专用工具)）
- **CVAT**：支持工业图像和视频的语义分割、目标检测标注，并提供自动标注算法，适合大规模工业数据集（详见[综合类标注工具](#综合类标注工具)）
- **Roboflow Annotate**：提供针对工业检测的标注模板和主动学习功能，可利用公开模型加速标注（详见[计算机视觉专用工具](#计算机视觉cv专用工具)）
- **V7 Darwin**：企业级平台，支持 SAM 自动分割和 DICOM 等医学影像格式，也适用于精密的工业 CT/无损检测标注（详见[商业平台](#商业平台支持自托管)）

## 图结构与知识图谱专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| Gephi | [官网](https://gephi.org) | 开源软件 | GPL | Java | Graph | 开源网络分析和可视化软件，可手工标注节点属性、社区划分，支持多种图格式 |
| Cytoscape | [官网](https://cytoscape.org) | 开源软件 | LGPL | Java | Graph, Biological | 主要用于生物网络可视化与标注，支持节点和边的属性标注，适合分子相互作用网络等 |
| yEd Graph Editor | [官网](https://www.yworks.com/products/yed) | 免费软件 | 专有 | Java | Graph | 专业图形编辑器，支持节点和边的属性标注，可导出多种格式，适合图结构数据可视化和标注 |

## 表格数据处理专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| OpenRefine | [GitHub](https://github.com/OpenRefine/OpenRefine) | 9k+ stars / 1.5k+ forks | BSD-3-Clause | Java | Tabular Data | 数据清洗和转换工具，可手工标注数据质量问题、分类等，适用于表格数据预处理 |
| Pandas + Jupyter | [官网](https://pandas.pydata.org) | 开源库 | BSD | Python | Tabular Data | 通过编写脚本可进行表格数据标注，配合 Jupyter 小部件（如 Pigeon）可快速标注 |
| Label Studio (表格模板) | 详见[综合类](#综合类标注工具) | - | Apache-2.0 | - | Tabular Data | 支持 CSV/Excel 数据标注，可添加标签列，适用于分类、回归等任务 |

## 代码与程序分析专用工具

代码标注通常复用支持代码高亮的文本/NLP 工具。以下工具对该场景有良好支持：

- **Label Studio**：提供代码模板，支持语法高亮，可用于代码分类、缺陷标注、代码搜索等任务（详见[综合类标注工具](#综合类标注工具)）
- **Argilla**：支持代码文本的标注，可与 LLM 结合进行代码质量评估或生成训练数据（详见[自然语言处理专用工具](#自然语言处理nlp专用工具)）
- **doccano**：可配置为代码序列标注（如命名实体识别在代码上的应用），支持代码片段标注（详见[自然语言处理专用工具](#自然语言处理nlp专用工具)）

## 其他专用工具

| 名称 | 地址 | Star/Fork 数 | 开源协议 | 技术栈 | 支持类型 | 说明 |
|------|------|-------------|---------|---------|---------|------|
| Cleanlab | [GitHub](https://github.com/cleanlab/cleanlab) | 9k+ stars / 700+ forks | AGPL-3.0 | Python | Data Quality | 数据中心 AI 包，专注于数据质量和标签清洗，适合处理混乱的真实世界数据 |
| LabelConvert | [GitHub](https://github.com/RapidAI/LabelConvert) | 500+ stars / 100+ forks | Apache-2.0 | Python | Format Conversion | 数据集格式转换工具，支持 labelme、labelImg、YOLO、VOC、COCO 等格式互转 |
| AURA | [arXiv:2602.02564](https://arxiv.org/abs/2602.02564) | 学术研究 | 研究项目 | Python, AI Agents | Automated Annotation | 代理式 AI 框架，通过协调多个 AI 智能体生成和验证标签，代表自动化高可靠性数据标注的前沿方向 |

---

## 工具选择建议

### 按使用场景选择：

1. **多模态项目**：Label Studio、Encord 或 Appen 多模态工具 - 支持最全面的数据类型和跨模态关联
2. **计算机视觉**：CVAT 或 V7 Darwin - 功能最强大，社区活跃
3. **快速原型**：makesense.ai 或 Labelme - 轻量级，易上手
4. **NLP 任务**：doccano 或 brat - 专为文本标注优化
5. **RLHF/人类偏好对齐**：Argilla - 支持 RLHF 数据标注、数据质量监控和模型评估
6. **计算社会科学**：ActiveTigger - 集成主动学习和 LLM，适合学术研究
7. **点云标注**：labelCloud - 界面友好，支持多种格式
8. **3D 场景+多视角联合**：Scalabel - 支持 2D 和 3D 数据标注，BDD100K 数据集使用
9. **自动驾驶多传感器**：Kognic Platform 或 SUSTechPOINTS - 专为激光雷达和 3D 分割设计
10. **LLM 数据准备**：LabelLLM 或 Argilla - 专为大模型优化
11. **视频标注**：Tator、CVAT 或 V7 Darwin - 支持大规模视频处理
12. **学术研究**：INCEpTION 或 brat - 语义标注和知识管理
13. **Jupyter 环境**：Pigeon 或 ipyannotations - 直接在 Notebook 中标注，100% 本地运行
14. **命令行/MLOps 流水线**：Universal Data Tool - 支持多种数据类型，易于集成
15. **隐私敏感/数据不出域**：Pigeon - Jupyter 本地运行，数据不离开本地环境
16. **Web 集成**：Annotorious 或 Recogito - 轻量级 JavaScript 库
17. **YOLO 训练**：Yolo_mark 或 LabelImg - 专为 YOLO 格式优化
18. **COCO 格式**：COCO Annotator - 输出标准 COCO 格式
19. **医学影像分割**：3D Slicer - 专业医学影像分析平台，支持 DICOM/NIfTI
20. **医学影像通用**：V7 Darwin、Encord、NimbusImage 或 Cytomine - 支持 DICOM、病理切片等专业格式
21. **数字病理学**：Cytomine - 专为大规模病理图像设计，支持 AI 辅助和 CBIR
22. **生物影像研究**：NimbusImage - 支持 SAM 辅助分割和批量标注计算
23. **音频/语音标注**：Audino - 开源语音标注工具，支持 ASR 数据标注、说话人识别
24. **语音对齐**：Montreal Forced Aligner - 强制对齐工具，生成音素级标注
25. **语音学分析**：Praat - 手工标注音段、音高、共振峰，学术界广泛使用
26. **专业语言标注**：ELAN - 多层标注，适用于语音、手语、对话等复杂标注
27. **遥感影像标注**：RoboSat - 遥感图像语义分割，支持从 OpenStreetMap 生成标注
28. **卫星图像标注**：label-maker - 从卫星图像和 OSM 数据生成训练标签
29. **地理特征标注**：geojson.io - 在线 GeoJSON 编辑器，手工标注地理特征
30. **GIS 专业标注**：QGIS - 专业 GIS 软件，支持复杂地理标注任务
31. **工业检测**：AnyLabeling/X-AnyLabeling/CVAT - 集成 AI 模型，支持缺陷标注
32. **图结构标注**：Gephi/Cytoscape/yEd - 网络分析和可视化，支持节点属性标注
33. **表格数据标注**：OpenRefine - 数据清洗和转换，支持数据质量标注
34. **代码标注**：Label Studio/Argilla/doccano - 支持代码高亮和序列标注
35. **macOS 用户**：RectLabel - 原生 macOS 应用
36. **PDF 文档标注**：AutoDive+ - 支持多模态文档直接标注

### 按部署方式选择：

- **纯本地工具**：Labelme, LabelImg, labelCloud, Yolo_mark, RectLabel
- **浏览器工具**：makesense.ai, Annotorious, VIA
- **自托管服务端**：Label Studio, CVAT, doccano, INCEpTION, Tator, Scalabel, COCO Annotator, Diffgram
- **Jupyter 集成**：Pigeon, ipyannotations
- **商业自托管**：V7 Darwin, Encord, Kili Technology, Dataloop, Labelbox, SuperAnnotate

### 按团队规模选择：

- **个人/小团队**：Labelme, LabelImg, makesense.ai, Pigeon, Yolo_mark, RectLabel
- **中型团队**：doccano, labelCloud, CVAT, Universal Data Tool, COCO Annotator, Sloth
- **企业级**：Label Studio, CVAT (企业版), V7 Darwin, Encord, Kili Technology, Ango Hub, SuperAnnotate, Scale AI, Kognic

---

## 🔍 热门工具对比矩阵

### 综合类标注平台对比

| 工具 | 易用性 | 功能丰富度 | AI 辅助 | 协作功能 | 输出格式 | 部署方式 | 适合场景 |
|------|--------|-----------|---------|---------|---------|---------|---------|
| **Label Studio** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 多格式 | 云端+自托管 | 企业级多模态 |
| **CVAT** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | COCO/YOLO/VOC | 云端+自托管 | CV 专业团队 |
| **Labelme** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ | ⭐⭐ | JSON | 本地 | 个人快速标注 |
| **LabelImg** | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐ | ⭐ | VOC/YOLO | 本地 | YOLO 训练 |
| **Supervisely** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 多格式 | 云端+私有化 | 企业级 CV+点云 |

### NLP 专用工具对比

| 工具 | 易用性 | 功能丰富度 | AI 辅助 | 协作功能 | 输出格式 | 部署方式 | 适合场景 |
|------|--------|-----------|---------|---------|---------|---------|---------|
| **doccano** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | JSONL/CoNLL | 云端+自托管 | 通用 NLP 任务 |
| **Argilla** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | HF Datasets | 云端+自托管 | LLM/RLHF 数据质量 |
| **brat** | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐ | Standoff | 自托管 | 学术研究 |
| **LabelLLM** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | JSON | 云端+自托管 | LLM 数据标注 |
| **Prodigy** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | spaCy/JSON | 本地 | 主动学习 |

### 医学影像工具对比

| 工具 | 易用性 | 功能丰富度 | AI 辅助 | 协作功能 | 输出格式 | 部署方式 | 适合场景 |
|------|--------|-----------|---------|---------|---------|---------|---------|
| **3D Slicer** | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐ | NIfTI/DICOM | 本地 | 医学影像分析 |
| **Cytomine** | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 多格式 | 自托管 | 数字病理学 |
| **NimbusImage** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 多格式 | 云端 | 生物影像研究 |
| **V7 Darwin** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | DICOM/NIfTI | 云端+私有化 | 企业级医学 AI |
| **Encord** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 多格式 | 云端+VPC | 多模态医学 |

### 3D/点云工具对比

| 工具 | 易用性 | 功能丰富度 | AI 辅助 | 协作功能 | 输出格式 | 部署方式 | 适合场景 |
|------|--------|-----------|---------|---------|---------|---------|---------|
| **labelCloud** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ | ⭐ | PCD/PLY | 本地 | 个人点云标注 |
| **SUSTechPOINTS** | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐ | KITTI | 本地 | 自动驾驶研究 |
| **Scalabel** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | COCO/KITTI | 云端+本地 | 2D+3D 统一标注 |
| **Kognic Platform** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 多格式 | 云端 | 企业级自动驾驶 |
| **Supervisely Point Cloud** | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 多格式 | 云端+自托管 | 多传感器融合 |

**评分说明**：
- ⭐⭐⭐⭐⭐ 优秀
- ⭐⭐⭐⭐ 良好
- ⭐⭐⭐ 中等
- ⭐⭐ 基础
- ⭐ 有限

---

## 📊 统计概览

- **总计工具数**：79+ 个
- **开源工具**：52+ 个
- **商业产品**：20+ 个
- **学术研究项目**：3 个
- **支持 CV**：40+ 个
- **支持 NLP**：17+ 个
- **支持点云/3D**：8 个
- **支持音频/语音**：4 个
- **遥感/地理**：4 个
- **医学影像**：5 个
- **多模态**：4 个
- **图结构**：3 个
- **表格数据**：3 个
- **命令行/隐私工具**：2 个
- **支持自托管**：26+ 个
- **AI 辅助标注**：25+ 个

---

## 🔮 行业趋势与展望

### 1. 代理式 AI（Agentic AI）在自动标注领域的探索

以 AURA 为代表的代理式 AI 框架，通过协调多个 AI 智能体来生成和验证标签，并使用概率模型推断真实标签和智能体可靠性。这代表了利用多智能体协作和统计方法进行自动化、高可靠性数据标注的前沿方向。

### 2. RLHF 与人类偏好对齐标注的专业化

随着大语言模型的发展，RLHF（Reinforcement Learning from Human Feedback）标注需求激增。Argilla 等专业工具的出现，标志着从通用文本标注向"人类偏好对齐"专业标注的转变，支持多轮对话质量打分、helpfulness/harmlessness 评估等细粒度标注。

### 3. 多模态标注的深度发展

多模态标注正在从"支持多种格式"向"建立语义关联"深度发展。新一代工具（如 Appen 多模态工具、SceneXplain Studio）支持在统一画布上将文字描述直接关联到影像区域或 3D 场景，为训练具备深层理解力的多模态模型提供高质量数据。

### 4. 3D 场景理解与具身智能标注

Scalabel 等工具的出现，解决了传统点云标注与 2D 视图割裂的问题。通过支持 2D 和 3D 数据的统一标注，为自动驾驶、机器人等前沿领域提供基础设施。

### 5. 主动学习与 AI 辅助标注的普及

越来越多的工具（如 ActiveTigger、Prodigy、Roboflow）集成主动学习和 AI 辅助功能，通过智能推荐最有价值的样本进行标注，显著提高标注效率。预计未来这将成为标注工具的标配功能。

### 6. 隐私优先与边缘计算标注

随着数据隐私法规（GDPR、HIPAA）的严格化，Pigeon（Jupyter 本地运行）等工具应运而生，实现"数据不出域"的标注流程，满足金融、医疗、国防等强合规场景需求。

### 7. 垂直领域专业化

针对特定领域的专业标注工具不断涌现：
- **医学影像**：3D Slicer（医学影像分析）、Cytomine（数字病理学）、NimbusImage（生物影像）
- **自动驾驶**：Kognic（3D 语义分割）、Scalabel（2D+3D 统一标注）
- **音频/语音**：Audino（ASR 数据标注）、Montreal Forced Aligner（强制对齐）、ELAN（多层标注）、Praat（语音学分析）
- **遥感与地理**：RoboSat（遥感分割）、label-maker（卫星图像）、QGIS（GIS 专业）
- **工业检测**：AnyLabeling/X-AnyLabeling（AI 辅助缺陷标注）
- **计算社会科学**：ActiveTigger（LLM 辅助）
- **图结构**：Gephi（网络分析）、Cytoscape（生物网络）、yEd（图形编辑）
- **表格数据**：OpenRefine（数据清洗）
- **MLOps 集成**：Universal Data Tool（多数据类型支持）

### 8. 音频标注走向细粒度与自动化

随着语音合成、情感计算等需求增长，音频标注正从简单的转写向音段对齐、韵律标注等细粒度方向发展，Montreal Forced Aligner 等强制对齐工具成为标配。

### 9. 遥感与地理标注融合 GIS 与 AI

RoboSat 等工具的出现，标志着传统 GIS 软件与深度学习数据准备流程的深度整合，自动化提取地理特征成为可能。

### 10. 工业检测标注强调 AI 辅助与实时性

在工业 4.0 背景下，标注工具不仅需要支持缺陷类型标注，还需与在线检测系统联动，AnyLabeling 等集成 Segment Anything 的工具大幅提升了标注效率。

### 11. 质量控制与程序化检查

### 11. 质量控制与程序化检查

企业级平台（如 Kognic、Kili Technology）引入程序化检查功能，自动验证标注的几何属性、一致性等，大幅提升数据质量和标注效率。

---

## 🤝 贡献

欢迎提交 Issue 或 Pull Request 来补充更多标注工具或更新现有信息。

## 📝 数据来源说明

本文档中的 Star/Fork 数据为近期统计的大致数值（截至 2026年2月），实际数据可能有所变化。所有信息均来自公开渠道，包括 GitHub、官方网站、学术论文等。

---

**最后更新时间**：2026年2月

**参考来源**：
- [GitHub Topics - Data Labeling](https://github.com/topics/data-labeling)
- [GitHub Topics - 3D Annotation](https://github.com/topics/3d-annotation)
- 各工具官方仓库和文档

## ⭐ Star History

如果这个仓库对你有帮助，欢迎 Star ⭐

## 📄 License

本仓库采用 [MIT License](LICENSE) 开源协议。