# LabelStudio_Study **Repository Path**: hidadeng/LabelStudio_Study ## Basic Information - **Project Name**: LabelStudio_Study - **Description**: 如果采集的数据有很多图片、音频视频链接,虽然Nvivo可以进行多媒体分析,但是需要事先下载好的多媒体文件导入到Nvivo才能进行。多媒体数据处理属于很hitech的部分,很难,大邓也不会(⊙o⊙)…。 所以对于小白或者文科生而言还是没法用python自动化快速实现多媒体数据的标注,但是却可以让我们的标注过程更高效。今天介绍的label-studio库可以在没下载相关多媒体情况下,仅仅依靠图片、音频、视频的链接即可联网打开,进行标注。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2020-06-19 - **Last Updated**: 2022-06-02 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Label Studio ## 一、简介 如果采集的数据有很多图片、音频视频链接,虽然Nvivo可以进行多媒体分析,但是需要事先下载好的多媒体文件导入到Nvivo才能进行。多媒体数据处理属于很hitech的部分,很难,大邓也不会(⊙o⊙)…。 所以对于小白或者文科生而言还是没法用python自动化快速实现多媒体数据的标注,但是却可以让我们的标注过程更高效。今天介绍的label-studio库可以在没下载相关多媒体情况下,仅仅依靠图片、音频、视频的链接即可联网打开,进行标注。 点击下方视频,观看 《B站视频:如何用Python对多媒体数据进行标注 》 [![](img/B站.png)](https://www.bilibili.com/video/BV16C4y1s7XY/) ---

## 二、安装 ``` pip install label-studio ```

## 三、 创建项目 1. 建议在**电脑桌面**新建一个文件夹**LabelStudio**(好的名字容易记住^_^) 2. 将路径切换至**LabelStudio文件夹**,需在**命令行**执行下面命令 ``` cd desktop/LabelStudio ``` 3. 创建一个名叫**my_project**的项目,命令行执行 ``` label-studio start my_project --init ``` ![首页](img/首页.png) **打开项目** 如果已经创建了my_project,操作方法与创建项目类似,但要注意step3应该改为 ``` label-studio start my_project ```

## 四、项目设置 根据自己需要标注的数据情况,我们需要设计标注页面。
### 4.1 标注默认项设置 默认的界面如下 ![labelconfig](img/labelconfig.png) 图片中有左侧html解读 - 右侧Interface Preview是左侧html的渲染效果 - 右下角Input Task Preview默认测试数据预览 - $image是用来接收数据中的image字段 - 如果标注数据有视频,value一定要用"$video",不然视频显示不了 - name与toName应该一样 - name不能重复 这块比较难理解,可看我的操作视频辅助你学习理解。该页面上方有很多不同任务类型对应的html设计,大家可以都点击蓝色链接查看一下。
#### 4.1.1 数据 ![data](img/data.png) 假设我现在已有数据 **data.csv**,需要标注 - avatar - intro - video 我们平常采集到的视频链接是raw_video,但是labelstudio不能用链接直接渲染出视频,所以实际上我们用的是``video``。 ``video``中的src就是raw_video ```html