Label Studio

Label Studio是灵活强大的开源数据标注工具,支持文本、图像、音频、视频等多种数据类型的标注,助力AI团队高效构建高质量机器学习训练数据集。

访问官网
Label Studio

特点

多模态数据标注

支持图像、文本、音频、视频及时间序列等多种数据类型,一个平台即可完成所有标注任务。

灵活配置与定制

提供丰富的标注模板和自定义选项,按需配置标签、快捷键、条件逻辑及界面布局,适配任意项目场景。

协作与智能集成

内置团队协作机制,支持权限管理与实时审核;无缝对接机器学习模型,实现主动学习与预测辅助标注。

基本信息

Label Studio
  • 出品方:Heartex(Heartex Labs)
  • 英文名称:Label Studio
  • 首次发布:2020 年 5 月
  • 产品类型:开源数据标注平台,支持图像、文本、音频、视频、时间序列等多模态数据
  • 核心能力:多类型标注(边界框、多边形、关键点、文本分类、实体关系、音频分割、视频帧标注)、协作标注、ML 自动标注、自定义模板、API 集成、多格式导出
  • 最新版本:1.13.0(2025 年 4 月)
  • 支持数据类型:图像、文本、音频、视频、时间序列、对话、HTML 文档

所获荣誉

Label Studio
  • GitHub 开源之星:Label Studio 在 GitHub 上累计获得超过 10,000 颗星标,是数据标注领域最受欢迎的开源项目之一,社区贡献者超过 200 位。
  • G2 用户高度评价:在 G2 平台获得 4.5 星综合评分,被用户评为数据标注软件的“高绩效者”(High Performer),在易用性与功能完整性指标上领先同类工具。
  • 行业权威认可:被 NVIDIA、Google、Microsoft、Amazon 等全球领先企业实际部署于生产环境,其稳定性和扩展性获得大规模验证。

发展历史

2018

Heartex 团队在内部数据标注需求驱动下开发了 Label Studio 原型,随后以开源形式发布在 GitHub 上,支持图像、文本等基础标注类型,社区开始关注。

2019

项目持续迭代,新增音频、视频标注功能,并引入基于配置的标注界面自定义能力,吸引了更多企业级用户参与测试,贡献者数量稳步增长。

2020

Label Studio 1.0 正式发布,标志着第一个稳定版本的诞生。同年推出 Label Studio Enterprise 预览版,面向团队协作与项目管理场景,增加用户权限和标注质量控制流程。

2021

获得由 Redpoint 领投的 A 轮融资,团队迅速扩充。发布 1.5 版本,大幅提升后端性能,集成机器学习后端接口,支持主动学习与预标注流水线,成为数据标注领域的主流开源方案之一。

2022

Label Studio 2.0 发布,前端使用 React 重构,采用全新插件化架构,允许开发者通过 JavaScript 编写自定义标注组件。同时推出 Label Studio Enterprise 2.0,新增审计追踪与高级报告功能。

2023

聚焦 LLM 与多模态标注场景,增加对对话数据、文档解析链的支持。社区版发布 2.5 版本,原生集成 Hugging Face 模型库,用户可一键加载预训练模型用于自动标注。

2024

继续深耕 MLOps 生态,发布 Label Studio 3.0 Alpha,引入分布式标注引擎与云原生部署模板。企业版新增合规认证(SOC 2 Type II),并推出面向医学影像与地理空间的专用模板市场。