今天,我们激动地宣布 Argilla 2.0 的首个候选版本发布。这个新版本对整个产品产生了巨大的积极影响,旨在通过可扩展的反馈任务,拓宽对多样化 AI 项目的支持。
Argilla 现在从以任务为中心的方法转变为可扩展的反馈模型,允许通过统一的框架处理核心 NLP、AI 和 LLM 相关任务。无论您是在进行文本分类、命名实体识别 (NER)、机器翻译、文本摘要、问答、大型语言模型 (LLM)、语音识别还是对话式 AI,Argilla 都可以通过灵活的配置简化所有项目类型的人工反馈收集。
Argilla 的独特价值在于其简化多样化反馈任务的能力,使得创建高质量数据集比以往任何时候都更容易。通过将任务统一到一个单一的、可扩展的反馈框架中,用户可以专注于构建更好、更有效、更负责任的 AI 解决方案。
从 Argilla 1.0 到 Argilla 2.0 的旅程
Argilla 是一个开源协作平台,供 AI 工程师和领域专家构建高质量数据集。我们开发以人为本的开源软件,以构建更强大、更可持续和更负责任的 AI 解决方案。我们相信,更好的 AI 解决方案的关键在于更好、更高质量的数据。
自 2021 年作为 NLP 爱好者的一个小社区成立以来,Argilla 已发展成为一个更大的 AI 从业者社区。许多 AI 团队现在正在将 Argilla 集成到他们的开发工作流程中。作为一个社区驱动的项目,Argilla 2.0 基于来自持续社区反馈的宝贵见解。
调整人工反馈以适应 LLM 的兴起
随着 LLM 在 2022 年底的激增,Argilla 为文本标注提供了一个开源替代方案,高效处理文本分类、命名实体识别和文本到文本处理等核心 NLP 任务。当时 Argilla 的独特价值基于:
- 与外部工具的无缝集成,增强了各种 MLOps 工作流程的灵活性和功能。
- 一种强大的数据探索和批量标注方法,实现了高效且富有洞察力的数据处理。
认识到 LLM 的影响,我们推出了 反馈数据集,它允许领域专家通过配置一组问题(类似于表单)来提供关于 LLM 输入和输出的反馈。
在过去的 12 个月中,Argilla 已从专注于自然语言处理任务的以任务为中心的数据集,过渡到针对复杂或多任务的可扩展反馈数据集。这一为期一年的过渡包括涵盖以前的大部分功能、重建 SDK、重写文档以及添加新颖的关键功能。
从特定任务的数据标记到反馈问题
随着 AI 模型的快速发展,各种规模的团队都在处理大量的用例,所有这些用例都旨在基于高质量的自定义数据集构建和评估模型。Argilla 2.0 引入了一个新的工作流程,使用户能够从各种问题模板中进行选择,包括评分、排名、文本、多标签、单标签和跨度问题。这种灵活性使团队能够为几乎无限的用例(例如,NLP、LLM)和目的(例如,训练、评估)收集人工反馈,从而可以精确地微调用于训练 LLM 的数据。此外,通过结合不同的反馈任务,标注者可以提供更全面的反馈,同时更有效地利用他们宝贵的时间。
赋予您的标注者作为领域专家的能力
在 Argilla,我们将标注者视为能够深入理解他们正在处理的用例的 компетентные 领域专家,并且当给予正确的工具时,可以提供知情的反馈,从而提高数据质量。因此,Argilla 2.0 继续构建用于搜索、过滤和审查记录的 UI 功能。我们专注于两个主要领域:灵活的布局和改进的过滤。
灵活的布局意味着标注者可以根据反馈任务定义最有效的记录视图。他们可以调整字段与问题的分割,以专注于一个区域中更广泛的内容。或者他们可以将指标和指南置于持续视图中,以理解任务。
在字段上搜索允许标注者通过指定要搜索的字段来控制他们如何搜索具有多个字段的记录。
改进 SDK 以方便使用
最近,我们向社区征求了他们对 SDK 开发的意见。我们与来自不同背景的用户进行了交谈,从在生产环境中部署 Argilla 的用户到首次学习 Argilla 和以人为本的 ML 的用户。我们还与处理诸如分类等经典 NLP 任务的用户以及处理诸如直接偏好优化数据集等高级 LLM 项目的用户进行了交谈。从这些讨论中,我们了解了关于 SDK 的两件事:
- 他们喜欢并且需要通过
FeedbackDataset
切换到可扩展的任务。 - 不断增长的功能变得难以学习和跟上。
Argilla 2.0 SDK 是旨在统一和简化 Argilla 的开发者体验,同时保持反馈数据集灵活性的数月努力的成果。如果您想了解更多关于设计过程并观看代码演练,请不要错过 Ben 的视频。
Argilla 2.0 之外的即将推出的功能
一旦 Argilla 2.0 发布,我们将开始发布一系列令人兴奋的新功能。以下是我们计划中的一些功能的概述。
任务分配
Argilla 将启用最小化设置,以在可用用户之间分配反馈任务。通过配置记录被视为完成所需的最小提交响应数,项目管理员将确保收集的反馈质量,并最大限度地利用领域专家的努力。此功能是迈向更高级的协作和团队管理功能的第一步。
多模态支持
多模态 AI 正在成为现实。为了使用人工反馈改进多模态模型,Argilla 用户可以在记录字段中使用 HTML。我们正在努力通过内置的 ImageField 改进用户体验。这种新型字段将为收集计算机视觉和视觉语言模型的人工反馈提供更强大和灵活的方式。
使用这个内置字段,用户可以使用我们当前的问题设置反馈工作流程(对图像进行评分、描述图像、对两张图像进行排名等等)。一旦我们发布此功能,我们将收集社区对其他计算机视觉任务(如图像分割、对象检测等)的兴趣。
无代码数据集创建
目前,Argilla 项目由 ML/AI 工程师部署应用程序并定义反馈任务来启动。但是,领域专家也应该能够启动项目并改进数据集。例如,UI 用户应该能够在 Hub 上选择数据集仓库,定义反馈任务,并在 Argilla UI 中改进该数据集。我们相信,从 UI 创建数据集可以使户无需了解 Python 即可开始使用。这将围绕与 Hugging Face Hub 的深度集成以及 Argilla UI 中的新数据集创建流程展开。