Argilla raised $1.6 million

我们筹集了 160 万美元,以革新 NLP 的数据标注

2023年1月25日

Argilla

我们非常激动地与您分享一些重大新闻!Argilla 已筹集了 160 万美元,以促进以数据为中心的 NLP 开发,为我们出色的社区和企业客户服务。本轮融资由 Zetta Venture Partners (Kaggle、Domino Data Lab、Weaviate) 和 Caixa Capital Risc (Vilnyx、Codee) 共同领投。作为一个开源平台,我们将继续优先为我们出色的社区服务,同时支持我们的企业客户扩展其数据标注和人工反馈工作流程。为了构建最佳的以数据为中心的 NLP 平台,我们正在与一些精选的企业设计合作伙伴合作。如果您想通过以数据为中心的人工智能和人工反馈来提升 NLP,我们很乐意与您交流

人工反馈以及专家和数据团队之间的协作推动了 Argilla 的愿景。最近基于大型语言模型的突破,例如 OpenAI 的 chatGPT,证明了人工反馈如何促成更强大、更可靠和更可扩展的自然语言处理 (NLP) 产品。每天都会发布新的开源模型和服务,为数据团队和公司构建 NLP 解决方案提供强大的力量。

然而,数据仍然是成功企业 NLP 应用的关键,需要使用自定义数据和反馈循环进行微调,以实现准确且经济高效的结果。我们很高兴看到,我们关于数据团队可以使用 NLP 的最新进展,专家可以提供高质量的输入和反馈的平台愿景比以往任何时候都更加重要。有了这笔资金,我们将更加专注于我们的愿景、我们的社区,并为需要扩展数据标注和管理工作流程的公司推出 Argilla Cloud。

argilla_ui.png

程序化标注可以在数据标注生产力方面产生巨大的差异,特别是当将其交给无需编程的领域专家时。但这并不是解决数据标注问题的唯一最重要解决方案。我们认为,围绕反馈循环和协作构建的强大的 MLOps 工作流程才是解决方案。因此,我们将专注于构建与广泛使用的 ML 平台的桥梁和集成。

自从我们在 2021 年 6 月开源 Argilla 以来,我们已经走了很长一段路。来自美洲、欧洲、非洲和亚洲的数千名用户和社区成员正在使用 Argilla 的程序化标注功能和 MLOps 优先的方法来构建出色的数据标注和管理工作流程。医疗保健、IT、媒体、金融服务和其他行业的数十家公司正在利用 Argilla 更高效地构建 NLP 产品。

在过去的几个月中,我们发布了一些令人兴奋的功能,例如领域专家的完全交互式弱监督标注体验与 Hugging Face Hub 数据集的集成,以及由 OpenAI、Cohere 或 Sentence Transformers 的嵌入提供支持的闪电般快速的数据标注。我们对未来的道路感到兴奋。请密切关注未来几天的更多激动人心的更新!