CloudFactory融资6500万美元来准备和处理数据集

人工智能和机器学习算法需要数据,大量的数据。但是,如果这些数据不是首先由人工注释器标记的,那么它们中的大部分都是无用的。这种困境催生了一大批初创企业,其中包括Scale AI,该公司最近为自己的一系列数据标签服务融资了1亿美元。更不用说Mighty AI、Hive、Appen和Alegion,它们加在一起占据了数据注释工具市场,预计到2025年价值16亿美元。

CloudFactory是另一个引人注目的竞争者。这是连续创业家马克•西尔斯(Mark Sears)的创意,他用了9年时间,将其从一家小规模的数据准备解决方案公司发展成为一家在英国,美国,尼泊尔和肯尼亚设有办事处的国际集团(CloudFactory的总部设在雷丁)。今天,该公司宣布在一轮增长股权融资中筹集了6500万美元,使其总融资额达到7800万美元。

Sears表示:“人工智能和机器学习创新的未来将由人驱动,我们相信,我们对人的关注是我们增长的最大贡献。一家公司可以拥有最好的工具,但在决定向这些算法提供数据的质量方面,人员是关键因素。通过把我们的员工看得比什么都重要,他们会更专注于自己的工作,并使用最好的工具,为我们的客户提供最高质量的数据。”

CloudFactory利用世界各地的一小群工人,使用100多种不同的计算机视觉和自然语言理解工具包,为人工智能测试和验证语料库贴上标签、扩充和丰富内容。这些工作人员对图像、音频剪辑和视频进行标记和注释,根据客户的需要和需要对语义、语法和上下文检测算法进行培训。

这只是相当大的用例的冰山一角。CloudFactory提供图像注释服务,从边界框和语义分割到3D点云和传感器融合,以及多达数百万个文件的文档标记和借助光学字符识别的转录。该公司的云计算员工通过标注卫星图像和无人机摄影来为地理空间算法提供数据准备,并通过基于不同意见和情绪的结构化数据来处理情绪分析。

CloudFactory与客户合作,了解他们的业务和项目的细微差别。它通过多级评估来选择数据处理团队,然后客户将数据处理团队交付给这些团队进行远程和面对面的培训。通过每日冲刺和迭代反馈循环的过程——加上成对的学习——CloudFactory根据需要准备数据,同时通过聚焦技术和实时监控确保质量。前面提到的客户机可以通过具有可视化和协作工具的工作空间看到每个步骤。

CloudFactory的平台是与工具无关的,旨在与一系列基于Web、基于云和内部部署的平台集成。此外还有一个内部微任务平台,它将任务原子化和自动化结合起来,以扩展到大容量的工作流。另外还有一个计划——Shield Plus——提供安全设备、软件和IT协议,以及具有增强物理安全性的专用工作空间。

CloudFactory谨慎地将自己与Cognizant等有争议的竞争对手区分开来。该公司声称,它会对每一位员工的“技能”和“性格”进行审查,并为他们提供成长和培训机会,“自然会产生高质量的工作”。具体来说,除了未指明的“指标驱动”奖金外,它还提供领导机会和充实计划。

CloudFactory的130多家客户包括11多家自动驾驶汽车初创公司,如NuTonomy和Embark等,以及微软(Microsoft)等重量级企业。其中包括生物识别软件提供商Facetec和移动奖励平台开发商Ibotta,以及Pilot.ai(它为计算机视觉应用提供了一个嵌入式AI解决方案)和GoSpotCheck。

到目前为止,CloudFactory已经完成了150多个项目,现在它每天处理“数百万”个任务。

Sears表示,由FTV Capital领投、Weatherford Capital参与的最新一轮融资,将用于改善CloudFactory员工的增长和教育机会。他说,随着该公司投资于提供更高自动化程度和提高效率的新技术和能力,它还将被用来加快公司在全球的销售和营销努力。

FTV Capital合伙人亚历克斯•梅森(Alex Mason)表示:“随着人工智能技术继续快速增长,为复杂的人工智能系统提供高质量数据的需求至关重要。”Mason计划与阿贝•普斯库尔(Abhay Puskoor)和Weatherford Capital合伙人山姆•韦瑟福德(Sam Weatherford)一道,加入CloudFactory的董事会。CloudFactory正准备在许多行业垂直领域实现巨大的增长,在这些领域中,高管们正大声疾呼,要求提供满足卓越质量标准并持续交付的数据标记功能。我们很高兴能与CloudFactory久经考验的管理团队合作,他们拥有独特的愿景和出色的执行能力,以实现他们的业务目标并成功地完成他们的使命。”

发表评论

电子邮件地址不会被公开。 必填项已用*标注