DefinedCrowd为人工智能数据集管理融资了5050万美元

总部位于西雅图的DefinedCrowd自称是一个“智能”数据管理平台,该公司今天宣布,已经通过股权融资筹集了5050万美元。该公司首席执行官兼创始人Daniela Braga表示,这笔收入将用于扩大公司现有的解决方案,推出基于订阅的产品,并扩大DefinedCrowd的国际影响力。

训练人工智能算法通常需要高质量的标记数据,这就是为什么制作语料库需要的时间几乎与开发吸收它们的模型一样长,有时甚至更长。这是DefinedCrowd旨在通过定制的模型培训服务来解决的问题,该服务面向客户服务、汽车、零售、医疗保健和其他企业部门的客户。

Braga拥有语音技术博士学位,对数据集管理的细节非常熟悉。在创建DefinedCrowd之前,她监督了一项1400万美元的工作,以改进微软(Microsoft)的人工智能语音助手Cortana,她称这是一场艰苦的战斗。每个产品开发周期大约18个月的时间用于获取数据以更新底层模型。

DefinedCrowd的方法是通过Neevo在195个国家雇佣了超过29万名贡献者(两年前是4.5万名),他们完成包括标签、打字和口语单词和短语在内的有偿工作。他们每天向DefinedCrowd的自然语言处理、语音识别和计算机视觉工具提供超过50万个样本。

通过API和Web界面,DefinedCrowd的客户可以过滤人口统计数据,详细说明Neevo成员的年龄、位置和性别,甚至他们对语言的熟练程度,这些语言适用于抄写、语音情感标记、文本情感和语义注释、问答收集和自发演讲等应用。该平台支持超过50种语言和79种方言,约占世界上使用最广泛的语言的90%,号称标签准确率高达98%。

DefinedCrowd的真正价值主张是它的可扩展性。客户不仅可以使用该平台在预算限制内从零开始培训模型,还可以使用根据特定技术需求定制的数据集来扩充现有模型。那些需求更简单的人可以利用专门的工作流、模板和现成的解决方案,或者上传他们自己的专有数据集,同时获得实时成本估算和查看实时进度的仪表板。

例如,亚马逊Alexa平台上的新闻管理技术开发人员可以使用DefinedCrowd来生成多个数据集,以提高算法在市场上的性能。

DefinedCrowd去年的收入同比增长656%,其客户包括宝马(BMW)、万事达(Mastercard)、Nuance和雅虎日本(Yahoo Japan)等财富500强公司。该公司的员工超过100人,分布在葡萄牙、西雅图和日本的办公室,DefinedCrowd计划到2021年将员工人数增加一倍,达到500人,并开设更多的研发实验室。

2018年7月,DefinedCrowd筹集了1180万美元的资金,最新一轮融资使DefinedCrowd的总融资额达到了6,340万美元。本轮融资包括来自新投资者Semapa Next和Hermes GPE的参与。现有投资者Evolution Equity Partners、Kibo Ventures、Portugal Ventures、Bynd Venture Capital、EDP Ventures和IronFire Ventures也参与其中。他们加入了亚马逊Alexa基金(Amazon Alexa Fund)、索尼创新基金(Sony Innovation Fund)和万事达(Mastercard)等长期投资者的行列。

值得注意的是,DefinedCrowd并不是唯一一家在价值超过50亿美元的数据注释工具市场上争夺一席之地的初创公司。Scale AI最近为其广泛的数据标签服务套件筹集了1亿美元,CloudFactory去年11月为其数据处理和准备工具获得了6500万美元。这还不包括Mighty AI, Hive, Appen和Alegion。

发表评论

电子邮件地址不会被公开。 必填项已用*标注