Domino数据实验室筹集了4300万美元,帮助企业保持他们的人工智能模型更新

Domino Data Lab是一家为拥有大型数据科学团队的企业开发平台的初创公司,今天它宣布获得了4300万美元的股权融资。与此同时,该公司还推出了一系列新技术——多米诺模型监控(Domino Model Monitor)——旨在防止人工智能模型错误地表现出偏见或退化。

一般来说,在使用模型之前,模型的精确度将达到最佳,这一理论被称为概念漂移。模型试图预测随时间不可避免的变化的变量的统计特性。例如,人们的偏好发生了变化,或者竞争对手的某项举措颠覆了某些假设。Domino(客户包括Dell,Allstate,UBS,Bristol Meyers,ConocoPhillips和Lockheed Martin)旨在通过使各种模型刷新过程实现自动化的产品来减轻漂移。

Domino的工作台使工程师能够利用现有工具跟踪、重现和比较实验,同时在一个地方查找、讨论和重用工作。他们可以在自己选择的硬件上启动交互式工作区,并在必要时扩展到更强大的计算资源,同时使用内置的包管理器来组织贯穿整个项目的库和工具,以及版本化的数据集来跟踪在模型培训和测试期间使用的数据。工作台的报告特性使管理员可以安排生成报告并自动交付给涉众,而数据管道处理任务以使模型保持最新。它的按需发布器为业务用户制作分析表单,以供自助服务。

在模型操作方面,Domino允许客户将模型作为按需API部署,或者导出模型用于在其他基础设施上部署。Model Monitor检测数据漂移(导致性能下降的数据变化),并在向工程师提醒性能不佳的模型时,监测模型的野外性能。一个附带的注册表可以一目了然地显示模型的状态,而不管它们部署在哪里或如何部署,与Jira和其他企业工具的集成可以维护法规遵从性所需的可审核性(和安全性)级别。

根据Domino的说法,生产模型的准确度下降10%到20%的情况并不少见——尤其是在社会经济动荡时期。一位发言人表示:“现在,公司比以往任何时候都更需要了解买家偏好的变化、经济变化以及其他他们无法控制的外部因素,这些因素会导致他们的车型过时。Domino使公司能够检测变化[使用]仪表板…即使他们不想监视仪表板,他们可以设置阈值,这样……通知可以发送通知关键人物,是时候重新培训从当今世界使用更新后的数据,使用一种新的算法或完全重建它。”

Domino还密切关注计算,并度量模型api、应用程序等在项目运行状况方面的业务影响,包括进展和潜在障碍。很快,由于平台后端最近进行了更新,Domino将允许客户机将外部托管的Git代码存储库(在GitHub、Bitbucket等平台上)作为存放项目文件的主要方式。其他的改进也在进行中,包括按需的Spark集群用于分布式处理,支持Kubernetes与微软Azure和红帽Openshift的编配,以及将模型图像导出到Amazon Web Services (AWS) Sagemaker的能力。

位于旧金山的Domino将目标锁定在保险、金融服务、互联网和技术、生命科学、制造业、媒体和零售、医疗保健、石油和天然气以及银行业等领域,以求在新兴的“MLOps”市场分一份羹。它似乎已经开始了:最新一轮融资由Highland Capital Partners和Dell Capital共同牵头,继2018年8月其总额为4000万美元的D轮融资后,目前其总融资额已超过1.236亿美元。

发表评论

电子邮件地址不会被公开。 必填项已用*标注