Gartner报告:正处于数据科学与机器学习工具 “大爆炸”的时代
副标题[/!--empirenews.page--]
Gartner 表示,目前用于数据科学的工具正在迅速发生变化。该公司在其最新的数据科学和机器学习平台的报告中称,我们正处于 “大爆炸” 中。 日前, Gartner 发布了 2019 年版面向数据科学与机器学习工具的魔力象限。Gartner 的魔力象限是在某一特定时间内对市场情况进行的图形化描述,根据 Gartner 的定义,它描述了 Gartner 依据标准对该市场内的厂商所进行的分析。Datanami 的 Alex Woodie 为我们解读了 2019 年版面向数据科学和机器学习工具的魔力象限。 Gartner 表示,目前用于数据科学的工具正在迅速发生变化。该公司在其最新的数据科学和机器学习平台的报告中称,我们正处于 “大爆炸” 中。 1 月 28 日,Gartner 发布了《数据科学和机器学习平台魔力象限》(Magic Quadrant for Data Science and Machine Learning Platforms),并表示:“数据科学和机器学习市场是健康、活跃的,众多供应商提供了一系列产品。这个市场正在经历一场‘大爆炸’,这场‘大爆炸’不仅重新定义了应由谁来做数据科学和机器学习,还重新定了数据科学和机器学习应如何实现。” 分析师小组将数据科学平台定义为综合场所,在这里,数据科学家、民间数据科学家和开发人员不仅可以得到构建数据科学应用所需的所有核心功能,还可以将它们嵌入到现有业务流程和管理中,,并对其进行管理和维护。 数据科学和机器学习平台必须满足最低要求,并包括以下工具: ♦ 提取和准备数据; ♦ 以交互方式探索和可视化数据; ♦ 工程数据特征和构建预测模型; ♦ 与周围基础设施集成,测试并部署这些模型。 Gartner 数据科学与机器学习平台魔力象限(图:Gartner) Gartner 认为,整合和凝聚力是关键,如果应用程序(尤其是开源产品)只是简单地将各种包和库捆绑起来,那么这样的产品并不能视为真正的平台。 虽然这些核心要求为数据科学和机器学习平台奠定了基础,但不同的供应商在如何实现这些需求上存在着很大的差异。Gartner 指出,专业数据科学家可能更喜欢用 Python 或 R 编写代码,而其他人更喜欢数据科学笔记本的易用性,如 Jupyter。还有一些不太懂技术的人更喜欢用鼠标在界面上点击,因为对他们来说这样很直观。 领导者象限 在领导者象限中,Gartner 列入了四家供应商,包括:KNIME、RapidMiner、TIBCO Software、SAS。 在 Gartner 的评估中,KNIME 名列前茅,这归功于客户的大力支持、广泛的产品组合以及市场上 “最平衡的” 愿景之一。苏黎世公司的产品系列(包括开源 KNIME Analytics 产品和商业 KNIME Server 产品)被誉为分析领域的 “瑞士军刀”。对深度学习、中级用户提供的的易用性以及与其他包集成的高级功能的支持受到了称赞,然而,性能和可扩展性被视为弱点,以及对物联网的吸引力也很有限。 在领导者象限中,Rapid Miner 也是名列前茅,这得益于它在易用性和支持复杂数据科学能力之间的平衡。这款软件支持深度学习技术并部署到 GPU,Gartner 似乎很喜欢 Rapid Miner 为机器学习部署提供更高的透明度。它与开源工具的整合有利于数据科学家。主要关注点是数据准备和可视化、许可和定价、模型操作。 TIBCO 从挑战者象限中迈出了一大步,购买了一系列分析领域的企业,包括 Jaspersoft、Spotfire、Statistica 和 Alpine Data,并将它们整合到统一的平台中。Gartner 很欣赏 TIBCO 的这一点:提供端到端工作流程集成以及物联网功能,尤其是流式分析的整合。它潜在的问题包括性能和稳定性、数据管理及操作方面的问题。 SAS 是这份名单上的多年竞争者。实际上它有多个经过评估的平台。它的 Enterprise Miner 产品在一系列指标中提供了强大可靠的性能,而可视化数据挖掘与机器学习(Visual Data Mining and Machine Learning,VDMML)在数据准备和扩充方面得分很高。很高的客户满意度和强大的市场占有率巩固了 SAS 作为领导者的地位。但 Gartner 也指出了 SAS 存在的一些缺点,特别是在定价和产品一致性方面,SAS EM 的用户体验并没有达到公众的预期,而且 SAS 的开源方式对 Gartner 来说是个问号。 挑战者象限 挑战者象限相当空荡,在这一象限中只有两家供应商: Alteryx 和 Dataiku。 Alteryx 通过保持其 “执行能力”(Y 轴),但却失去了一些 “视觉完整性”(X 轴),从而跌出了领导者象限。Gartner 在端到端管道中提及了加州 Irvin 公司的民间数据科学能力,分析师小组表示,尽管 Alteryx 有这种能力,但市场认为 Alteryx 只是一种数据准备工具,这一观点掩盖了它真正的价值。 Dataiku 的数据科学工作室(Data Science Studio,DSS)因其促进不同利益相关者(从数据工程师到科学家)之间合作的方式而获得好评。Gartner 还喜欢它为机器学习工作流程带来的自动化,以及模型投产后的管理和监控。报告称,Dataiku 存在的一些问题包括可扩展性、定价以及对流式分析和物联网用例的支持。 有远见者象限 (编辑:甘孜站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |