SAP近日宣布收购数据集成与分析厂商Dremio,希望借此进一步扩展其数据分析和AI能力,将SAP系统之外的数据也纳入统一平台。不过,这一动作也让外界开始重新审视SAP与Databricks之间原本紧密的合作关系。
Dremio是一家基于Apache Iceberg的数据湖分析公司。Iceberg最早由Netflix推动开发,如今已经成为开放数据湖领域的重要标准之一。SAP表示,未来其Business Data Cloud将成为“原生支持Apache Iceberg”的企业级Lakehouse平台,实现SAP与非SAP数据的统一管理,为企业级AI Agent提供数据底座。
简单来说,SAP想解决的问题是:企业数据太分散。
过去,大量企业数据既存在SAP ERP系统里,也散落在Salesforce、AWS、Snowflake等外部平台。不同系统之间的数据迁移不仅昂贵,还容易造成重复和延迟。而Iceberg、Delta Lake这类开放表格式的核心理念,就是“让分析靠近数据,而不是把数据搬来搬去”。
这也是为什么SAP会越来越重视Iceberg。
事实上,SAP此前已经与Databricks深度合作。三年前,SAP前CTO Juergen Mueller就曾提出,要帮助客户更容易整合SAP与第三方平台数据。去年双方还进一步推进了Business Data Cloud与Databricks之间的双向数据共享,当时主要基于Databricks主导的Delta Lake格式。
但现在,SAP却选择直接收购一家Iceberg核心厂商。
业内普遍认为,这说明SAP不想过度依赖Databricks,而是希望掌握更多底层数据架构主动权。尤其是在AI Agent越来越依赖跨系统数据的背景下,谁掌握开放数据格式,谁就更有机会成为企业AI平台的中心。
值得注意的是,Databricks近年也开始向Iceberg靠拢。它收购了由Iceberg原作者创办的Tabular,并推动Delta Lake与Iceberg之间的互操作性。这意味着,原本彼此竞争的两大数据湖阵营,正在逐渐融合。
SAP在声明中反复强调“开放”——包括Apache Iceberg、Apache Polaris以及Iceberg REST Catalog API。它希望建立一个统一的数据目录与语义层,让企业能够在SAP之外,也能统一查看数据含义、权限关系以及数据血缘。
Dremio在2022年融资时估值约20亿美元,SAP并未披露此次收购金额。但从战略意义看,这更像是一场AI时代的数据基础设施争夺战。
因为未来AI Agent真正的价值,不在模型本身,而在它能否接触到完整、实时、可信的企业数据。









苏公网安备32021302001419号