Snowflake vs. Databricks

Von Ralf Keuper

Snowflake und Databricks stehen für einen Paradigmenwechsel in der Analyse großer Datenmengen. Mit ihren cloudbasierten Data-Lake-Systemen besteht für die Unternehmen keine Notwendigkeit, Hardware zu kaufen und zu verwalten. Während Snowflake nur in der Cloud verfügbar ist, bietet Databricks einen hybriden, Open-Source-basierten Data Lake 2.0-Ansatz für den Einsatz vor Ort und in der Cloud. Beide Anbieter wollen der One-Stop-Shop für die Verwaltung aller Daten für jeden Anwendungsfall werden[1]Snowflake vs Databricks: Where Should You Put Your Data?.

Vor einigen Monaten stellte Databricks seine ML-Plattform vor, die es Data Engineers, Data Scientists und Product Ownern ermöglicht, gemeinsam an ML-Projekten zu arbeiten[2]Machine Learning: Databricks setzt eine ML-Plattform auf den Data Lake. In etwa zur selben Zeit lancierte Databricks das offene Protokoll Delta Sharing für den unternehmensübergreifenden Datenaustausch[3]Delta Sharing: Offenes Protokoll für den unternehmensübergreifenden Datenaustausch. Delta Sharing soll einen offenen Protokollstandard setzen, der u.a. den Austausch von Echtzeitdaten ermöglicht – und das  unabhängig von den zugrunde liegenden Speicher- und Rechnerplattformen. Vor wenigen Wochen konnte Databricks ein Finanzierungsrunde über 1,6 Mrd. Dollar abschließen[4]Databricks expands its data lake analytics with $1.6B funding. Gestern wurde bekannt, dass Databricks den Frankfurter Anbieter von low- und no-code Datenanalyse-Werkzeugen 8080 Labs übernommen hat[5]Databricks acquires 8080 Labs to bolster its low-code offerings.

Die Marktaussichten für Snowflake werden überwiegend positiv eingeschätzt[6]Wie Snowflake den Datensturm zu Geld macht. Der Leistungsumfang beim unternehmensübergreifenden Datenaustausch mit der Snowflake Data Cloud ist beachtlich[7]Unternehmensübergreifender Datenaustausch mit Snowflake, was auch an dem großen Ökosystem liegt, das Snowflake über die Jahre aufgebaut hat.

Die jüngste Kooperation wurde vor wenigen Tagen mit Fortanix geschlossen. Mit seiner Data Security Manager SaaS (DSM SaaS) – Lösung bietet Fortanix den Kunden die Möglichkeit, ihre vertraulichsten Datenelemente, wie z. B. US-Sozialversicherungsnummern, zu tokenisieren, um diese Daten vor der Verarbeitung durch Snowflake zu schützen. Snowflake-Kunden können die Tokenisierung als einen von Fortanix betriebenen Service erwerben, wodurch der Aufwand für die Bereitstellung und Verwaltung einer separaten Sicherheitslösung entfällt[8]Fortanix Collaborates with Snowflake to Offer Joint Customers the Ability to Tokenize Data Inside and Outside Snowflake.

Obwohl beide Unternehmen kooperieren, gehen Marktbeobachter davon aus, dass Snowflake und Databricks auf Dauer zu Rivalen werden. Während Databricks auf Data Engineers und Data Scientists abzielt, sind bei Snowflake Datenanalysten die Zielgruppe. Snowflake setzt auf Integrationen mit KI-Plattformen von Google, Microsoft und AWS. Snowflake konnte bislang von dem Ansturm der Unternehmen profitieren, die mehr Mitarbeitern den Zugriff auf Daten und die Durchführung fortgeschrittener statistischer Analysen ermöglichen wollten. Der Aufbau von KI-Modellen ist jedoch viel schwieriger, da es darum geht, Algorithmen zu trainieren, um aus diesen riesigen Datensätzen Vorhersagen für die Zukunft zu treffen oder unbekannte Korrelationen zu entdecken – hier ist derzeit Databricks im Vorteil[9]Databricks is playing the long game in its battle against Snowflake.

Databricks und Snowflake sind die Blaupausen für den sicheren, unternehmensübergreifenden Datenaustausch und darauf basierende Datenauswertungen in Wertschöpfungsnetzwerken.

Beitrag teilen
Dieser Beitrag wurde unter Datenaustausch, Datengetriebene Geschäftsmodelle, Künstliche Intelligenz, Protokolle abgelegt und mit , , , , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.