Von Ralf Keuper
Um das Beste aus ihrem Datenbestand herauszuholen, benötigen Unternehmen reichhaltige, kontextbezogene Daten von bester Qualität. Allerdings beziehen Datenexperten heutzutage ihre Daten in der Regel aus anderen Systemen oder führen Datensilos zu einer gemeinsamen Struktur zusammen – der Beginn eines komplexen Datenaufbereitungsprozesses.
In diesem Prozess müssen die Teams die Daten bereinigen, organisieren und in ein standardisiertes Format umwandeln, um sie verwenden zu können. Außerdem entstehen dadurch Probleme bei der Einhaltung von Vorschriften, da es sehr schwierig ist, die Datenherkunft nachzuvollziehen.
Die meisten Unternehmen, die an Projekten für künstliche Intelligenz (KI) und fortgeschrittenen Analysen arbeiten, verwenden für gewöhnlich Daten aus bestehenden Systemen wie Google Analytics und CRMs. Diese Quellen bieten eine Fülle von Informationen, mit denen man arbeiten kann, aber sie sind auch disparater Natur, was bedeutet, dass die Daten, die sie liefern, unterschiedliche Strukturen, unterschiedliche Ebenen der Granularität, Qualität und Vollständigkeit aufweisen[1]Snowplow secures fresh cash to capture and create behavioral data.
Das in London ansässige Unternehmen Snowplow Analytics hat eine Plattform zur Generierung strukturierter Verhaltensdaten (die das Verhalten von Kunden, ihre Handlungen und Entscheidungen sowie den Kontext dieser Handlungen und Entscheidungen beschreiben) entwickelt, die an spezifische KI- und BI-Anwendungen angepasst sind. Snowplow erstellt KI- und Machine-Learning-Daten “an der Quelle”, d. h. im bevorzugten Datenspeicher des Kunden (z. B. einer Amazon Web Services- oder Google Cloud Platform-Instanz). Die Idee ist, die Erstellung und Verwaltung einer “Datensprache” im gesamten Unternehmen zu automatisieren, mit einem gemeinsamen Schema, das für Business Intelligence und KI modelliert, für Echtzeit-Apps gestreamt und mit Daten und Systemen von Dritten angereichert werden kann. Mit anderen Worten: Snowplow will Unternehmen in die Lage versetzen, eine durchgängige Datensprache zu erstellen, zu nutzen und zu pflegen, mit einem gemeinsamen Datenschema, das für BI und KI modelliert ist[2]Snowplow offers a platform to help enterprises ‘create’ data for AI and analytics.
Die Erstellung neuer Verhaltensdaten im Gegensatz zur Wiederverwendung vorhandener Daten kann zu qualitativ hochwertigeren Datensätzen für KI und Analysen führen, so der CEO von Snowplow, Alex Dean. Ein Kunde nutze Snowplow beispielsweise, um Ereignisdaten aus verschiedenen Quellen über seine Plattform hinweg zu verfolgen und sie in einem einzigen, konsolidierten Format bereitzustellen. “Es gibt kein Unternehmen, das genau das tut, was wir tun”, so Dean. “Andere Unternehmen erstellen Verhaltensdaten, aber in der Regel, um ihre eigenen Anwendungen zu betreiben – Beispiele sind digitale Analyselösungen (z. B. Google Analytics) und Kundendatenplattformen (z. B. Segment, mParticle). Im Gegensatz zu diesen Lösungen verarbeitet Snowplow … jedoch Daten in den Clouds der Kunden. Bei der Generierung von Verhaltensdaten geht es darum, die Ereignisse miteinander zu verbinden, die ein Kunde, eine Maschine oder eine Anwendung im Laufe der Zeit erlebt. Dies ermöglicht eine hochpräzise und sichere Analyse des Verhaltens, einschließlich der Einhaltung der europäischen Datenschutzbestimmungen für Dritte”, Dean weiter.
References