Die steigende Zahl von Finanzbetrügereien hat der Weltwirtschaft im letzten Jahr einen Schaden von mehr als 800 Milliarden US-Dollar zugefügt. Obwohl Finanzinstitute über fortschrittliche KI-Systeme zur Betrugserkennung verfügen, stellt die Zeit, die erforderlich ist, um eine ausreichende Menge an Betrugsdaten für das Training von Modellen zu sammeln, eine kostspielige Schwachstelle dar. In Verbindung mit der Unmöglichkeit, Trainingsdaten zur Betrugserkennung aufgrund von Daten- und Datenschutzbestimmungen zwischen den Instituten auszutauschen, stellt dies eine große Herausforderung dar. Um dieses Problem zu lösen, schlagen wir das Konzept einer Ökosystem-Plattform für die gemeinsame Nutzung synthetischer Daten (FinDEx) vor. Diese Plattform gewährleistet die Anonymität der Daten, indem sie synthetische Trainingsdaten auf der Grundlage der Betrugserkennungsdatensätze der einzelnen Institute erzeugt. Verschiedene Techniken zur Erzeugung synthetischer Daten werden eingesetzt, um schnell einen gemeinsamen Datensatz für alle Mitglieder des Ökosystems zu erstellen. Mit Hilfe der Design Science-Forschung werden in diesem Beitrag Erkenntnisse aus der Literatur zur Erkennung von Finanzbetrug, der Praxis der gemeinsamen Nutzung von Daten und der Theorie modularer Systeme genutzt, um Designwissen für die Architektur der Plattform abzuleiten. Darüber hinaus wurde die Durchführbarkeit der Verwendung verschiedener Algorithmen zur Datengenerierung wie generative adversarial networks, variational auto encoder und Gaussian mixture model bewertet und verschiedene Methoden zur Integration synthetischer Daten in das Trainingsverfahren getestet. Auf diese Weise wird ein Beitrag zur Theorie an der Schnittstelle zwischen Betrugserkennung und Datenaustausch geleistet und Praktikern ein Leitfaden für die Entwicklung solcher Systeme an die Hand gegeben.
Quelle: FinDEx: A Synthetic Data Sharing Platform for Financial Fraud Detection