Von Ralf Keuper

Bei der Verwendung von Originaldatensätzen besteht stets die Sorge, dass die Daten in falsche Hände geraten könnten – besonders bei personenbezogenen Daten. Aber auch Maschinendaten können mehr Geschäftsgeheimnisse preisgeben, als es den Unternehmen lieb ist. Wie wäre es stattdessen mit der Nutzung synthetischer, als um künstliche Repräsentationen eines Originaldatensatzes?

Für die Gewinnung synthetischer Daten wird ein Modell entwickelt, das die Originaldaten so gut wie möglich erklärt. “Aus diesem Modell werden neue Daten generiert, die wichtige statistische Eigenschaften des Originaldatensatzes erhalten. Der synthetische Datensatz besteht nicht aus Daten natürlicher Personen, sondern aus Daten synthetischer Einheiten. Je nach Anwendung kann die Daten-Synthetisierung mit mathematischen Garantien der Privatheit kombiniert werden[1]Synthetische Daten: Innovationspotential und gesellschaftliche Herausforderungen.

Einige Experten behaupten sogar, dass synthetische Daten für das Training von KI-Modellen besser sind als reale Menschen, Orte und Dinge. Einschränkungen bei der Verwendung sensibler und regulierter Daten entfallen oder werden reduziert; Datensätze können auf bestimmte Bedingungen zugeschnitten werden, die sonst vielleich…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert