admin 4 Minuten

Dark Data: Versteckte Risiken im System erkennen | SMA

KI bringt das Potenzial von Dark Data zum Leuchten
allgemein
Dark Data: Versteckte Risiken im System erkennen | SMA

Bereits in der Bezeichnung Dark Data schwingt eine gewisse Bedrohlichkeit mit. Doch wie gefährlich sind diese „dunklen Daten“ wirklich? Ich möchte etwas Licht ins Dunkel bringen. Daher zunächst die Frage:

Was ist Dark Data überhaupt?

Dark Data ist ein Teilgebiet von Big Data. Zusammengefasst steht der Begriff für die Menge an Daten, die in einem Unternehmen zwar gespeichert werden, jedoch meist ungeschützt, ungenutzt und unstrukturiert auf Servern liegen. Einer Studie zufolge schätzt ein Drittel der befragten Führungskräfte die Menge von Dark Data auf 75% ihrer Gesamtdaten.

Neben Dark Data lassen sich zwei weitere Gruppen von Unternehmensdaten unterscheiden:

Die geschäftskritischen Daten bilden für den Geschäftserfolg die relevanteste Gruppe. Sie werden in Echtzeit gesammelt sowie analysiert und liefern einen unternehmerischen Mehrwert. Die geschäftskritischen Daten stellen nicht den Großteil des Datenvolumens dar. Viel mehr bilden sie einen vergleichsweise geringen Anteil an der Gesamtdatenmenge.

Die dritte Datengruppe sind die ROT-Daten. ROT steht für „Redundant, Obsolet, Trivial“. Diese Daten haben keinen Geschäftswert. Unternehmen sollten sie daher in regelmäßigen Abständen löschen. Beispiele für ROT-Daten sind Spam oder Werbung.

In dieser Kategorisierung haben Dark Data einen besonderen Stellenwert. Da die entsprechenden Daten (noch) ungenutzt bleiben, ist unklar, wie viel Potenzial wirklich in ihnen steckt. So könnten sich darunter sowohl ROT- als auch geschäftskritische Daten befinden.

Infografik

Dark Data – Gefahr oder doch Wettbewerbsvorteil?

Wie bereits angemerkt, könnte sich im Dunkeln ein wahrer Datenschatz verstecken. Daher kann es für Unternehmen von großem (Wettbewerbs-) Vorteil sein, auf ihre Dark Data aufmerksam zu werden und sich diese zu Nutze zu machen. Beispielsweise zeigen sich durch eine Analyse der schlafenden Daten Verbindungen zwischen verschiedenen Datensätzen. Unternehmen können so die Basis für genauere Prognosen legen und wertvolle Geschäftseinblicke gewinnen, die ihnen sonst verborgen geblieben wären. Und das alles mit bereits vorhandenen Daten, die nur auf ihre Verwendung warten.

Doch natürlich bergen diese meist ungeschützten Datenmengen auch ein Sicherheitsrisiko. Unternehmensinterne Daten, darunter vor allem Personendaten, könnten durch mögliche Sicherheitslücken ganz leicht Hackerangriffen zum Opfer fallen. Unternehmen sollten sich daher ihrer Verantwortung bezüglich dieser Daten bewusst werden und sie besser vor potenziellen Gefahren schützen. Eine Analyse der Dark Data würde dies vereinfachen. Die im Dunkeln verborgenen geschäftskritischen und personenbezogenen Daten würden als solche erkannt und könnten sicher verwahrt werden. Die übrigen ROT-Daten könnten, soweit es für sie keine weitere Verwendung gibt, von den Servern gelöscht werden.

Licht ins Dunkel bringen – Aber wie?

Um das versteckte Potenzial in den Dark Data nutzen zu können, müssen diese zunächst gefunden werden. Eine Möglichkeit dafür ist, eine umfassende Bestandsaufnahme aller unternehmerischen Daten zu machen, also ein Datenassessment. Außerdem bietet es sich an, mit den richtigen Tools und Methoden des Data bzw. Information Retrievals gezielt nach konkreten Informationen zu suchen.

Die weitere Analyse dieser unstrukturierten Daten stellt heute kein größeres Hindernis mehr dar, wenn Dark Analytics individuell auf das Unternehmen zugeschnitten wird. Verbesserte Tools können Datensätze miteinander verknüpfen und Unternehmensprozesse automatisieren und beschleunigen. Hier finden auch Lösungen wie Enterprise Search und die Entwicklung von flexiblen Information Governance-Strategien Anwendung.

Postskriptum: Was sind Ihre Erfahrungen mit Dark Data? Wie geht Ihr Unternehmen damit um? Berichten Sie uns doch von Ihren Erfahrungen aninfo@epic-insights.comWir freuen uns darauf!

Aus dem Blog

Weitere Insights & Aktuelles.

AI Evals: Fünf Dimensionen für produktive KI-Systeme
admin7 Minuten

AI Evals: Fünf Dimensionen für produktive KI-Systeme

Im laufenden Betrieb Ihres KI-Systems fallen Ihnen drei Dinge auf. Der Token-Verbrauch steigt von einem Sprint zum nächsten um 40 %, ohne dass eine Konfigurationsänderung das erklären würde. Nach einem Prompt-Update verändert sich die Antwortqualität spürbar; das Team empfindet sie als schlechter, kann aber nicht benennen, warum. Und Ihr RAG-System liefert Aussagen, die in keinem […]

Mehr lesen
LLM-Halluzinationen: Warum korrekte Daten das Problem nicht lösen
admin6 Minuten

LLM-Halluzinationen: Warum korrekte Daten das Problem nicht lösen

Ein KI-System hat die AGB Ihres Unternehmens vollständig geladen. Es kennt jeden Paragraphen. Und trotzdem verspricht es einem Kunden eine Leistung, die rechtlich nicht gedeckt ist. Das passiert täglich in Systemen, die längst als produktionsreif gelten. Der Grund liegt nicht im fehlenden Datenzugriff. Er liegt darin, wie das Modell mit den Daten umgeht. Was ist […]

Mehr lesen
Fehlerfreie KI-Anwendungen entwickeln: Die Vorteile von AI-Evaluations
admin6 Minuten

Fehlerfreie KI-Anwendungen entwickeln: Die Vorteile von AI-Evaluations

Die Herausforderungen in KI-Projekten verschieben sich drastisch: Wir sprechen nicht mehr von Systemabstürzen, sondern vom sogenannten „Silent Failure“. Anwendungen liefern technisch einwandfreie Datenpakete aus, während der inhaltliche Kern zu halluzinieren beginnt, Compliance-Richtlinien verletzt werden oder die Markenreputation durch einen falschen Tonfall gefährdet wird. Technisch gesehen ist das System ein Erfolg. Der Live-Betrieb liefert jedoch andere […]

Mehr lesen
„Black-Box RAG?“ – Warum RAG-Systeme still versagen und wie man es früh erkennt
admin12 Minuten

„Black-Box RAG?“ – Warum RAG-Systeme still versagen und wie man es früh erkennt

In fast jedem Discovery-Gespräch kommt derselbe Moment: Das RAG-System läuft seit Wochen in Produktion, die Entwickler sind zufrieden, das Management hat abgenickt. Dann fragt jemand das System nach einem internen Prozess und bekommt eine Antwort, die sachlich klingt, aber veraltet ist. Niemand hat es gemeldet. Niemand hat es gemessen. Das ist kein Einzelfall. Qualitätsverluste in […]

Mehr lesen
Nichts mehr verpassen?

Praxiswissen statt KI-Hype.

Erhalten Sie regelmäßig fundierte Einblicke, wie Sie KI-Projekte im Mittelstand messbar, rentabel und auditsicher umsetzen.

Mit der Anmeldung stimmen Sie unserer Datenschutzerklärung zu. Jederzeit widerrufbar.