Empirische Untersuchung beweist: Datenqualität ist kritischer Erfolgsfaktor für Predictive Analytics

Die Annahme, dass Prognosen nur so gut sein können wie die Daten, auf denen sie basieren, klingt plausibel. Im Rahmen einer Bachelor-Arbeit an der Hochschule der Medien (HdM) Stuttgart wurde dieser Zusammenhang nun erstmals empirisch untersucht und anhand einer konkreten Testreihe bestätigt. Die Vergabe der Bachelor-Arbeit erfolgte im Rahmen der im Frühjahr vereinbarten Zusammenarbeit der HdM mit der Firma Uniserv aus Pforzheim, einem spezialisierten Anbieter von Lösungen für das Kundendatenmanagement.

Der Autor der Arbeit, Paul Titze, Student am Fachbereich Information und Kommunikation des Studiengangs Wirtschaftsinformatik und digitale Medien an der HdM, überprüfte mit Hilfe verschiedener Testszenarien, in denen Datenanalysen mit Hilfe von Stammdaten verschiedener Qualität durchgeführt wurden, den Zusammenhang zwischen qualitativ hochwertigen Stammdaten und den Ergebnissen der Analyse via Supervised Machine Learning. Ergebnis: Vor allem beim Supervised Learning, bei dem die Stammdaten die Grundlage für das Lernen des Algorithmus bilden, konnten mit einer durch Stammdatenmanagement qualitativ hochwertig aufbereiteten Datengrundlage deutlich bessere Vorhersagen erzielt werden als beim Machine Learning mit einem unbehandelten Datenset.

„Mit seiner Arbeit hat Herr Titze erstmals auch empirisch nachgewiesen, dass Datenqualität und Predictive Analytics-Prognosequalität in direktem Zusammenhang stehen“, erklärt Holger Stelz, Director Marketing & Business Development bei Uniserv und Zweitprüfer der Bachelorarbeit. „Unternehmen, die heute Predictive Analytics als Grundlage für strategische Geschäftsentscheidungen nutzen, sollten also alles daransetzen, bei den der Analyse zu Grunde liegenden Daten eine möglichst hohe Datenqualität zu erreichen.“

Mehr Info