Gerüchteküche 2.0: Der Lügendetektor für Social Media

Die Vertrauenswürdigkeit von viral verbreiteter Information in Social Media zu beurteilen, ist Ziel eines neuen EU-Forschungsprojekts der MODUL University Vienna. Denn soziale Netzwerke sind voll mit Lug und Trug, Halbwahrheiten und Fakten. Doch egal ob Fakt oder Fake – die rasche Verbreitung von solchen Themen kann blitzschnell enorme Konsequenzen nach sich ziehen. Schnelles Analysieren von Inhalten ist da gefragt – aber derzeit nicht systematisch möglich. Genau diese Problematik adressiert das EU-Projekt Pheme der MODUL University Vienna. In dem seit Anfang des Jahres laufenden Projekt mit Partnern aus sieben Nationen werden linguistische und grafische Methoden mit Technologien zur Big Data Analyse kombiniert.

Zur Aktualität des Projekts, das auf umfassenden Kompetenzen zur Analyse digitaler Informationen an der MODUL University Vienna aufbaut, meint der Leiter des Instituts für Neue Medientechnologie, Prof. Arno Scharl: „Traditionelle Medien – ob digital oder analog – verlieren derzeit ihre Informationshoheit. Social Media-Nutzer übernehmen diese immer mehr und verbreiten Informationen in ungeahnter Geschwindigkeit. Da wird aus einer Mücke rasch auch mal ein Elefant - oder aus einem Nieser die Angst vor einer globalen Pandemie.“ Solche Themen, die sich viral in Netzwerken verbreiten, stellen Regierungen und Unternehmen zunehmend vor große Herausforderungen. Um diesen zu begegnen, darf im Einzelfall wenig Zeit verloren werden – Zeit, die das Projekt Pheme zukünftig schaffen wird.

Die Herausforderungen für das Team um Prof. Scharl sind dabei vielfältig – doch dank spezifischer Expertise und umfassender Vorarbeiten im Rahmen der webLyzard Web Intelligence Plattform ist die MODUL University Vienna für deren Lösung prädestiniert. Dazu Prof. Scharl: „Für die Computer-basierte Analyse von Informationen in sozialen Medien stellen deren enormes Volumen, Vielfalt und rasche Verbreitungsgeschwindigkeit – die drei „Vs“ – enorme Hürden dar. Doch haben wir diese Aspekte zumindest konzeptionell im Griff. Im neuen Projekt nehmen wir das vierte „V“ in Angriff: die Vertrauenswürdigkeit der Information.“

Dabei konzentriert sich das Team auf die Identifikation von vier Arten von fragwürdigen Wahrheiten oder so genannten „Gerüchten“: die Spekulation, die Kontroverse, die Missinformation und die Desinformation. Doch zu beurteilen, ob eine Information in eine dieser Kategorien fällt, ist gerade in Social Media ausgesprochen schwer. Denn hier hängt die Qualität der Information sehr stark von deren sozialem Kontext ab. Diesen Kontext automatisiert zu erfassen und zu interpretieren, ist bisher noch nicht gelungen. Das internationale Team um Prof. Scharl setzt dafür nun auf einen interdisziplinären Ansatz.

 So arbeiten Wissenschafter in Sprachtechnologien, Web Science und der Analyse sozialer Netzwerke zusammen mit Experten für Informations-Visualisierung. Gemeinsam nutzen sie drei Aspekte zur Analyse der Vertrauenswürdigkeit: zunächst die einem Dokument eigene Information – also lexikalische, semantische und syntaktische Information. Diese wird vernetzt mit Datenquellen, die als besonders vertrauenswürdig gelten. Für medizinische Informationen also zum Beispiel PubMed, die weltgrößte Online-Datenbank für medizinische Originalpublikationen. Schließlich wird die Art der Verbreitung einer Information analysiert – wer erhält welche Information, und wie und wann wird diese an wen weitergesendet?

Die Ergebnisse des über drei Jahre laufenden Projekts werden in zwei konkreten Fallstudien getestet. So wird im Bereich medizinischer Informationssysteme unter anderem „Rumour Intelligence“ getestet – also die Fähigkeit, Gerüchte wie den Ausbruch einer hoch ansteckenden Erkrankung (z.B. Schweinegrippe) und deren Verbreitung frühzeitig zu identifizieren. Für den digitalen Journalismus wiederum werden zusammen mit BBC und dem Südwestrundfunk Ergebnisse getestet, die es erlauben, die Glaubwürdigkeit User-generierten Contents zu verifizieren. Eine Tätigkeit, die bisher weitestgehend „händisch“ und unter hohem Ressourcenaufwand erfolgt.

Mehr Info