Fachbeiträge

Ausgabe 7 / 2015
FachbeitragBest Practice

Praxisfall: Big Data in der pharmazeutischen Industrie

von Frank Zscheile

Informationen und Expertennetzwerke mit ähnlicher Expertise zusammenzustellen und in Millionen unterschiedlicher Dokumente die richtigen Themen zu finden – dies wird in der Pharmabranche mit ihrem enormen Wettbewerbsdruck zum entscheidenden Vorteil. Der Pharmakonzern AstraZeneca nutzt dafür seit Anfang 2014 eine Big Data Such- und Analyse-Software. Wissenschaftler weltweit, darunter auch aus der F&E-Abteilung von AstraZeneca Deutschland, finden über die Plattform relevante Informationen über Medikamente, Krankheiten, Gene, Moleküle, Wirkmechanismen und andere wissenschaftliche Konzepte. Redundante, aufwändige Forschung lässt sich damit vermeiden, komplizierte Probleme lassen sich aus verschiedenen Blickwinkeln beleuchten und Forschung, Tests und Produkteinführungszeiten werden reduziert.

Inhaltsübersicht:

In einem forschungsintensiven biopharmazeutischen Unternehmen wie AstraZeneca erstellen interne wie externe Spezialisten tagtäglich eine immense Anzahl hochtechnischer Dokumente: Forschungsunterlagen, Einträge in medizinische Datenbanken, Versuchsberichte, Patenteinreichungen u.v.m. Hinzu kommt die gesammelte Kommunikation zwischen Forschern aus verschiedenen Fachgebieten, bestehend aus internen Notizen, E-Mails usw. Die Informationen in diesen Dokumenten können sehr unterschiedlicher Natur sein und Themen aus Medizin, Pharmazie, Biologie, Chemie, Biochemie, Genetik u.a. behandeln. Diese setzen sich wiederum mit Krankheiten, Genen, Wirkstoffen und Wirkungsweisen auseinander. Meist liegen die Informationen in Textform vor, ebenso aber auch als strukturierte Daten wie Molekularstrukturen, Formeln, Kurven und Diagramme.

Ein immenser Informationsschatz

Alle intern und extern zur Verfügung stehenden Quellen eingeschlossen, kommen gut und gerne Datenmengen von 500 Millionen Dokumenten zusammen, mit denen sich ein Pharma-Unternehmen auseinandersetzen muss, Tendenz steigend. Dem gegenüber stehen die Experten, die in den verschiedenen Geschäftsfeldern eines biopharmazeutischen Unternehmens tätig sind: Auch hier kann in einem weltweit tätigen Unternehmen die Anzahl schnell bei 10.000 und mehr Personen alleine in Forschung und Entwicklung liegen.

Im Rahmen der Forschungs- und Entwicklungsarbeit kommt es bei AstraZeneca täglich vor, dass jemand einen Experten bzw. Informationen im Konzern zu einem dezidierten Thema sucht. Wer kennt sich z.B. mit „Arteriosklerose“ besonders gut aus, wer weiß über Wirkstoffe und aktive Moleküle in den Medikamenten Bescheid, welche Dokumente zu Nebenwirkungen und Patenten gibt es?

Soziale Unternehmensnetzwerke oft zu wenig gepflegt

Eine Person zu finden, die all diese Anforderungen abdeckt, dürfte in den meisten Fällen unmöglich sein. Es muss also ein Team zusammengestellt werden. Wo aber mit der Suche beginnen? Meist versuchen es die Firmen zunächst mit sozialen Unternehmensnetzwerken (Enterprise Social Networks). In der unternehmerischen Praxis jedoch schlägt dieser im Grunde logische Lösungsansatz oft fehl. Denn die Pflege der eigenen Kompetenz-Matrix in einem sozialen Netzwerk ist meist zu kompliziert und zeitaufwändig. Anfangs noch korrekte Informationen sind schnell veraltet.

AstraZeneca experimentierte deshalb zunächst mit einfachen Suchmaschinen, um Experten anhand der Spuren zu lokalisieren, die sie in Dokumenten hinterlassen: Was hat ein Mitarbeiter veröffentlicht? Welche Patente hat er entwickelt? Zu welchen Themen hat er korrespondiert? Den eingesetzten Suchlösungen war es jedoch nicht möglich, die schiere Vielfalt an Daten aus den verschiedensten Quellen zu verarbeiten; ihre Fähigkeiten zur Content-Analyse waren nicht ausreichend oder schlichtweg zu langsam für die vorhandenen Datenmengen.

Die Lösung: Inhaltsanalyse mit computerlinguistischen Methoden

Die Lösung war Ende 2013 die Einführung der Big Data Search & Analytics-Plattform von Sinequa. Über herkömmliche Enterprise-Search-Produkte geht diese durch ihre Funktionalitäten zur Inhaltsanalyse in Big-Data-Szenarien hinaus. Die Inhaltsanalyse basiert auf computerlinguistischen Methoden (Natural Language Processing in 20 Sprachen) einer patentierten semantischen sowie linguistischen Analyse, und ist einsetzbar für beliebige unstrukturierte und strukturierte Daten. So erhält der Anwender auch Fundstellen, in denen der eigentliche Suchbegriff gar nicht vorkommt, hingegen Synonyme oder inhaltlich ähnliche Begriffe.

Über die Plattform haben Mitarbeiter in der Forschung und Entwicklung bei AstraZeneca einen einheitlichen Informationszugang (Unified Information Access) auf das gesamte Unternehmenswissen – allerdings unter Beachtung der Zugriffsrechte. Über ein Enterprise Information Portal lässt sich die Informationssuche dank der Skalierbarkeit der Software auf alle Beschäftigten ausdehnen. So liefert die Plattform nicht nur der F&E-Abteilung, sondern allen Bereichen relevante Informationen.

In einem initialen Prozess analysierte der Pharmakonzern mit der Software zunächst rund 200 Millionen interne und externe Dokumente aus dem Bereich F&E. Dabei wurden auch fachspezifische Relationen zwischen Begriffen (synonyme und semantisch verwandte Begriffe) ermittelt. Der Index ergab dann ein Datenreservoir, aus dem relevante Informationen in weniger als zwei Sekunden zusammengestellt werden können. Bei Eingabe eines Begriffes in die Suchmaske erstellt das System aus all dem, was zu diesem Thema geschrieben wurde, die besten Experten zusammen.

ROI- und TCO-Betrachtungen

Hunderte Millionen von Dokumenten und ebenso große Mengen strukturierte Daten zu durchpflügen, Daten und Abfragen in natürlicher Sprache zu analysieren und die Ergebnisse in berechneten Kategorien in Echtzeit zu klassifizieren, scheint zunächst wie ein gigantischer Aufwand. In der Realität aber war der Aufwand für die Analyse und damit insgesamt die Total Cost of Ownership (TCO) für AstraZeneca signifikant niedriger als mit vergleichbaren Werkzeugen früherer Generationen.

Return on Investment-Betrachtungen spielen angesichts des in der Pharmaindustrie herrschenden Wettbewerbsdrucks ebenfalls eine große Rolle bei der Entscheidung, ein solches System einzuführen. Detaillierte ROI-Berechnungen gibt das Unternehmen nicht bekannt; dass sich der Einsatz der Analysesoftware indes lohnt, lässt sich an konkreten Beispielen aufzeigen. So legt die Software miteinander verwandte oder überlappende Forschungsergebnisse und Studien offen. Dies schafft Synergien und beschleunigt Forschungsprogramme. Die daraus gewonnenen Einsparungen an Aufwand und Zeit können enorm sein.

Durch die „Find the Expert“-Funktion kann AstraZeneca leicht Forschungsgruppen zu allen gewünschten Themen zusammenstellen – ein klassisches ROI-Potenzial in allen Branchen. Der hohe Wettbewerbsdruck in der Pharmabranche zwingt die Hersteller, Innovationen möglichst schnell zur Produktreife zu bringen. Einen Wettbewerbsvorteil haben dabei solche Unternehmen, die in kürzester Zeit interdisziplinäre Expertenteams konstituieren können, welche standortübergreifend an einem gemeinsamen Thema arbeiten. AstraZeneca hat mit seiner Big-Data-Lösung dafür die richtigen Weichen gestellt.

Diese Artikel könnten Sie auch interessieren

Online Fachbeiträge Ausgabe 5 / 2019
Fachbeitrag       Big Data

Self-Service Business-Intelligence: Die Zeit ist reif für datengetriebenes Marketing

Artikel lesen


wissensmanagement Heft 2 / 2019
Trends       Big Data

Knowledge Graph in der Medizinischen Forschung: Das komplexe System „Mensch“ verstehen

von Dirk Möller

Artikel lesen


Online Fachbeiträge Ausgabe 1 / 2019
Fachbeitrag       Big Data

Mit prognostischer Analytik die Zukunft gestalten

Artikel lesen


wissensmanagement Heft 5 / 2018
Titelthema       Big Data

Künstliche Intelligenz braucht gute Daten

von Matthias Bauer

Artikel lesen


wissensmanagement Heft 5 / 2018
Titelthema       Human Resources

Die Vermessung der Personalarbeit: Was mit Zahlen und Daten heute möglich ist

von Steffen Michel

Artikel lesen