2015/7 | Fachbeitrag | Best Practice

Praxisfall: Big Data in der pharmazeutischen Industrie

von Frank Zscheile

Inhaltsübersicht:

In einem forschungsintensiven biopharmazeutischen Unternehmen wie AstraZeneca erstellen interne wie externe Spezialisten tagtäglich eine immense Anzahl hochtechnischer Dokumente: Forschungsunterlagen, Einträge in medizinische Datenbanken, Versuchsberichte, Patenteinreichungen u.v.m. Hinzu kommt die gesammelte Kommunikation zwischen Forschern aus verschiedenen Fachgebieten, bestehend aus internen Notizen, E-Mails usw. Die Informationen in diesen Dokumenten können sehr unterschiedlicher Natur sein und Themen aus Medizin, Pharmazie, Biologie, Chemie, Biochemie, Genetik u.a. behandeln. Diese setzen sich wiederum mit Krankheiten, Genen, Wirkstoffen und Wirkungsweisen auseinander. Meist liegen die Informationen in Textform vor, ebenso aber auch als strukturierte Daten wie Molekularstrukturen, Formeln, Kurven und Diagramme.

Ein immenser Informationsschatz

Alle intern und extern zur Verfügung stehenden Quellen eingeschlossen, kommen gut und gerne Datenmengen von 500 Millionen Dokumenten zusammen, mit denen sich ein Pharma-Unternehmen auseinandersetzen muss, Tendenz steigend. Dem gegenüber stehen die Experten, die in den verschiedenen Geschäftsfeldern eines biopharmazeutischen Unternehmens tätig sind: Auch hier kann in einem weltweit tätigen Unternehmen die Anzahl schnell bei 10.000 und mehr Personen alleine in Forschung und Entwicklung liegen.

Im Rahmen der Forschungs- und Entwicklungsarbeit kommt es bei AstraZeneca täglich vor, dass jemand einen Experten bzw. Informationen im Konzern zu einem dezidierten Thema sucht. Wer kennt sich z.B. mit „Arteriosklerose“ besonders gut aus, wer weiß über Wirkstoffe und aktive Moleküle in den Medikamenten Bescheid, welche Dokumente zu Nebenwirkungen und Patenten gibt es?

Soziale Unternehmensnetzwerke oft zu wenig gepflegt

Eine Person zu finden, die all diese Anforderungen abdeckt, dürfte in den meisten Fällen unmöglich sein. Es muss also ein Team zusammengestellt werden. Wo aber mit der Suche beginnen? Meist versuchen es die Firmen zunächst mit sozialen Unternehmensnetzwerken (Enterprise Social Networks). In der unternehmerischen Praxis jedoch schlägt dieser im Grunde logische Lösungsansatz oft fehl. Denn die Pflege der eigenen Kompetenz-Matrix in einem sozialen Netzwerk ist meist zu kompliziert und zeitaufwändig. Anfangs noch korrekte Informationen sind schnell veraltet.

AstraZeneca experimentierte deshalb zunächst mit einfachen Suchmaschinen, um Experten anhand der Spuren zu lokalisieren, die sie in Dokumenten hinterlassen: Was hat ein Mitarbeiter veröffentlicht? Welche Patente hat er entwickelt? Zu welchen Themen hat er korrespondiert? Den eingesetzten Suchlösungen war es jedoch nicht möglich, die schiere Vielfalt an Daten aus den verschiedensten Quellen zu verarbeiten; ihre Fähigkeiten zur Content-Analyse waren nicht ausreichend oder schlichtweg zu langsam für die vorhandenen Datenmengen.

Die Lösung: Inhaltsanalyse mit computerlinguistischen Methoden

Die Lösung war Ende 2013 die Einführung der Big Data Search & Analytics-Plattform von Sinequa. Über herkömmliche Enterprise-Search-Produkte geht diese durch ihre Funktionalitäten zur Inhaltsanalyse in Big-Data-Szenarien hinaus. Die Inhaltsanalyse basiert auf computerlinguistischen Methoden (Natural Language Processing in 20 Sprachen) einer patentierten semantischen sowie linguistischen Analyse, und ist einsetzbar für beliebige unstrukturierte und strukturierte Daten. So erhält der Anwender auch Fundstellen, in denen der eigentliche Suchbegriff gar nicht vorkommt, hingegen Synonyme oder inhaltlich ähnliche Begriffe.

Über die Plattform haben Mitarbeiter in der Forschung und Entwicklung bei AstraZeneca einen einheitlichen Informationszugang (Unified Information Access) auf das gesamte Unternehmenswissen – allerdings unter Beachtung der Zugriffsrechte. Über ein Enterprise Information Portal lässt sich die Informationssuche dank der Skalierbarkeit der Software auf alle Beschäftigten ausdehnen. So liefert die Plattform nicht nur der F&E-Abteilung, sondern allen Bereichen relevante Informationen.

In einem initialen Prozess analysierte der Pharmakonzern mit der Software zunächst rund 200 Millionen interne und externe Dokumente aus dem Bereich F&E. Dabei wurden auch fachspezifische Relationen zwischen Begriffen (synonyme und semantisch verwandte Begriffe) ermittelt. Der Index ergab dann ein Datenreservoir, aus dem relevante Informationen in weniger als zwei Sekunden zusammengestellt werden können. Bei Eingabe eines Begriffes in die Suchmaske erstellt das System aus all dem, was zu diesem Thema geschrieben wurde, die besten Experten zusammen.

ROI- und TCO-Betrachtungen

Hunderte Millionen von Dokumenten und ebenso große Mengen strukturierte Daten zu durchpflügen, Daten und Abfragen in natürlicher Sprache zu analysieren und die Ergebnisse in berechneten Kategorien in Echtzeit zu klassifizieren, scheint zunächst wie ein gigantischer Aufwand. In der Realität aber war der Aufwand für die Analyse und damit insgesamt die Total Cost of Ownership (TCO) für AstraZeneca signifikant niedriger als mit vergleichbaren Werkzeugen früherer Generationen.

Return on Investment-Betrachtungen spielen angesichts des in der Pharmaindustrie herrschenden Wettbewerbsdrucks ebenfalls eine große Rolle bei der Entscheidung, ein solches System einzuführen. Detaillierte ROI-Berechnungen gibt das Unternehmen nicht bekannt; dass sich der Einsatz der Analysesoftware indes lohnt, lässt sich an konkreten Beispielen aufzeigen. So legt die Software miteinander verwandte oder überlappende Forschungsergebnisse und Studien offen. Dies schafft Synergien und beschleunigt Forschungsprogramme. Die daraus gewonnenen Einsparungen an Aufwand und Zeit können enorm sein.

Durch die „Find the Expert“-Funktion kann AstraZeneca leicht Forschungsgruppen zu allen gewünschten Themen zusammenstellen – ein klassisches ROI-Potenzial in allen Branchen. Der hohe Wettbewerbsdruck in der Pharmabranche zwingt die Hersteller, Innovationen möglichst schnell zur Produktreife zu bringen. Einen Wettbewerbsvorteil haben dabei solche Unternehmen, die in kürzester Zeit interdisziplinäre Expertenteams konstituieren können, welche standortübergreifend an einem gemeinsamen Thema arbeiten. AstraZeneca hat mit seiner Big-Data-Lösung dafür die richtigen Weichen gestellt.

Diese Artikel könnten Sie auch interessieren

Causal Analytics: Wie aus Big Data Wissen wird

WISSENplus
Wissen ist das Kapital der modernen Wirtschaft. Doch vieles, was heute Wissen genannt wird, ist für das Treffen effektiver Entscheidungen ungeeignet. Entscheidungen auf Fakten und nicht auf unüberprüfbare Meinungen zu gründen: Diese wichtige und lange überfällige Idee hat in den vergangenen Jahren zur Blüte der Business Intelligence beigetragen. Der Big-Data-Boom feuert diese Entwicklung an und verhe...

Weiterlesen