2012/8 | Trends |

Semantische Systeme als fehlendes Puzzleteil von DMS

von Alexander Stumpfegger, Martin Schleich

Wir leben in einer vernetzten Welt. Besonders in der Unternehmensrealität ist es ein Erfordernis, dass Informationen von überall zugänglich sind. Unlängst haben sich Softwarelösungen wie Microsoft SharePoint etabliert, die den Wissensarbeiter darin unterstützen, die vielen Dokumente zu verwalten, die während unterschiedlichster Geschäftsprozesse und Projekte erstellt und bearbeitet werden. Wie die Praxis zeigt, eröffnen Dokumentenmanagementsysteme (DMS) nicht nur Möglichkeiten, sie bringen auch neue Herausforderungen.

Die Hauptschwierigkeit besteht darin, den Überblick über die generierten Datenmengen zu behalten. Unternehmen haben diese Problematik längst erkannt und reagieren darauf, indem sie Strukturen für die Organisation von Dokumenten in SharePoint vorgeben und ihre Einhaltung einfordern. Dennoch – die subjektiven Strukturierungsvorlieben und persönlichen Ordnungsgewohnheiten der Mitarbeiter sind nicht vollkommen zu standardisieren. Selbst, wenn das gelänge – unternehmensrelevante Informationsprozesse sind inzwischen so umfangreich, dass die sauberste Struktur ungenügend ist. Mit steigender Datenmenge werden die Archive für die Mitwirkenden zunehmend unübersichtlicher. Entweder sind es zu viele Ordner mit zu vielen Hierarchieebenen oder in wenigen Ordnern sind zu viele Dokumente. In beiden Fällen stößt die menschliche Kognition letztlich an Grenzen. Während eines komplexen Geschäftsprozesses kommen stetig Dokumente hinzu. Es lässt sich nicht ausschließen, dass diese entfernt voneinander abgelegt werden, obwohl sie inhaltlich verwandt sind. Selbst wenn sie richtig abgelegt sind, gehen sie schnell in der Menge unter. Die Herausforderung ist, thematisch zusammengehörige Informationen zusammenzuführen und in einer Übersicht zu präsentieren. Ein solcher Überblick ist wertvoll – wird er einem Wissensarbeiter eröffnet, wird transparent, welche relevanten Informationen potentiell auffindbar sind. Ein System, das diesen Überblick vollautomatisch generieren kann, ist nicht minder wertvoll als die Information an sich.

Dokumentenmanagement in der Praxis

Prozesse und Projekte basieren auf kontinuierlich ausgetauschten Informationen. Bei Informationsmangel und fehlender Abstimmung können die Abläufe schnell stocken. Ob Neueinsteiger oder erfahrener Mitarbeiter – wenn jemand eine Information benötigt, beginnt er in der Regel damit, sich einen Überblick zu verschaffen. Es ist denkbar, dass der erfahrene Wissensarbeiter eine Ahnung hat, wo das eine oder andere hilfreiche Dokument abgelegt sein könnte. Nutzt er ein DMS wie Microsoft SharePoint, kann er einen gewissen Prozentteil der vorrätigen Informationen schnell zur Kenntnis nehmen. Was ist aber mit jenem Teilnehmer, der noch nicht so sehr in die Unternehmensstrukturen „hineingewachsen" ist? Er wird ebenfalls einen Blick in SharePoint werfen – einen Blick allerdings, der weitaus weniger aufschlussreich ausfallen dürfte. Der weniger erfahrene Mitarbeiter wird verschiedene Inhaltsangebote vorfinden, hier ein Wiki, dort eine Dokumentenliste. Er wird in jener Unterrubrik auf Informationen stoßen, die ein Mitarbeiter abgelegt hat, und in einer anderen auf die eines anderen. In der Hoffnung, noch mehr passende Informationen „freizulegen", wird er ein Schlagwort in das Suchfeld eintippen. Die Qualität der Ergebnisse hängt dabei nicht nur von seinem Suchgeschick – also von der Wahl der Suchbegriffe –, sondern auch von der verwendeten Suchlösung ab. Die übliche Suchtechnologie liefert Dokumente, in denen der Suchbegriff enthalten ist. Texte, in denen er nicht vorkommt, werden nicht berücksichtigt. Schreibt der Suchende etwa den Namen eines gesuchten Unternehmens aus, werden ihm Dokumente vorenthalten, in denen nur das entsprechende Kürzel auftaucht. Darüber hinaus entgehen ihm Informationen, wenn er an ein bestimmtes Schlagwort gar nicht erst denkt.

Gelänge es dem Suchenden, dass alle adäquaten Informationen aufgelistet würden, wäre das zwar ein Fortschritt, letztlich aber noch immer unzureichend. Aufgrund der Datenmenge, die zu erwarten ist, wäre die menschliche Kognition damit überfordert. Wissenschaftlichen Erkenntnissen zufolge kann das Kurzzeitgedächtnis nur wenige Eindrücke – hier Suchergebnisse – gleichzeitig registrieren und weiterverarbeiten. Darüber hinaus erfolgt das Denken stets auf der Basis von Kategorien. Lange Ergebnislisten, wie sie von verschiedenen Suchsystemen geliefert werden, sind also inkompatibel zur menschlichen Informationsverarbeitung. Um die ausgegebenen Informationen verwertbar zu machen, muss der Mitarbeiter sie in Gedanken nach Themen strukturieren und Kategorien bilden, was aufwändig und ineffizient ist. Sähe er sie aber in einer der menschlichen Informationsverarbeitung nachempfundenen Struktur vor sich, könnte er deutlich effizienter mit ihnen arbeiten und in seiner Arbeit voranschreiten. Entsprechende Darstellungsweisen erhöhen die Verwertbarkeit und die Transparenz des verfügbaren Informationspotentials. Sie machen sichtbar, was potentiell auffindbar ist, eröffnen einen Überblick über die für den Suchenden relevanten Inhaltsgebiete und knüpfen ein inhaltliches Netzwerk, das für alle Beteiligten in idealer Weise nutzbar ist.

Die Architektur einer technischen Lösung

Es braucht ein System, das die DMS-Nutzer in den aufgeführten Punkten unterstützt. Die eigentliche Herausforderung des Big-Data-Zeitalters ist nämlich nicht nur die explodierende Datenmenge – problematisch ist die Datenmenge in Verbindung mit einer enormen Vielfalt und der weiten Informationsstreuung. Derartige uneinheitlich abgelegte Dokumente, wie sie aus den subjektiven Ordnungsphilosophien der verschiedenen Wissensarbeiter resultieren, in eine logisch-nachvollziehbare und somit hilfreiche Ordnung zu überführen – das ist die eigentliche Herausforderung. Die Herausforderung ist noch größer, wenn die Daten nicht nur aus einem System herangezogen werden sollen. Im Kontext von Marktbeobachtung, Competitive Intelligence oder Technologie-Monitoring sind auch zahlreiche Webquellen einzubeziehen. Die hier vorrätigen Informationen leisten nur dann einen Beitrag, wenn der Wissensarbeiter auf sie aufmerksam wird und sie über das DMS seinen Kollegen zur Verfügung stellt. Die Arbeitszeit, die dazu aufzuwenden ist, ist noch am wenigsten problematisch. Schwerwiegender ist es, wenn der Wissensarbeiter gar nicht erst auf die jeweilige Information aufmerksam wird.

Es braucht eine intelligente Technologie, die auf einer Metaebene arbeitet und dazu in der Lage ist, verschiedenste Inhalte aus verschiedensten internen und externen Datenbeständen gleichzeitig zu verwalten, in aussagekräftigen Übersichten zusammenzufassen und in aufschlussreichen Darstellungsformen zu präsentieren. Um das leisten zu können, muss das System inhaltliche Verwandtschaften und Zusammenhänge zwischen gestreuten Informationen erkennen und sie der Logik gemäß in entsprechende Themenkomplexe bündeln. Weil der Suchende in der Regel nicht detailliert und dezidiert wissen kann, welche Suche erfolgversprechend sein wird, sollte die Technologie intelligent transparent machen, welche relevanten Informationen potentiell auffindbar sind. Nur wenn er einen Überblick über den Informationsbestand hat, kann er sinnvoll recherchieren und suchen. Gemäß seiner kognitiven Architektur verlangt es den Menschen außerdem nach intelligenten Fokussierungsvorschlägen sowie nach einer intuitiven und nachvollziehbaren Navigation. Der Informationsprozess darf nicht einseitig sein – er sollte interaktiv und pro-aktiv erfolgen.

Fazit:

Die CID GmbH bietet mit Topic Analyst® und CORPUS® eine Lösung an, die das leistet, was auf der Ebene der Interaktion zwischen DMS und Wissensarbeiter noch fehlt. Das CID-System ist darauf ausgelegt, die fehlende Mittlerrolle einzunehmen. Die Software erfasst die Bedeutungen der vorrätigen Dokumente, arbeitet mit diesen weiter und erkennt Zusammenhänge zwischen den einzelnen Inhalten. Informationen werden automatisch ausgewertet, systematisch strukturiert, intelligent aufbereitet und übersichtlich präsentiert. Für das semantische System ist es irrelevant, ob die Informationen in einem DMS wie SharePoint oder in externen Quellen wie dem Internet vorliegen. Es ist in der Lage, sie zusammenzutragen und sie vollautomatisch in eine objektive, logische Struktur zu überführen – auch diejenigen, die nach individuellen Ordnungsgewohnheiten abgespeichert sind. Die Darstellungsformen, in denen die Ergebnisse visualisiert und präsentiert werden, sind auf die Informationsverarbeitung im menschlichen Gedächtnis zugeschnitten. Diagramme und Schemata zeigen die Inhalte, nachdem sie vom System in Themengruppen zusammengefasst wurden. Wählt der Nutzer ein Inhaltsgebiet, wird dieses erneut aufgefächert. Das CID-System bereichert Arbeitsprozesse, die über Datennetzwerke erfolgen – es knüpft nicht nur das Netz, es macht auch die Verbindungen zwischen den Knotenpunkten für alle an dem Geschäftsprozess Beteiligten deutlich sichtbar. Es macht intelligent auf Informationen aufmerksam, rückt sie in den Wahrnehmungsbereich des Suchenden hinein und fördert damit, dass sie effizient in Wissen überführt werden.

Diese Artikel könnten Sie auch interessieren