2020/6 | Fachbeitrag | Enterprise Search

Enterprise Search & Analytics: Ein schlüssiges Gesamtkonzept ist das A & O

von Marc Hoffmann

Inhaltsübersicht:

Enterprise Search & Analytics-Lösungen (ESAL) sind in der Lage, über integrierte Konnektoren auf relevante Informationen und Daten innerhalb und außerhalb eines Unternehmens zuzugreifen, um diese für eine Aufbereitung eines Such-Indexes abzugreifen und zu klassifizieren. Um aus einer Vielzahl von Datenquellen allerdings relevante Suchergebnisse zu finden, kommen bei einer ESAL für den Such- und Identifikationsprozess komplexe Algorithmen für semantische, linguistische und phonetische Analysen zum Einsatz, um Inhalte zunächst zu erfassen, zu klassifizieren und zu indexieren. Wirksame ESAL bringen die Informationen zudem in den Kontext der Geschäftsprozesse und können somit sehr genau auf Suchanfragen die relevanten Ergebnisse zusammenstellen. Außerdem helfen sie durch Authentifizierung der Nutzer sowie eine Rechte- und Zugriffsverwaltung dabei, dass Mitarbeiter nur die Suchergebnisse erhalten, für die sie auch entsprechende Befugnisse im Quellsystem erteilt bekommen haben.

Konzept und Modellierung von ESAL entscheiden über Erfolg

Es reicht allerdings nicht, einfach ein ESAL-Produkt zu installieren, die Datenspeicher anzuschliessen und dann zu schauen, wie es funktioniert. Es gibt viele Nutzerdimensionen, Stellschrauben und Funktionen, die bereits bei der Modellierung einer ESAL vorab zu adressieren sind. Es ist deshalb auch wichtig, dass sich Unternehmen vor der Entscheidung für einer Technologie beziehungsweise einer Plattform die Zeit nehmen, ein Gesamtkonzept zu erstellen, das die Interessen und Belange der künftigen Nutzergruppen aber auch der technischen Aspekte beschreibt. Erst auf dieser Grundlage sollte eine Modellierung erfolgen, an deren Ende die Entscheidung für die Technik steht. Ein solches Vorgehen gewährleistet am Ende auch, dass eine ESAL ihren erwarteten hohen Wertbeitrag auch tatsächlich leistet. Wer sich die Mühe dieses Prozesses macht, erhält am Ende einen schnellen Return on Invest.

Welche Daten sind relevant, welche Tools sind zu integrieren?

Wichtig ist etwa, genau zu definieren, welche Datenquellen wie eingebunden werden, welche Relevanz bestimmte Datenarten und Dateiformate haben und welche Dateien überhaupt für welche Entscheidungsebenen zugänglich sein sollen. In der Praxis zeigt sich häufig, dass Unternehmen zwar eine bestimmte Herausforderung wie beispielsweise ein DSGVO-konformes Datenhandling lösen wollen, aber die gesamte Dimension eines ESAL für ihre Compliance erst im Projektverlauf erkennen. Es gibt auf dem Markt einige Produkte, auf die sich eine ESAL aufbauen lässt, die aber unterschiedliche Stärken und Schwächen haben. So zeigt sich typischerweise erst bei der Modellierung und der Konzeption eines ESAL-Projektes, welche Plattform die am besten geeigneten Funktionalitäten und Stärken bietet, die zu lösende Anforderungen umzusetzen. Zudem sind auch bestehende Tools oder Quellen der Fachabteilungen zu integrieren, für die bestimmte Konnektoren oder Schnittstellen erst noch programmiert werden müssen. Und ein hochaktueller Aspekt ist, dass oftmals Bestandssysteme bereits in die Cloud verlagert wurden, einige Dateien wie Kundenstammdaten und Verträge aber aus Sicherheitsgründen nur On-Premise gespeichert und verarbeitet werden dürfen. Hier muss die Modellierung auf jeder Ebene der Datennutzung eine Lösung finden, die unterschiedlichen Anforderungen gerecht wird. Damit Kunden ihre eigene sensiblen Kundendaten nicht in einer Cloud-Lösung für die Suche aufbereiten lassen müssen, sind in bestimmten Fällen ESAL On-Premise einer Cloud-Lösung vorzuziehen, die also stationär auf eigenen Servern läuft. Die zu indexierenden Datenquellen werden typischerweise in einem initialen Schritt aufbereitet und indexiert und im Folgenden nur noch Aktualisierungen verarbeitet. Je nach Bedarf erfolgt dies einmal täglich oder auch häufiger, Abhängig von der benötigten Aktualität oder auch der Datenmenge. Diese Aufgabe übernehmen Konnektoren, die unterschiedlichste Drittsysteme, Datenbanken, Filesystemquellen aber auch Webinhalte erschliessen. Für solche Datenquellen beherrschen Konnektoren zudem die inkrementelle Indexierung, also die automatische Indexierung von Datenänderungen. Für externe Quellen ist es zudem von entscheidendem Vorteil, dass diese über eine offene Architektur und Schnittstellen wie ReST (Representational State Transfer) verfügen. ReST ist eine Schnittstelle für verteilte Systeme, mit dem heute bereits viele Inhalte abgegriffen werden können und somit eine Maschine zu Maschine-Kommunikation unterstützen. Die über die Konnektoren gesammelten Daten bereitet die ESAL vor der Indexierung, also bei der Überführung in den Suchindex, auf.

Über Filter (Conversion) werden die unterschiedlichen Dateiformate (Word, Excel, PowerPoint, PDF, HTML, RTF, TEXT, ZIP) in ein einheitliches, lesbares Format für den Indexer überführt. Zudem wird über Entity Extraktionen, Regeln oder Integration von externen Systemen versucht, die Daten automatisch um zusätzliche Metadaten anzureichern oder zu klassifizieren. Bei einigen ESAL werden für die Klassifizierung von Inhalten Künstliche Intelligenz (KI) und Machine Learning (ML) eingesetzt. So kann eine KI dafür trainiert werden, spezifische Inhaltstypen zu identifizieren, typischerweise für Binärdaten wie beispielsweise Bilder und Videos, die keine 'lesbaren' Informationen enthalten Für Versicherungen ist häufig relevant, Bilder auszuwerten und Schadenereignisse analysieren zu lassen. Für die Nutzer ist es zudem häufig hilfreich, wenn ein ESAL bei der Aufbereitung auch Thumbnail-Previews für Dokumente erstellen kann. Bei der Spracherkennung und sprachlichen Aufbereitung der zu indexierenden Inhalte kommen Funktionen wie Tokenisierung, Synonyme, Spell Checking, Lemmatisierung, Phonetic, Natural Language Processing (NLP) für die jeweilige Sprache zum Einsatz. Und ist ein Text formal korrekt aufbereitet, muss er natürlich auch klassifiziert werden. Hierfür kommen Technologien wie Entity Extraction, KI oder ML zum Zuge. So werden Inhalte "verstanden" und mittels der obigen Technologien klassifiziert und mit zusätzlichen Informationen angereichert. Diese Klassifizierung und Anreicherung kann dann sowohl bei der Relevanz für bestimmte Geschäftsprozesse als auch beim Ranking der Suchergebnisse genutzt werden.

Datenaufbereitung entscheidet über Relevanz und Sicherheit

Die Modellierung einer ESAL und ihrer Funktionen im Suchindex bilden damit also das Kernstück der Suchfunktionen und letztlich den Erfolg des Systems. Und weil es eine Schlüsselfunktion in einer ESAL bildet, sollte bei der Modellierung bereits analysiert werden, mit welchem Tool eine spezifische Aufgabe am besten gelöst werden kann. Denn die Suchplattform hat die Aufgabe, die Daten intern so zu strukturieren und aufzubereiten, dass selbst in extrem großen Datenmengen und bei komplexen sowie sehr spezifischen Suchen die relevanten Resultate innerhalb kürzester Zeit bereitstehen. Basierend auf diesem erstellten Suchindex ist es auch möglich, den Nutzer aktiv über neue Inhalte, die die vordefinierten Kriterien erfüllen, automatisch zu informieren. Auch das Ranking der Ergebnisausgabe ist ein Qualitätsfaktor von ESAL. Je nach Nutzergruppe im Unternehmen können die Anforderungen an das Ranking der Resultate unterschiedlich ausfallen. Deshalb muss eine ESAL auch die Möglichkeit bieten, das Ranking und die Security-Richtlinien basierend auf den Quellsystemen an die verschiedenen Geschäftsprozesse der Nutzer anzupassen. Dies sollte idealerweise schon bei der Modellierung berücksichtigt und bestimmte Nutzergruppen identifizieren werden. Für sie sind Rollen zu definieren und die Relevanz von Suchergebnissen an den Anforderungen ihrer Geschäftsprozessen auszurichten. Sucht beispielsweise ein Vertriebsmitarbeiter nach einem Produkt, sollten ihm die Produkte zusätzlich angezeigt werden, die auch andere Kunden gekauft haben. Ein Techniker aber braucht die Ersatzteilliste zu diesem Produkt. Und ein Einkäufer braucht die Informationen, wie viel dieses Produkt bei welchem Anbieter kostet. Oder die HR-Abteilung sucht bei einem Namen in der Regel eine Personalakte. Die Schadenabteilung einer Versicherung aber sucht Verträge, die eine Person mit dem Namen abgeschlossen hat oder Begünstigte in einem Vertrag benannt hat. Zudem ist auch entscheidend, welche Suchergebnisse ihnen überhaupt eingeblendet werden. Ein Benutzer darf nur diejenigen Inhalte angezeigt bekommen, auf welche er in den Quellsystemen auch berechtigt ist. So sollte beispielsweise nur der Einkaufsleiter einen Rahmenvertrag mit einem Anbieter einsehen können, der Einkaufssachbearbeiter aber die einzelnen Verträge des täglichen Geschäfts. Dokumente, die bestimmten Hierarchiestufen vorbehalten sind, werden dadurch unbefugten Mitarbeitern erst gar nicht angezeigt. Dies wird durch eine korrekte Berechtigungsvergabe im Quellsystem erreicht, welche durch die ESAL berücksichtigt wird. Da jedes Quellsystem und jeder Kunde eigene Security-Umsetzungen hat, ist es zwingend, diese bereits bei der Konzeption zu berücksichtigen. Fazit: Das Gesamtkonzept einer ESAL ist entscheidend für deren Fähigkeit, die wirklich relevanten Suchergebnisse zu identifizieren und von den jeweils nutzerabhängig weniger relevanten Ergebnissen zu unterscheiden.

 

 

Diese Artikel könnten Sie auch interessieren

Cloud Computing, Big Data, KI: Wo bleibt der Mensch?

WISSENplus
Aufgrund der Digitalisierung, des wachsenden Konkurrenzdrucks, steigender Regulatorik-, Kunden- und Qualitätsanforderungen sowie erhöhter Transparenz sind Unternehmen zukünftig einem immer stärker werdenden permanenten Wandel ausgesetzt. Diesen Wandel zu erkennen, den Wandlungsbedarf zu generieren und entsprechende Impulse zu setzen, liegt in der Verantwortung des Top-Managements. Die Bereitschaft...

Weiterlesen

Know Your Customer: Prüfungspflichten automatisieren

WISSENplus
Seit 2020 gelten verschärfte Prüfungs- und Meldepflichten, um Geldwäsche oder Terrorfinanzierung aufzudecken. Inzwischen geht der Kreis der KYC-"Verpflichteten" (Know Your Customer, kenne Deinen Kunden) weit über den Finanzsektor hinaus. Auch Digitalplattformen, Immobilien-, Kunst- & Güterhändler müssen bei Barzahlungen hoher Beträge künftig KYC-Prüfungen durchführen. Angesich...

Weiterlesen

Drei Szenarien für das Digital Office

WISSENplus
Gerade zu Beginn der Corona-Krise gab es eine hohe Nachfrage nach cloudbasierten Digital-Office-Lösungen. Denn der Großteil an Unternehmen musste aus der Not heraus schnell neue Arbeits- und Kommunikationsweisen etablieren. Laut einer Sonderauswertung des Bitkom-ifo-Digitalindexes arbeiteten im April diesen Jahres 75 Prozent aller Unternehmen von zu Hause aus - in der Informations- und Kommunikatio...

Weiterlesen

My CMS: Anwaltskanzlei bündelt ihr Wissen App-basiert

WISSENplus
CMS ist eine der zehn größten internationalen Anwaltskanzleien. Sie ist in 70 Städten in 43 Ländern vertreten - mit 75 Standorten weltweit. Aufgrund einer Fusion mit den Kanzleien Nabarro und Olswang im Jahr 2017 hatte es CMS mit einer heterogenen IT-Landschaft zu tun. Doch die Digitalisierung macht auch vor der Rechtsbranche keinen Halt. Ein immer schnelleres Wachstum und die hohen Anforderungen ...

Weiterlesen

Cleveres Umdenken: Von HR 4.0 zur Arbeitswelt 5.0

WISSENplus
Digitale HR-Prozesse findet man heute bereits in den meisten Personalabteilungen. Dank der Arbeitswelt 4.0 verfügen viele HRler schon über das richtige Mindset in puncto Digitalisierung. So haben sie sich unter anderem von lang bewährten, oft manuellen administrativen Arbeitsabläufen getrennt und sind aufgeschlossen gegenüber digitalen Technologien. In der Version 5.0 stellt sich allerdings nicht...

Weiterlesen

Weniger Verkehrschaos trotz boomendem E-Commerce: Die letzte Meile smart gestalten

Der E-Commerce wächst immer weiter: 2019 erzielte der deutsche Online-Handel einen Rekordumsatz von 72,6 Milliarden Euro, so der Bundesverband E-Commerce und Versandhandel (bevh). Kein Wunder, denn in Zeiten von Over-Night-Zustellung, kostenlosem Versand- und Rückversand ist Online-Shopping so bequem wie nie zuvor. Diese Entwicklungen stellen Logistiker vor immense Herausforderungen und sorgen auf d...

Weiterlesen

Forschungsdaten & Co.: Wissensmanagement in F&E

WISSENplus
Nahezu alle Unternehmen setzen heutzutage Systeme zur Ressourcenplanung (Enterprise Resource Planning, ERP) zur Steuerung und Verwaltung ihrer Geschäftsprozesse ein. Auf dem Markt sind Komplettsysteme oder Teilmodule zur Erledigung unterschiedlichster Aufgaben verfügbar. Die Struktur der gespeicherten Daten und die Abläufe sind standardisiert und üblicherweise für alle Abteilungen der Firma verf...

Weiterlesen

Digitalisiert & vernetzt: Daten im (Work-)Flow

Daten gelten als Gold des 21. Jahrhunderts. Sie haben sich als vierter Produktionsfaktor neben Boden, Arbeit und Kapital fest etabliert. In vielen Organisationen tragen sie - als elementarer Wissensbaustein - mittlerweile sogar mit mehr als 60 Prozent zur Wertschöpfung bei. Doch trotz ihrer wachsenden Bedeutung für die Wettbewerbsfähigkeit werden Daten in vielen Organisationen nach wie vor vernachlässig...

Weiterlesen