Fachbeiträge

Ausgabe 7 / /2009
Fachbeitrag Enterprise Search

Als die Bilder (weg)laufen lernten

von Michael Hieber

24 Bilder umfasst eine einzige Sekunde Film, 1.440 Bilder pro Minute, 86.400 Bilder in der Stunde. Und moderne Archive beherbergen heute Hunderte Stunden an Videos und Zelluloid-Filmen. Vor allem Unternehmen zeigen sich zunehmend gern im Fernsehen und auf der Leinwand. Wer in dieser Informationsflut eine ganz bestimmte Einstellung sucht, steht vor einer großen Herausforderung. Denn bewegte Bilder lassen sich nur schwer durch ein Inhaltsverzeichnis oder Themenregister festnageln. Einzige Option bei der Suche nach der verlorenen Szene waren bislang stundenlange Sitzungen in staubigen Kellern, um das Material von Hand zu sichten. Das gehört ab sofort der Vergangenheit an: Intelligente Software-Lösungen machen das Graben in Werbespots und Filmschnipseln zum entspannten Jagdausflug. Der Clou dahinter ist ein lernfähiges Verschlagwortungssystem.

Inhaltsübersicht:

 

„Eine Frau mit einem Schirm, rot, glaube ich.“ Mehr Informationen gibt es nicht, aber genau diese Szene muss unbedingt in die geplante Unternehmensausstellung – so zumindest der Wille des Geschäftsführers. Für die Mitarbeiter hieß das bisher: Filme anschauen, stundenlang, auf der Suche nach einem – möglicherweise – roten Schirm. Doch zu einem solchen Fernsehmarathon gibt es mittlerweile eine Zeit- und Ressourcen-sparende Alternative: die intelligente Suche in digitalisierten Filmdatenbanken.

Eines der Unternehmen, die ihr Filmmaterial bereits auf diese Weise archiviert haben, ist der Süßwarenhersteller Ritter Sport. Gut 500 Stunden bewegte Unternehmensgeschichte, Selbstdarstellung und Werbung, von den Anfängen der Firma bis in die Gegenwart, wurden dazu gesichtet und bearbeitet – damit sich der Erfinder der quadratischen Tafel heute zu jeder Gelegenheit von seiner Schokoladenseite zeigen kann.

 

Am Anfang wird es digital

 

Doch der Reihe nach: Bevor RitterSport quasi auf Knopfdruck immer die richtige Szene finden konnte, stand zuerst die Digitalisierung des umfangreichen Filmmaterials an. Nach dem Anlegen eines Datensatzes mit allen Parametern muss man das Video in ein gängiges Digital-Format konvertieren. In der Regel werden die Filme, die in unterschiedlichsten Standards vorliegen können, zudem auf dem international üblichen Speichermedium Digital-Betacam gesichert. Anschließend erfolgen die Komprimierung des Materials sowie die Umwandlung in MPEG-Streams, die auch den Original-Timecode enthalten. Die Streams werden automatisiert im File-basierten Serversystem verteilt, was es ermöglicht, Filme und Einzelszenen auch über das Internet wieder abzurufen.

Im nächsten Schritt unterzieht die Software das Material einer Szenenerkennung, indiziert die Wechsel und teilt den Stream in zusammengehörige Teile, Shots genannt. Von diesen erzeugt das System Thumbnails für die Vorschaufunktion und bietet dadurch Schlüsselszenen für die weitere Bearbeitung an. Wie weit eine zusammenhängende Einstellung geht, erkennt das System über die Ähnlichkeit der Bilder. Im automatischen Abgleich mit der zentralen Oracle-Datenbank verwandelt sich der geschlossene Film so in ein Mosaik aus Einzeldarstellungen, die sich leichter registrieren und dokumentieren lassen.

 

Szene für Szene – Wort für Wort

 

In der folgenden Verschlagwortung liegt das zentrale Mittel zum späteren Auffinden von Szenen: Die Bausteine des Videos sowie der Film selbst werden manuell über ein spezielles Web-Interface mit geeigneten Stichworten versehen. Dabei ist es möglich, die Shots sowie den gesamten Film als Digitalisat mit dem Timecode anzusehen oder eine Vorschau davon anzuzeigen, um auch wirklich eine zeitgenau passende Zuordnung vornehmen zu können. Die Qualität dieser Kategorisierung bestimmt, wie schnell sich später eine Einstellung finden lässt. Für die Verschlagwortung entscheidet der Benutzer selbst, ob er dazu Freitext eingibt oder einem Thesaurus folgt.

 

Diese Thesaurus-Funktion kommt auch beim Suchen zum Tragen, sodass das System bei Eingabe eines Schlagworts auch Szenen mit ähnlichen Wörtern finden kann. Eine Anfrage nach „Haus“ liefert so auch Ergebnisse unter dem Stichwort „Gebäude“. Die Flexibilität der Ausdruckserkennung sorgt aber zudem dafür, dass das System auch neue Wörter mit einzelnen Szenen zu verknüpfen lernt und dieses Wissen für weitere Suchen nutzt. Schlüsselszenen in der Vorschau oder in der Storyboard-Ansicht erleichtern das Stöbern im digitalen Archiv. Sie können darüber hinaus auch selbst Grundlage der weiteren Suche sein, da die Software in der Lage ist, auf Wunsch ähnliche Bilder im gespeicherten Content zu finden. Durch die Auswahl mehrerer Bilder, die dem Gewünschten ähneln, lässt sich diese Methode sogar noch verfeinern.

 

Wer suchet, der findet – weltweit

 

Die Abfrage des gesammelten Filmmaterials nach einer bestimmten Einstellung erfolgt webbasiert über gängige Browser wie Internet Explorer oder Mozilla Firefox. Wer Zugriff auf welche Filme hat, wird über eine positive Rechte-Lizensierung gesteuert. Die Suche zeigt damit nur Ergebnisse aus Filmen, die dem Benutzer zugeordnet sind. So lassen sich Videos verschiedener Abteilungen und Ausrichtungen oder sogar unterschiedlicher Unternehmen in einem Serversystem verwalten, ohne die Informationssicherheit zu gefährden.

 

Durch die Umwandlung des Materials in Streams ist es möglich, die Recherche auch extern, außerhalb des firmeneigenen Intranets durchzuführen und die Filme anzusehen. Sollte zur weiteren Verwendung die vollständige Datei oder auch eine Kopie auf Band benötigt werden, kann die Kern-Software zur Archivierung um eine Bestellfunktion mit Warenkorb und Auftragsbearbeitung beziehungsweise um ein Modul zur Bereitstellung von Download-Kapazität erweitert werden.

Diese Artikel könnten Sie auch interessieren

Online Fachbeiträge Ausgabe 3 / 2007
Fachbeitrag       IT-Tools

Recherche-Tools: Masse mit Klasse

von Michael Hack

Artikel lesen


22010
Praxis Wissensmanagement       Dokumentenmanagement

Intelligente Datenhaltung bei der Krämer GmbH Metzingen

von Daniele Vögele

Artikel lesen


82010
Praxis Wissensmanagement       IT-Tools

Bibliothekarische Wissensarbeit: Informationen nicht nur bereitstellen, sondern interpretieren

von Yolanda Käppeli, Clemente Minonne

Artikel lesen


82010
Dokumentation + Kommunikation       Social Media

Finden & gefunden werden - Social Media verbessert Suchergebnisse

von Dirk Lewandowski

Artikel lesen


82010
Dokumentation + Kommunikation       Dokumentenmanagement

Informationen bündeln, strukturieren & elektronisch verwalten

von Michael Duhme

Artikel lesen


Unsere Empfehlungen