Georg Schelbert: Von den Fotoboxen ins Wissensnetz – noch ein Jahr bei „kunst.bild.daten“

Einst standen sie ausschließlich in geordneten Fotokästen: Abbildungen von Bauwerken und Kunstwerken, sortiert nach Orten und Namen – wie in einer riesigen analogen Landkarte der Kunst. Jetzt werden sie aus der statischen Struktur in ein vernetztes digitales System überführt, das neue Zusammenhänge sichtbar macht. So wird aus einem Archiv vergangener Epochen ein Werkzeug für die Forschung von morgen – und für alle, die neugierig auf Kunst und ihre (Medien-)Geschichte sind.

Mit der Initiative kultur.digital.strategie unterstützt das Bayerische Staatsministerium für Wissenschaft und Kunst seit einigen Jahren Projekte, die Strategien und digitale Infrastrukturen für Wissenschafts- und Kultureinrichtungen entwickeln. Das Zentralinstitut für Kunstgeschichte war bereits in der ersten Förderrunde (ab 2021) mit MunichArtToGo erfolgreich – einer App, die Texte und Bilder zu Orten, Bauten und Persönlichkeiten des Münchner Kunstlebens mobil zugänglich macht.

Seit Ende 2023 läuft nun die zweite Förderphase – diesmal mit einem Vorhaben des Zentralinstituts, das zum Ziel hat, die Infrastruktur der Photothek neu aufzustellen und einen globalen Zugriff auf den bislang nur zu einem kleinen Teil über Google Arts&Culture online veröffentlichten Fotobestand zu ermöglichen. Zu diesem Zweck werden bereits vorhandene und zu erstellende Digitalisate, vor allem die fast 700.000 Objekte umfassenden Kataloginventare, zusammengeführt und über eine einheitliche Rechercheumgebung zugänglich gemacht: „kunst.bild.daten“.

Ordnung für die Fachwelt – in engen Grenzen

Die Photothek des ZI wurde ursprünglich mit dem Ziel aufgebaut, systematisch Bildmaterial zum kunsthistorischen Fachkanon und aktuellen Forschungsschwerpunkten zu sammeln. Ihre analoge Ordnung folgt einem klaren und kunsthistorisch etablierten System: Bauwerke werden topografisch, Kunstwerke nach Künstler*innennamen geordnet. Objekte ohne klare Zuordnung wie anonymes Kunsthandwerk oder hybride Gattungen stellen das System vor Herausforderungen und machen dessen Grenzen sichtbar. Sieht man einmal von zusätzlichen Katalogen, Verweiszetteln und ähnlichem ab, gibt es für jedes Foto in einem analogen Bildarchiv genau einen Platz und damit genau einen Zugangsweg

Schwerlastenregal mit grünen Pappschubern. Auf den Rücken der Schuber sind Etikette aufgeklebt.
Typische Anordnung des Materials in kunsthistorischen Fototheken: Sortierung nach Orten oder Künstler*innennamen in alphabetischer Reihenfolge. Ein Objekt kann immer nur an genau einem Platz stehen (Photothek des ZI, Foto: G. Schelbert)


Um die letztlich nicht befriedigende Enge der Ordnung zu erweitern, wurden Sonderabteilungen wie Kunsthandwerk oder Buchmalerei gebildet. Noch weiter verkomplizierte sich die Situation durch fortlaufend hinzukommende Bestände, vor allem Nachlässe und Schenkungen. Deren vorhandene Struktur, die früher nur in Ausnahmefällen erhalten blieb – wenn eine Sammlung einen klar abgegrenzten und zugleich in sich gut geordneten Bestand bildete, etwa die Kunsthandwerk-Fotografien von Erich Meyer (1897–1967) oder die Buchmalerei-Reproduktionen von Albert Boeckler (1892–1957) –, sollen nun grundsätzlich nicht mehr aufgelöst werden.

Die grundlegende Motivation für die Beibehaltung ursprünglicher Strukturen liegt darin, dass analogen Fotografien heute eine Bedeutung zukommt, die über die bloße Abbildung hinausgeht und beispielsweise auch wissenschaftsgeschichtliche oder technikgeschichtliche Aspekte umfassen. Uns interessiert heute, wer die Fotos besessen und geordnet hat, und ebenso, in welchem Kontext sie verwendet wurden. Aus diesem Grund werden nicht mehr nur Fotonachlässe übernommen, sondern ebenso Begleitmaterialien wie Aufnahmelisten, Korrespondenzen, Arbeitsnotizen u. a. In einzelnen Fällen sind Fotografien nur ein Teilbestand eines Konvoluts, wie etwa die Unterlagen der Kunsthandlung Julius Böhler in München, die zusammen mit Verkaufs- und Kundenkarteien Grundlage eines eigenen Forschungsprojekts bildeten.

Da es sich längst nicht mehr nur um eine Bildstelle handelt, sondern in der Photothek unterschiedliche Quellenmaterialien zusammenkommen, heißt die Abteilung folgerichtig „Photothek / Sammlungen“ und bildet außerdem mit dem Arbeitsgebiet Digital Humanities eine größere Einheit, die die Aufgabe besitzt, Konzepte und Umsetzungen für die analoge und digitale Bereitstellung von bildlichen und textlichen Quellen- und Forschungsmaterialien zu realisieren.

Paradigmenwechsel Digitalisierung

Im digitalen Raum entfällt der Zwang zu einer starren Ordnung. Bild- und Textdaten können nach verschiedenen Kriterien gefiltert und geordnet werden: etwa nach Entstehungsjahr, Fotografin oder Fotograf, Vorbesitz, Technik oder Standort. Digitalisierung und Internet ermöglichen daher nicht nur die permanente und ubiquitäre Verfügbarkeit, sondern eine Erweiterung des Zugriffs auf Daten hinsichtlich der Auswahl, Anordnung und Darstellung der Gegenstände. Hinzu kommt, dass Daten künftig nicht nur oder in erster Linie über Suchmasken und Downloads händisch abgerufen werden, sondern auch maschinell – etwa über Schnittstellen für Forschungsvorhaben, die Daten automatisch weiterverarbeiten, bspw. um sie mit weiteren Datenbeständen zu vergleichen.

Das Konzept des Projekts kunst.bild.daten ist bemüht, die Nachhaltigkeit, Transparenz und Eignung von Daten für Forschungskontexte zu fördern. So stellt das Projekt die (vorhandenen) Daten in den Mittelpunkt, nicht Software oder zentrale Anwendungen. Neben der Digitalisierung und Datenextraktion steht daher zunächst das Poolen von Daten (Erzeugung eines Data Lake) im Vordergrund. Die historisch gewachsenen Teildatenbestände der Photothek sind in ihrer Heterogenität in dieser ersten Projektphase kaum für eine zentrale Anwendung zu vereinheitlichen, sondern sollen erst einmal schrittweise analysiert und strukturiert werden.

Seerosen auf einem blauen Gewässer, Gemälde.
Data Lake: Pool, Teich und See als Metaphern für die vereinigte Datenmenge: Claude Monet, Seerosenteich 1906, The Art Institute of Chicago, IL, Mr. and Mrs. Martin A. Ryerson Collection, 1933.1157 (CC0 Public Domain Designation)

Als gegebenes Material stammen die Daten aus unterschiedlichen Quellen. Das waren in der Vergangenheit händisch gepflegte Daten in Tabellenform wie Excel oder Datenbanksysteme unterschiedlicher Ausprägung (z.B. Hida, APS oder Wisski). Dazu treten jetzt Daten, die durch Buchstabenerkennung (OCR) und deren Interpretation mit künstlicher Intelligenz (KI), aus den historischen Inventaren gewonnen wurden. Das über Jahrzehnte maschinenschriftlich geführte Kataloginventar verzeichnet fast 700.000 Fotos von 1947 bis 1999 und nennt zumeist nicht nur die abgebildeten Bauten und Kunstwerke, deren Autorschaft, Ikonografie, Datierung, Sammlung oder Inventarnummern, sondern auch Fotografinnen und Fotografen und die Herkunft des Fotos.

Diese Informationen sind der Schlüssel zum Verständnis der Struktur der Sammlung, ihrer Provenienzen und den damit verbundenen Forschungskontexten. Daher haben wir der Verarbeitung dieses Inventars im Projektverlauf eine besondere Priorität eingeräumt und geeignete Digitalisierungsverfahren entwickelt, die in einem weiteren Beitrag genauer vorgestellt werden.

Von Daten zu Strukturen und Vernetzung

Die Daten werden zunächst in ihrer ursprünglichen Struktur gespeichert. Bereits auf dieser Datengrundlage können Datenanalysen oder maschinelles Lernen greifen. Darüber hinaus können die Daten gezielt für die weitere Verarbeitung remodelliert, angereichert und verändert werden.

Auf der Ebene der gepoolten Daten handelt es sich fast ausnahmslos um „flache“ Fotoerfassungen, d.h. für jedes Fotoobjekt in der Sammlung gibt es einen Datensatz, in dem sich gleichermaßen Angaben zum Foto wie zum abgebildeten Gegenstand, dem Kunst- oder Bauwerk finden. Eine Erschließung, die für die kunsthistorische Forschung nützlich sein soll, muss hingegen auch die abgebildeten Werke in strukturierter Weise erfassen. Das geschieht durch weitere Transformationen und Nachverarbeitung der Daten, sowie den Abgleich mit einschlägigen Normdaten (GND, Wikidata) und führt zu Informationsbündeln, die für einen eigenständigen kunsthistorischen Knowledge Graph in Form einer Wikibase tauglich sind. Dieser wird als Wissensbasie, die auch von anderen Forschungsvorhaben genutzt bzw. angereichert werden kann, eine zentrale Rolle im zukünftigen Datenkonzept spielen.

Das Projekt ist ein gutes Stück weit ein exploratives Projekt. Wir loten zunächst aus, inwieweit vorhandene oder maschinell aus analogen Beständen erzeugte Daten in einer bisher nicht gekannten Weise zusammengeführt und in verschiedenen Schritten durchsuchbar gemacht, kontrolliert sowie bereinigt und schließlich neu strukturiert werden können. Idealerweise sollen die in der Photothek (und anderswo) im ZI gelagerten Bilder und Dokumente nicht nur nach klassischen Bildgegenständen befragt werden können, sondern ebenso nach der Herkunfts- und Nutzungsgeschichte dieser Dokumente, einschließlich der Fotografie- und Mediengeschichte, oder nach dem Forschungsstand und -geschichte des jeweiligen Themenfeldes. Gleichzeitig arbeiten wir daran, eine Infrastruktur einzurichten, die die Pflege und Erweiterung des eigenen Datenbestands ermöglicht, zugleich aber mit anderen fachbezogenen Wissensbeständen derart verbunden ist, dass keine unproduktiven Datensilos oder überflüssige Doppelungen entstehen. Welche Herausforderungen hier begegnen und welche Lösungswege wir hier beschreiten, werden wir in weiteren Beiträgen darstellen.

Dr. GEORG SCHELBERT ist Leiter der Photothek/Sammlungen und Digital Humanities am ZI. Er leitet das Projekt kunst.bild.daten.