Please activate JavaScript!
Please install Adobe Flash Player, click here for download

uni'wissen 01-2013

Die Sprachwissenschaftlerinnen und Sprach­ wissenschaftler waren verzweifelt: Ihre digi­ tale Datenbank war plötzlich nicht mehr lesbar. Das lag nicht an den Daten, die nach wie vor vorhanden waren, sondern am modernisierten Computersystem, das die alten Formate nicht mehr darstellen konnte. Der komplette lokale Sprachatlas, das Kartenmaterial und die Ver­ schriftlichungen von Tondokumenten aus den Jahren 1974 bis 1986 – einfach weg. Ein wissen­ schaftlicher Schatz, in vielen Jahren mühsam aufgebaut, war von jetzt auf gleich im digitalen Nirwana versunken. Zum Glück hatten die Lingu­ istinnen und Linguisten die Idee, im Rechen­ zentrum der Universität Freiburg anzufragen. Denn dessen Direktor Prof. Dr. Gerhard Schnei­ der und sein Team zauberten die wertvollen Daten wieder herbei: mittels Emulation. Emulation heißt, dass für digitale Daten eine Originalumgebung oder eine vergleichbare Ersatzumgebung bereitgestellt wird. Was das genau bedeutet, erklärt Schneider mit einem Beispiel: „Wer heute auf seinem Rechner, ganz gleich welcher Art, ein Word­Dokument öffnen möchte, das mit einer alten Word­Version erstellt worden ist, wird das entweder gar nicht können, oder das Programm sagt ihm, dass das Doku­ ment auf irgendeine Art konvertiert werden muss, um lesbar zu sein.“ Bestenfalls können Nutzerinnen und Nutzer also die enthaltenen Informationen lesen. Die ursprüngliche Form aber ist verschwun­ den: die Formatierung und Darstellung der Daten ebenso wie so genannte Makros, also die vorein­ gestellten Funktionen von Formularen. Das mag für den Hausgebrauch unerheblich sein, in der Wissenschaft ist das eine fatale Entwicklung. Denn welchen Wert haben Daten noch, wenn sie keiner mehr lesen kann? Siehe die Kolleginnen und Kollegen aus der Sprachwissenschaft: Sie hatten 1993 angefangen, ihre Datenbank zu füttern – auf einer Hardware, die inzwischen obsolet geworden ist. Und moderne Rechner haben sich gegen die alten Daten schlicht verwehrt. Da hilft nur ein Trick: So tun, als ob. Der modernen Technik wird vorgegaukelt, sie sei eigentlich alt. Hardwareemulatoren sind spezielle Anwendungsprogramme, die auf aktuellen Sys­ temen laufen und ein altes System so authen­ tisch wie möglich imitieren. So können die Nutzer langfristig auf die ursprünglich in dem alten ‚‚Niemand will, dass Daten mit einem Millionenaufwand erhoben werden und dann irgendwann nicht mehr ver- gleichbar sind“ System entstandenen Daten zugreifen und mit ihnen arbeiten. „Emulatoren überbrücken den technologischen Abstand zwischen veralteten und heutigen Umgebungen“, erklärt Klaus Rechert, wissenschaftlicher Mitarbeiter in Schneiders Team. Das funktioniert mit jeder Form von Daten, auch mit digitaler Kunst. Prozesse dokumentieren, Umgebungen beschreiben Die Idee der Emulation geht noch weiter. Denn ihren wahren Wert behalten Daten nur, wenn bekannt ist, wie sie entstanden sind. „Nie­ mand will, dass Daten mit einem Millionenauf­ wand erhoben werden und dann irgendwann nicht mehr vergleichbar sind“, sagt Schneider. Dieses „vergleichbar“ ist es, was ihn und seine Mitarbeiter beschäftigt. Wenn beispielsweise Generationen von Doktorandinnen und Dokto­ randen immer mit denselben Daten arbeiten, sind die Abläufe und Werkzeuge doch immer unterschiedlich. Anders angeordnet, neu berech­ net, nach bestimmten Kriterien sortiert – und schon ist von der ursprünglich angelegten Datenform kaum noch etwas übrig. „Das ist wie bei der Flüsterpost: Mit jedem neuen Nutzer, jeder Verfeinerung des Systems geht praktisches Wissen verloren“, erklärt Rechert. Deshalb sei es wichtig, dieses nicht dokumentierte Wissen, diese Arbeit mit den Daten selbst, ebenfalls zu archivieren. Prozesse müssen dokumentiert, Umgebungen genau beschrieben werden, damit die Daten später verifizierbar oder allgemein nutzbar bleiben. Die Datenmetamorphosen sollen dank der Emulatoren nachvollziehbar werden. Das nutzt nicht nur der späteren Reproduzierbarkeit, sondern ist auch dann besonders sinnvoll, wenn Nutzer auf fragwürdige Daten stoßen. „Kennt man deren Entstehungsweg, lässt sich viel 0 0 0 11111 1 1 Überholte Technik, nutzlose Information: Daten, die auf veralteten Computern gespeichert wurden, sind mit aktuellen Modellen oft nicht mehr lesbar. Die Lösung besteht darin, mit Emulatoren alte Systeme auf modernen Rechnern zu imitieren. Fotos (Montage): Carlos Castilla, Maksym Yemelyanov, soundsnaps (alle Fotolia) 17

Pages