Wörterbuchnetz
Homepage des DFG-Projekts  ·  ·  · 
Über das GWB
Bibliographie
Projektskizze
Kontakt & Hilfe

Über das Projekt

Ziel des im Rahmen des DFG-Förderprogramms "Retrospektive Digitalisierung von Bibliotheksbeständen" geförderten Projektes ist die Digitalisierung und elektronische Publikation des bislang ausschließlich in gedruckter Form erstellten und veröffentlichten Goethe-Wörterbuchs im Internet. Ausgestattet mit einer komfortablen und benutzerfreundlichen graphischen Oberfläche, soll das elektronische GWb flexible und innovative Forschungs- und Recherchemöglichkeiten sowohl für die Goethe-Philologie als auch für die deutsche Sprach- und Literaturwissenschaft und alle an Goethe und seiner Zeit Interessierten im In- und Ausland bereithalten. Das elektronische Goethe-Wörterbuch wird erarbeitet vom Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften in Kooperation mit der Interakademischen Kommission für das Goethe-Wörterbuch.

Auf dem Weg zur elektronischen Publikation des GWb im Internet sind im wesentlichen drei Arbeitsschritte durchzuführen:

  1. die retrospektive Digitalisierung der noch nicht in elektronischer Fassung vorliegenden Bände I bis III,
  2. die Auszeichnung der logischen Struktur des Wörterbuchs und seiner Informationseinheiten,
  3. der Import der ausgezeichneten Wörterbuchdaten in eine Datenbank und die Entwicklung einer graphischen Benutzerschnittstelle für die Bereitstellung des GWb im Internet.
Bei allen drei Arbeitsschritten kann unmittelbar auf Erfahrungen zurückgegriffen werden, die in vergleichbaren, ebenfalls am Trierer Kompetenzzentrum durchgeführten Projekten gesammelt wurden. Im Verbund mittelhochdeutscher Wörterbücher, im Digitalen Verbund von Dialektwörterbüchern, vor allem aber bei der elektronischen Publikation des Deutschen Wörterbuchs von Jacob und Wilhelm Grimm auf CD-ROM und im Internet wurden Routinen entwickelt, die - mit Modifikationen - bei der Digitalisierung des GWB eingesetzt werden können.

1. Texterfassung und Korrektur

Da das Goethe-Wörterbuch erst Mitte der 80er Jahre zur elektronischen Datenerfassung übergegangen ist, liegen die Bände I bis III (A - azurn, B - einweisen und einwenden - Gesäusel) noch nicht in elektronischer Form vor. Diese drei Bände werden daher in einem ersten Arbeitsschritt digitalisiert. Wie bei den oben genannten Projekten erfolgt die Erfassung der insgesamt 4380 Spalten mit etwa 43 Millionen Zeichen im double-keying-Verfahren in China. Die Ergebnisse der Doppelerfassung werden anschließend in Trier nach TUSTEP konvertiert und mittels des TUSTEP-Moduls VERGLEICHE einem automatischen Fehlerabgleich unterzogen. Ergebnis dieses Arbeitsschritts ist eine genaue digitale Reproduktion der gedruckten Wörterbuchbände.

2. Auszeichnung in SGML

Um der Komplexität des GWb gerecht zu werden und es in der elektronischen Fassung für wesentlich erweiterte Forschungsmöglichkeiten, Fragestellungen und Benutzerinteressen vorzubereiten, reicht es allerdings nicht aus, eine digitale Reproduktion des Druckwerks anzubieten. Die Daten müssen zusätzlich strukturiert werden, das heißt, die logische Struktur des Wörterbuchs und seiner einzelnen Elemente müssen durch explizite Kennungen ausgezeichnet werden (text encoding oder text markup). Für diese Strukturierung bietet sich die Markup-Sprache SGML (Standard Generalized Markup Language) an, deren Grundgedanke es ist, Informationen in einer hard- und softwareunabhängigen Form dauerhaft für eine Vielzahl von Nutzungen so aufzubereiten, daß ein gezielter Zugriff auf einzelne Informationseinheiten eines Textes möglich ist.

Um die Auszeichnung des GWb in einem angemessenen zeitlichen Rahmen durchführen zu können, wird das Markup weitgehend automatisiert in die elektronischen Wörterbuchdaten eingebracht. Die dafür zu entwickelnden Routinen orientieren sich im wesentlichen an den typographisch-strukturellen Merkmalen des Goethe-Wörterbuchs: Soweit bestimmten Merkmalen oder Merkmalskombinationen eine inhaltlich-funktionale Bedeutung zugewiesen werden kann, werden sie durch geeignete TUSTEP-Routinen automatisch mit SGML-Markierungen versehen.

Die Benutzungsperspektiven und Vorteile eines elektronischen, SGML-basierten Goethe-Wörterbuchs sind folgende:

  • Die Ansichten des digitalen GWb lassen sich variieren: Es kann als elektronisches Gegenstück des Druckwerks, in einer auf die Stichwörter reduzierten Fassung oder in einer Version, die nur das semantische Gliederungssystem wiedergibt, angeboten werden.
  • Es sind Recherchen und Auswertungsmöglichkeiten denkbar, die im gedruckten Wörterbuch wegen des damit verbundenen hohen Arbeits- und Zeitaufwandes nicht durchführbar wären. Vorstellbar sind beispielsweise Auswertungen im Hinblick auf Fragen der Wortbildung, das Erstellen von Werkwörterbüchern auf der Grundlage spezieller Siglenabfragen oder Untersuchungen zu Aspekten der zeitgebundenen Verwendung bestimmter Wörter.
  • Möglich ist auch die Vernetzung mit anderen Dokumenten: So ist die Verknüpfung des elektronischen GWb mit dem digitalen Deutschen Wörterbuch, das Wolfgang Schadewaldt in seiner Einführung zum ersten Band des GWb als dessen "ältere Schwester" bezeichnet hat, bereits in Vorbereitung.
  • Eine SGML-Datenbasis ist ständig aktualisierbar und dem Benutzer schneller zugänglich zu machen als das Druckwerk.
  • Aus ein und derselben SGML-Datenbasis können unterschiedliche Endprodukte hergestellt werden, so kann sie Ausgangsbasis für eine Druckfassung ebenso wie für eine CD-ROM-Version oder - wie im Fall des GWB - für eine Internetversion sein.

3. Datenbankimport und Entwicklung einer graphischen Benutzerschnittstelle

Für die Publikation des GWb im Internet wird zunächst eine aus den SGML-kodierten Wörterbuchdaten gespeiste Datenbank aufgebaut, über die der Datenbestand des Wörterbuchs abgefragt werden kann. Durch die Differenziertheit der SGML-Kodierung können auf einzelne Artikelpositionen beschränkte Suchmöglichkeiten angeboten werden, die weit über eine einfach Volltextsuche hinausgehen. Diese Möglichkeiten müssen bei der Entwicklung der Internetoberfläche berücksichtigt werden, die dem Benutzer nicht nur eine benutzerfreundliche Navigation durch das GWb, sondern durch die Anbindung an die Datenbank auch ein komfortables strukturiertes Recherchieren über den gesamten Datenbestand des Wörterbuchs erlauben wird.