DANTE 2017 – Tag 3 – Geisteswissenschaften
Andreas Dafferner von der Heidelberger Akademie der Wissenschaften hielt einen Vortrag über die Digitalisierung von Kirchenordnungen aus dem 16. Jahrhundert. Das Ziel ist, sie online verfügbar zu machen. Es handelt sich um 30 alte Bände mit ca. 18.000 Seiten, die in einem Jahr digitalisiert werden sollen. 99,9% Genauigkeit ist der Anspruch, was Nachkorrigieren erfordert. Am Ende soll ein Buch entstehen und es ebenfalls online als PDF veröffentlicht werden. Ein Gesamtindex soll produziert werden.
Der Workflow wurde als Grafik gezeigt: von Scannen mit 600 dpi in TIFF über einen Roboscanner, Texterkennung durch OCR, XML-Aufbereitung mit PoCoTo (Post-Correction-Tool), Erzeugung von TXT und dann Verwendung von LaTeX und Xindy für das Generieren von PDF-Datei und Index. Es wurde Perl zur Erzeugung von Index-Daten verwendet sowie eine angepasste Xindy Stildatei, mit LuaLaTeX wurden dann PDF und Index mit 3 Ebenen ausgegeben.
Annette von Stockhausen von der Friedrich-Alexander Universität Erlangen-Nürnberg (FAU) stellte anschließend Werkzeuge und LaTeX-Pakete vor, mit der eine Druckvorlage für ca. 270 spätantike Texte erstellt wird. Konkret sind das vorwiegend altgriechische und lateinische Texte, aber auch armenische, koptische, syrische (RTL), die in einer kritischen Edition herausgegeben werden. Das sind die sog. “Dokumente zur Geschichte des arianischen Streites” (Athanasius Werke Bd. 3). Sie enthalten theologische Diskussionen aus dem 4. Jahrhundert. Mangels Originalen gibt es ganz verschiedene Arten der Überlieferungen aus der Zeit zwischen 318 bis zum 7. Jahrhundert.
Jeder Text wird umfassend editiert und enthält
- Einleitung mit Datierung, Art der Überlieferung, Kontext
- Kritischer Text (Rekonstrukt) mit Übersetzung in zwei Spalten
- Kommentare, Nachweise, Parallelstellen (Verweise), textkritischen Apparat
Man kann sich denken, dass es ein kompliziertes Layout ergibt. Man kann sich das wie einen mehrspaltigen Text mit mehreren Ebenen von Fußnoten vorstellen, plus Index.
Zunächst wurde der Classical Text Editor (CTE) verwendet. Heute benutzt man LaTeX mit reledmac, wegen hoher Verlässlichkeit und für bessere Druckergebnisse. Theologen und Altphilologen, die sonst eher mit Word arbeiten, stiegen hierfür auf LaTeX um. Gründe:
- reledmac kann sehr komplettes Layout erzeugen
- sehr gutes Druckergebnis
- weniger Layoutfehler
- plain Text mit Versionierung möglich (Gitlab)
- modulares Arbeiten
- plattformübergreifend
Primäres Ziel ist Druckausgabe, evtl. auch Weiterverarbeitung jenseits von PDF (TEI-Format: Text Encoding Initiative).
Gearbeitet wird mit reledmac, reledpar, das Layout mit memoir erzeugt, Teildokumente durch Masterdatei übersetzt, mit Selbstbeschränkung auf feste Menge semantischer Befehle. Eine eigene Dokumentklasse stellt selbst-definierte Umgebungen und Makros bereit. XeLaTeX läuft mit Docker-Image und Gitlab-Server. Neben klassischem Index werden mit dem Paket glossaries Glossare von Namen, Orten und Synoden erzeugt.
All das ist möglich durch großartige Pakete und Klassen wie reledmec von Maïeul Rouquette und memoir von Peter Wilson und die grundlegende Arbeit vieler weiterer TeX-Entwickler.
Dr. Martin Fechner von der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) stellte eine Arbeitsumgebung für Digitale Editionen der BBAW vor: mit Webausgabe, Druckausgabe, Kollaboration, Zwischenkontrolle mit Blick auf Anwenderfreundlichkeit. Die Umgebung nennt sich ediarium, und ist eher als Werkzeugkasten zu verstehen. Es basiert auf TEI-XML (Text Encoding Initiative).
Die Daten liegen in einer eXist-db XML-Datenbank, mit Oxygen XML werden die Daten bearbeitet, Anbindung an die Datenbank via WebDAV. Die PDF-Druckausgabe wird mit ConTeXt erzeugt, die Webseite mit REST/XQuery/XSLT aus eXist-db.
Die Arbeitsumgebung wird in mehreren aktuellenn Projekten eingesetzt.
Für kritische Editionen gibt es hohe Anforderungen an Layout im Druck, wie
- Verarbeitung von XML
- Mehrspaltigkeit
- nummerierten Zeilen
- mehreren getrennten Apparaten (sogar verschachtelt)
- Register
ConTeXt wurde gewählt, da es aus einer Hand kommt, und doch viele Funktionen bietet. Es sind keine Zusatzpakete nötig. Dank Lua kann vieles einfach angepasst werden.
Auf http://www.bbaw.de/telota/software/ediarum findet man weitere Informationen zu Hintergrund und Einsatz sowie Downloads.