Das CLARIN-Servicezentrum des Zentrums Sprache an der BBAW

Das CLARIN-Servicezentrum des Zentrums Sprache an der BBAW



Erweiterungen des Deutschen Textarchivs

Digitale Forschungsdaten von Texten des späten 16. bis frühen 20. Jahrhunderts können über das Zentrum Sprache der BBAW veröffentlicht werden. Der Rahmen für die Veröffentlichung ist das Modul DTA-Erweiterungen (DTAE), d.h. die Daten werden Auf diese Weise können sie der wissenschaftlichen Nachnutzung in anderen Kontexten zur Verfügung gestellt und im Zusammenhang mit anderen Sprachkorpora des DTA auswertbar gemacht werden.

Voraussetzungen für die Aufnahme von Texten in das Modul DTAE

Aus inhaltlicher Sicht

Geeignete Ergänzungen des DTA stellen Primärquellen dar, die umfangreich rezipiert wurden, Schlüsseltexte innerhalb wichtiger Diskurse oder für einzelne Epochen darstellen oder auf andere Weise eine heutige wissenschaftliche Bearbeitung rechtfertigen.

Idealerweise sollten die Ergänzungen im Zeitraum vom späten 16. bis zum frühen 20. Jahrhunderts entstanden sein, wobei ein leichter Spielraum über diese zeitlichen Grenzen hinaus vorhanden ist.

Aus technischer Sicht:

Die den Texten zugrunde liegenden Bildquellen sollten in hoher Bildqualität und möglichst im unkomprimierten TIFF-Format verfügbar und weiterverwendbar sein. Der Annotation der Volltexte sollten das DTA-Basisformat (DTABf) oder mit dem DTABf kompatible Richtlinien zugrunde liegen.

Das CLARIN-Zentrum der BBAW leistet Unterstützung bei der Planung und Durchführung von Digitalisierungsprojekten, insbesondere bei den folgenden Aufgaben:

  • Bilddigitalisierung
    Das DTA kooperiert mit verschiedenen Bibliotheken, deren Sammelschwerpunkte bei deutschen Drucken des 17. bis frühen 20. Jahrhunderts liegen. Für Digitalisierungsarbeiten kann ein Kontakt hergestellt werden.
  • Erfassung der Metadaten
    Sowohl bibliographische als auch spezifische Daten zum digitalen Faksimile sowie zur Texterfassung sind notwendig. Für die grundlegenden Metadaten zum Text stellt das DTA eine spezielles Formular zur komfortablen Erstellung eines basisformatkonformen TEI-Headers zur Verfügung.
  • Volltextdigitalisierung
    Das DTA kann die Digitalisierung von Texten entsprechend den DTA-Richtlinien übernehmen oder diesen Arbeitsschritt beratend unterstützen. Für die Texterfassung und Annotation bietet das DTA-Basisformat ausführlich beschriebene Richtlinien und Schemata. Ein Framework für den Author-Mode des oXygen-XML-Editors bietet zusätzliche Unterstützung bei der Transkriptions- und Annotationsarbeit unter Anwendung der DTA-Richtlinien.


DTAE-Checkliste

Folgende Informationen werden für die Veröffentlichung eines Textes im DTA erhoben:

Allgemeine Informationen zu den Dokumenten

  • Kurzbeschreibung der Textauswahl
  • Zeitraum der Texte
  • Sprache
  • Textsorte(n)/Genre
  • Diskurs
  • gedruckt/handschriftlich
  • vollständig/in Auszügen
  • Umfang

Allgemeines zum DTAE-Projekt

  • Zeitrahmen des DTAE-Projekts
  • Partner
  • Webseite des Kooperationspartners
  • Zeitrahmen des zugrundeliegenden Projekts
  • Ansprechpartner/in
  • Kontaktdaten

Volltext

  • vorhanden j/n
  • Ausgabe
  • Metadaten vorhanden j/n
  • Metadatenformat
  • Erfassungsverfahren
  • Digitalisierungsdienstleister
  • Erfassungsqualität
  • Erfassungsrichtlinien DTA-kompatibel?
  • Abweichungen von den DTA-Erfassungsrichtlinien
  • Textannotation mit XML?
  • Regeln für die Textauszeichnung?
  • Textannotation mit TEI?
  • TEI-Dialekt
  • Aufwand Überführung in das DTA-Basisformat
  • Rechte

Bilder

  • vorhanden j/n
  • besitzende Bibliothek - Signatur
  • Format
  • Rechte

geplante Publikation

  • Publikation durch den Projektpartner?
  • Publikation in DTAE erwünscht & möglich?
  • ggf. Unterschied zwischen beiden Publikationen
  • statisches oder dynamisches Korpus?
  • geplante Erweiterungsoptionen

Weiteres

  • DTAE - vorgesehene Arbeiten
  • Projektstatus

Aus diesen Informationen speisen sich auch die minimalen Metadaten eines digitalisierten Textes im DTA.