Janis Pagel, Nils Reiter, Ina Rösiger und Sarah Schulz
Annotation als flexibel einsetzbare Methode
Zusammenfassung: In der Computerlinguistik (CL) wird Annotation mit dem Ziel
eingesetzt, Daten als Grundlage für maschinelle Lernansätze und Automatisie-
rung zu sammeln. Gleichzeitig nutzen Geisteswissenschaftler Annotation in Form
von Notizen beim Lesen von Texten. Wir behaupten, dass mit der Entwicklung der
Digital Humanities (DH) die Annotation zu einer Methode geworden ist, die als
Mittel zur Unterstützung der Interpretation und Entwicklung von Theorien einge-
setzt werden kann. In diesem Beitrag zeigen wir, wie diese verschiedenen Annota-
tionsziele in einem einheitlichen Workflow abgebildet werden können. Wir reflek-
tieren die Komponenten dieses Workflows und geben Beispiele, wie Annotation
im Rahmen von DH-Projekten einen Mehrwert schaffen kann.
Abstract: In computational linguistics (CL), annotation is used with the goal of
compiling data as the basis for machine learning approaches and automation. At
the same time, in the Humanities scholars use annotation in the form of note-
taking while reading texts. We claim that with the development of Digital Human-
ities (DH), annotation has become a method that can be utilized as a means to
support interpretation and develop theories. In this paper, we show how these
different annotation goals can be modeled in a unified workflow. We reflect on
the components of this workflow and give examples for how annotation can con-
tribute additional value in the context of DH projects.
1 Einführung
Unter Annotation verstehen wir eine Methode, um Textdaten mit zusätzlichen Da-
ten anzureichern. Diese zusätzlichen Daten sind an mehr oder weniger klar abge-
grenzte Textstellen gebunden. Im Sprachgebrauch changiert der Begriff ‚Annota-
tion‘ zwischen einer Bezeichnung für einen Prozess und dessen Ergebnis. In die-
sem Artikel liegt unser Fokus auf der Methode, und nicht auf den erstellten An-
notationen als Datenobjekt oder Analysegegenstand. Wir konzentrieren uns zu-
Anmerkung: Dieser Beitrag ist eine übersetzte und überarbeitete Fassung von: Janis Pagel, Nils
Reiter, Ina Rösiger und Sarah Schulz (2018). „A Unified Text Annotation Workflow for Diverse
Goals“. In: Proceedings of the Workshop for Annotation in Digital Humanities (annDH). Sofia, Bul-
garien, S. 31–36. URL: http://ceur-ws.org/Vol-2155/pagel.pdf (besucht am 1. Juni 2020)
Janis Pagel, Nils Reiter, Ina Rösiger, Sarah Schulz, Institut für Maschinelle Sprachverarbeitung,
Universität Stuttgart
Open Access. © 2020 Janis Pagel, Nils Reiter, Ina Rösiger und Sarah Schulz; publiziert von De Gruyter
Dieses Werk ist lizenziert unter der Creative Commons Attribution-NonCommercial-NoDerivatives
4.0 International Lizenz.
https://doi.org/10.1515/9783110693973-006