Zum Inhalt springen
unterstützt von

Jürgen Hermes, Stephan Schwiebert
Tesla – Ein Labor für Computerlinguisten

Vortragsfolien

Abstract

Das Text Engineering Software Laboratory (Tesla) ist eine Software, die einen virtuellen Laborarbeitsplatz simuliert, an dem Computerlinguisten und andere Wissenschaftler, die sich mit Texten auseinandersetzen, experimentell arbeiten können.

Laboratorien sind bislang eher aus der naturwissenschaftlichen oder medizinischen Forschung bekannt. Sie werden genutzt, um Rohmaterialien zu lagern, Versuchsaufbauten zusammenzustellen und Experimente durchzuführen. Analog sollte ein computerlinguistisches Labor Zugriff auf Rohmaterialien (hier: Texte) anbieten und die Möglichkeit eröffnen, diese Daten in selbst zusammengestellten Versuchsanordnungen (in Form annotierender und analysierender Werkzeuge) zu prozessieren, um im Anschluss die Ergebnisse dieser Prozessierung (d.h. annotierte und analysierte Daten) auswerten zu können.

Tesla realisiert ein solches computerlinguistisches Labor durch ein Client-Server-System, bei dem Clients die Interaktion mit Anwendern übernehmen und die genannten Funktionalitäten anbieten, während der Server für die u.U. ressourcenintensive Prozessierung und die Datenhaltung zuständig ist.

Der Client basiert auf Basis der Plattform Eclipse und bietet zwei verschiedene Perspektiven, die zwei unterschiedliche Anwenderkreise anspricht:

1. In der Entwickler-Perspektive können neue Werkzeuge (Komponenten) für die Prozessierung von Texten entwickelt werden.
2. In der Linguisten-Perspektive können diese Werkzeuge über einen graphischen Workflow-Editor (siehe Abbildung) zu Versuchsanordnungen (Experimenten) kombiniert und konfiguriert werden. Die Experimente werden vollständig dokumentiert; die gewonnenen Erkenntnisse sind dadurch jederzeit reproduzierbar.

Tesla steht unter der Eclipse Public Licence (Open-Source) und kann unter http://tesla.spinfo.uni-koeln.de heruntergeladen werden. Dort finden sich auch weitere Informationen (Tutorials, Dokumentation, Veröffentlichungen) zum System.