Stuttgarter unikurier
Nr. 89 April 2002 |
Erster Transferbereich der DFG in den Geisteswissenschaften an der Uni Stuttgart:
Computerlinguisten erleichtern Herstellung elektronischer Wörterbücher |
Fördergelder für den Know-how-Transfer von der Forschung in die Wirtschaft zu erhalten, ist für die geisteswissenschaftlichen Disziplinen nicht gerade leicht. Umso erfreulicher ist es, dass der erste Transferbereich der Deutschen Forschungsgemeinschaft (DFG) in den Geisteswissenschaften an die Universität Stuttgart vergeben wurde. Techniken aus der Computerlinguistik, die seit Jahren in einem Sonderforschungsbereich der Universitäten Stuttgart und Tübingen erarbeitet wurden, werden jetzt im konkreten Arbeitsumfeld getestet. Ergebnis soll eine Software sein, die dem Wörterbuchredakteur Routinearbeit abnimmt und seine Entscheidung auf eine breite Materialbasis stellt. Im Januar diesen Jahres wurde das Projekt am Institut für Maschinelle Sprachverarbeitung (Computerlinguistik) der Öffentlichkeit vorgestellt.
|
|
|
|
Wörterbücher müssen ständig aktualisiert und vervollständigt werden, und so sind die Wörterbuchredakteure immer auf der Suche nach neuen Wörtern, Bedeutungen und Wortkombinationen. Diese aufwändige Arbeit soll nun eine neue, von den Stuttgarter Computerlinguisten erstellte Software erleichtern. Ziel des Projekts, an dem die Wörterbuchverlage Langenscheidt (München) und Brockhaus (Duden) in Mannheim beteiligt sind, ist es, die Suche nach dem Datenmaterial schneller und einfacher zu gestalten, die Entscheidung der Redakteure auf eine breitere Materialbasis stellen zu können und neue Perspektiven für neue Wörterbuchprodukte zu eröffnen, so Prof. Dr. Christian Rohrer vom Institut für Maschinelle Sprachverarbeitung der Universität Stuttgart.
Die Stuttgarter Wissenschaftler haben bereits intensive Erfahrungen bei der Entwicklung von Programmen, die große Textmengen lesen und auch nach bestimmten grammatikalischen oder lexikalischen Kriterien sortieren können. Komplette Zeitungsjahrgänge, Millionen von Wörtern sind so elektronisch erfaßbar. Die Entscheidung der Redakteure, welches Wort aufgenommen wird, entfallen kann oder eventuell noch eine neue Bedeutung gewonnen hat, fußt nun auf einer viel breiteren Materialbasis: Welche Bedeutung kommt heute dem Wörtchen „Maus“ zu und was hat sich im täglichen Sprachgebrauch mehr eingebürgert, die e-Mail oder das e-Mail?
|
Partner
im ersten geisteswissenschaftlichen Transferbereich
der DFG sind (von links)
Prof. Christian Rohrer vom Institut für Maschinelle
Sprachverarbeitung der Uni Stuttgart,
Dr. Esther Debus-Gregor von Langenscheidt und Dr.
Werner Scholze-Stubenrecht von der
Dudenredaktion in Mannheim. (Foto: Haas) |
Umsetzbarkeit für Macher und Nutzer
Besonders wichtig für Dr. Esther Debus-Gregor von Langenscheidt ist die Umsetzbarkeit der Ergebnisse für Macher und Nutzer. Gerade die Pflege und Neuerstellung zweisprachiger Wörterbüchern mache viel Arbeit, wenn zudem die Aktualisierungsrhythmen immer kürzer werden. Hilfe durch die Wissenschaftler erhofft sich auch Dr. Werner Scholze-Stubenrecht von der Dudenredaktion in Mannheim, denn: „Der Kontext der Wörter ist wichtig, aber mit einer normalen Volltextsuche wird man erschlagen“, weiß er aus der Praxis, und freut sich, dass bei diesem Projekt zusammen mit Fachleuten gearbeitet wird, die später damit täglich zu tun haben.
Innerhalb des Transferbereichs „Automatische Exzerption: Corpusbasierte Materialbeschaffung für die Lexikographie“ der Deutschen Forschungsgemeinschaft werden diese „linguistischen Extraktionswerkzeuge“ nun in den Dienst der Wörterbuchredaktionen von Duden und Langenscheidt gestellt und von der DFG mit 500.000 Euro unterstützt. Die Verlagsvertreter versprechen sich viel von dem Projekt und sind daran interessiert, möglichst schnell Ergebnisse zu sehen.
Julia
Alber/zi
KONTAKT
Prof. Dr. Christian Rohrer, Dr. Ulrich Heid, Institut für Maschinelle Sprachverarbeitung, Fachrichtung Computerlinguistik, Azenbergstr. 12, 70174 Stuttgart,
Tel. 0711/121-1364, -1373,
Fax 0711/121-1366,
e-mail: rohrer@ims.uni-stuttgart.de,
uli@ims.uni-stuttgart.de
sowie
www.ims.uni-stuttgart.de/projekte/TFB/projekt..html
|
|