#DHd2024 - „Zukunft der Wissenschaft mitgestalten“

Welche Potentiale stecken in großen Sprachmodellen für die Geisteswissenschaften? 488 Fachvertreter*innen diskutierten in Passau unter anderem über diese Frage.

04.03.2024|

Foto: Netzwerk für Digitale Geisteswissenschaften an der Universität Potsdam.

Vor zehn Jahren sorgten sich die Digitalen Geisteswissenschaften noch vor der feindlichen Übernahme durch die Informatik. Im Februar 2024 stellt Malte Rehbein, Professor für Digital Humanities, im Audimax der Universität Passau die Frage: Sollten die Digitalen Geisteswissenchaften überhaupt noch so heißen, oder sind nicht inzwischen alle Geisteswissenschaften digital?

448 Vertreterinnen und Vertreter des Fachs, darunter auch Mitglieder des Verbands „DHd – Digital Humanities im deutschsprachigen Raum“, sind Ende Februar zur Tagung „Quo Vadis Digital Humanities?“ nach Passau gekommen, um darüber zu diskutieren, wo das Fach in einer technologisierten Welt steht. Präsident Prof. Dr. Ulrich Bartosch begrüßte in einem gut gefüllten Audimax die Teilnehmenden, die aus dem gesamten deutschsprachigen Raum anreisten, darunter aus Österreich, der Schweiz und Luxemburg. Weitere 40 Teilnehmende waren digital zugeschaltet. Die Digitalen Geisteswissenschaften spielten gerade in einer Zeit, in welcher der technologische Fortschritt den wissenschaftlichen Erkenntnisprozess in einer ungekannten Schnelligkeit verändere, eine große Rolle. „Danke, dass Sie die Zukunft der Wissenschaft mitgestalten“, so Prof. Dr. Bartosch.

Passau feierte als Austragungsort ein kleines Jubiläum. Denn hier fand 2014 die erste Fachkonferenz statt. Initiiert hatte sie Prof. Dr. Rehbein mit seinem damals neu eingerichteten Lehrstuhl für Digital Humanities. Groß war denn auch seine Freude, dass es ihm gelang, die Konferenz zum zehnjährigen Jubiläum wieder nach Passau zu holen.

Prof. Dr. Rehbeins Lehrstuhl war im Zuge der Technik Plus Ausbauphase der Universität Passau geschaffen worden. Seither ist der Bereich der Digital Humanities an der Universität Passau gewachsen, jüngst etwa auch in Zusammenhang mit der Hightech Agenda Bayern, in deren Rahmen unter anderem der Lehrstuhl für Multilinguale Computerlinguistik eingerichtet wurde. Lehrstuhlinhaber Prof. Dr. Johann-Mattis List verstärkt nun digitale Ansätze in den Geisteswissenschaften an der Universität Passau. Sein Lehrstuhl half auch bei der Organisation der Konferenz mit.

Was hat sich außerdem in den vergangenen zehn Jahren getan? „Large Language Models“, große Sprachmodelle, haben einen enormen Entwicklungsschub verzeichnet. Darunter versteht man leistungsstarke neuronale Netze, die mit riesigen Datenmengen trainiert werden, um natürliche Sprache zu analysieren und selbst zusammenhängende Texte generieren können. Mittlerweile schreibt die Maschine besser als der Mensch. Ein Beispiel für ein solches Sprachmodell ist GPT-4, das hinter ChatGPT steckt.

Mit großen Sprachmodellen Sprachen erforschen

Auch am Passauer Lehrstuhl für Multilinguale Computerlinguistik experimentiert man damit. Dr. Jessica Nieder, wissenschaftliche Mitarbeiterin, sieht in diesen großen Sprachmodellen viel Potential für die eigene Disziplin: „Große Sprachmodelle helfen uns dabei, grammatische Strukturen festzustellen, vielleicht auch neue Sprachen zu entdecken, aber auch einfach dabei, die Sprachen genauer untersuchen zu können", erklärt sie.

Mit der Analyse menschlicher Sprache befasst sich auch Informatikerin Ramona Kühn. In ihrer Doktorarbeit im Rahmen der BMBF-Nachwuchsforschungsgruppe CAROLL an der Universität Passau, deren Thema sie auf der Konferenz vorstellte, sucht sie nach Wegen, um Maschinen das Verständnis rhetorischer Figuren beizubringen.

KI-Nachwuchsforschungsgruppe CAROLL: Rhetorik-geschulte Algorithmen gegen Hass im Netz

Algorithmen, wie sie Aristoteles gefallen hätten: Ein Team der Universität Passau trainiert Künstliche Intelligenz mit Erkenntnissen aus der Jahrtausende alten Kunst der Rhetorik. Dieses KI-System könnte sowohl versteckte beleidigende Sprache im Netz erkennen, als auch das juristisch bessere Argument.

Maschinen, die Sarkasmus verstehen

So will sie die Sprachmodelle in die Lage versetzen, Hate Speech und Fake News im Internet zu erkennen. „Denn häufig wird da mit Sarkasmus oder Ironie gearbeitet“, sagt sie und hat ein Beispiel mitgebracht: „So schnell wie eine Schnecke.“ Die Maschine würde die Ironie noch nicht erkennen, sondern aus „schnell“ folgern, dass der Satz positiv gemeint sei. Dass Schnecken aber eigentlich langsam sind, müsse man der Maschine beibringen.

Große Sprachmodelle könnten zwar bereits viel, aber sie seien noch nicht besonders gut darin, rhetorische Figuren zu erkennen, insbesondere auch in Sprachen abseits des Englischen. Um das zu ändern, hat Kühn in ihrer Dissertation eine deutschsprachige Ontologie entwickelt, also eine formal geordnete Darstellung von Begriffen und Vorgaben für rhetorische Figuren, mit der die Maschine arbeiten könne. Die Nachwuchsforschungsgruppe CAROLL an der Universität Passau ist damit in diesem Forschungsbereich führend. Leiterin Dr. Jelena Mitrović hatte mit "RetFig" als erste eine Ontologie rhetorischer Fragen für die serbische Sprache erstellt. Dieses dient als Basis für die Arbeit Ramona Kühns und anderer:

Der Einsatz von Sprachmodellen war eines von vielen Themen auf der dreitätigen Konferenz, die insgesamt 19 Workshops, 43 Vorträge, 64 Poster, 7 Panels, 11 Vorträge im Doctoral Consortium, einen Posterslam, eine Fisbowl Podiumsdiskussion zum Konferenzthema „Quo Vadis Digital Humanities“ und zwei Keynotes umfasste. Maßgeblich organisiert wurde die Konferenz von Dr. Thomas Haider, wissenschaftlicher Mitarbeiter am Lehrstuhl für Digital Humanities: „Die DHd2024 war ein voller Erfolg, und wir freuen uns über die vielen Teilnehmer:innen in Passau. Die Tagungen des Verbands DHd stellen stets einen produktiven Ort dar, an dem Forscher:innen aus dem Bereich der Informatik und Geisteswissenschaften die Identität des Fachs aushandeln. Neben anderen Konferenzen wie der weltweiten 'Alliance of Digital Humanities Organizations'-Konferenz ist die DHd zu einer der bedeutendsten Plattformen für die digitalen Geisteswissenschaften geworden.“

Die Keynote hielt Marco van Leeuwen, Professor für historische Soziologie und Sozialwissenschaften an der Utrecht University, der historische Registerdaten und Berufsbilder computergestützt auswertet, um herauszufinden, inwiefern in historischen Gesellschaften sozialer Aufstieg möglich war. Zum Abschluss der Konferenz sprach Prof. Michaela Mahlberg, PhD, von der University of Birmingham. Sie setzt computergestützte, quantitativ-linguistische Methoden ein, um riesige Textkorpora im Hinblick auf die soziale Funktion von Sprache zu untersuchen.

Impressionen auf Social Media

Die Vielfalt des Fachs zeigte sich auch in den Beiträgen unter dem Hashtag #DHd2024 auf Social Media - vom digitalen Kulturerbe über automatische Texterkennung und Medienarchäologie bis hin zum computergesteuerten Puppentheater. Der Hauptkanal der diesjährigen Konferenz befand sich auf Mastodon. Links im Bild freut sich der zweite Verbandsvorsitzende Christof Schöch über die rege Aktivität der Teilnehmenden auf dem Microblogging-Dienst.

Auch vor zehn Jahren waren die Teilnehmenden bereits auf Social Media sehr aktiv, damals noch auf Twitter unter dem Hashtag #DHd2014.

Themenseite

Generative Sprachmodelle haben disruptive Auswirkungen. An der Universität Passau untersuchen Forschende interdisziplinär die technischen, gesellschaftlichen, ethischen und rechtlichen Folgen.

Mehr Informationen

Prof. Dr. Johann-Mattis List

forscht zu Computergestütztem Sprachvergleich und Multilingualer Computerlinguistik

Wie kann man die mehr als 6000 Sprachen der Welt vergleichen und wie helfen Computermethoden dabei?

Der Sprachwissenschaftler Prof. Dr. Johann-Mattis List hat seit Januar 2023 den Lehrstuhl für Multilinguale Computerlinguistik an der Universität Passau inne und leitet die ERC-Forschungsgruppe „ProduSemy“. Davor war er unter anderem Vertretungsprofessor an der Universität Bielefeld, leitender Wissenschaftler am Max-Planck-Institut für Evolutionäre Anthropologie in Leipzig und am Max-Planck-Institut für Menschheitsgeschichte in Jena, wo er ebenfalls eine ERC-geförderte Forschungsgruppe zum computergestützten Sprachvergleich leitete. Er promovierte an der Heinrich Heine Universität Düsseldorf und schrieb seine Habilitation an der Friedrich-Schiller-Universität Jena.

Prof. Dr. Malte Rehbein

forscht zu Digital Humanities

Wie können historische Quellen digitalisiert und computergestützt ausgewertet werden?

Prof. Dr. Malte Rehbein ist seit 2013 Inhaber des Lehrstuhls für Digital Humanities an der Universität Passau. Er ist Vorstandsmitglied der Digital Humanities im deutschsprachigen Raum und engagiert sich unter anderem im wissenschaftlichen Beirat des Deutschen Museums.

#DHd2024 - „Zukunft der Wissenschaft mitgestalten“

KI-Nachwuchsforschungsgruppe CAROLL: Rhetorik-geschulte Algorithmen gegen Hass im Netz

Generative Sprachmodelle in der Forschung

Mehr Informationen

Prof. Dr. Johann-Mattis List

Prof. Dr. Malte Rehbein

Mehr zum Thema

#DHd2024 - Wie geht es weiter mit den Digital Humanities?

#DHd2024 - „Zukunft der Wissenschaft mitgestalten“

Passauer Studie zeigt: ChatGPT schreibt die besseren Schulaufsätze