Zum Inhalt springen

Eine Sprache mit Hand hat meist auch Fuß

In einer Studie, die im Nature-Journal "Scientific Reports" erschienen ist, haben Linguistinnen und Linguisten der Universität Passau und des Max-Planck-Insituts für evolutionäre Anthrophologie in Leipzig Ausdrücke für Körperteile in 1028 Sprachen verglichen.

Menschliche Körper sind gleich aufgebaut. Aber wie wir den Körper in seine Teile in unserer jeweiligen Sprache aufteilen und benennen, unterscheidet sich. So hat das Deutsche zwei Wörter für Fuß und Bein, während andere Sprachen diese Begriffe in einem Wort ausdrücken. Solche und andere Unterschiede im Vokabular für Körperteile in verschiedenen Sprachen beschäftigen Forschende im Bereich der Sprachwissenschaft, der Anthropologie und der Psychologie seit Jahren. Ähnlich wie bei den Grundsätzen, die für den semantischen Bereich der Farbe entwickelt wurden, haben sie allgemein gültige Regeln identifiziert und kulturspezifischen Variationen gegenübergestellt. Das Aufkommen neuer computergesteuerter Methoden in der Netzwerkanalyse ermöglicht es nun, groß angelegte Vergleiche des Wortschatzes in bestimmten semantischen Domänen durchzuführen, um allgemein gültige und kulturelle Strukturen zu untersuchen.

Prof. Dr. Johann-Mattis List, der an der Universität Passau den Lehrstuhl für Multilinguale Computerlinguistik innehat, gehört zu den Forschenden, die Algorithmen entwickeln, um die Frage zu untersuchen, wie Menschen ihren Wortschatz in verschiedenen Sprachen bilden. Er schloss sich Forschenden der Abteilung für Sprach- und Kulturevolution am Max-Planck-Institut für evolutionäre Anthropologie in Leipzig an, die in einer Studie den Wortschatz von Körperteilen in 1.028 Sprachen verglichen. Die Studie mit dem Titel „Universal and cultural factors shape body part vocabularies“ ist im renommierten Nature-Journal „Scientific Reports“ erschienen.

Sprachen unterscheiden sich in der Benennung von Körperteilen

Beispiel einer Sprachprobe der Studie und der Wörter für Arm/Hand und Bein/Fuß in Englisch und Wolof. Illustration: Dr. Annika Tjuka/MPI-EVA

„Obwohl unsere Körper ähnlich aufgebaut sind, unterscheiden sich die Sprachen darin, wie sie den Körper unterteilen und diese Teile benennen“, sagt Annika Tjuka, ehemalige Doktorandin bei Prof. Dr. List und jetzt Postdoc am MPI-EVA, die die Studie initiiert und durchgeführt hat. „Im Englischen haben wir ein Wort für Arm und ein anderes für Hand, aber Wolof, eine Sprache, die im Senegal in Westafrika gesprochen wird, verwendet ein Wort, loxo, um beide Körperteile zu bezeichnen. Alle Sprecherinnen und Sprecher haben eines gemeinsam: einen menschlichen Körper. Warum also unterscheiden sie sich darin, welchen Teilen sie eindeutige Namen geben?“

Die Ergebnisse bestätigen eine der Regeln, wonach es ein eigenes Wort für Fuß gibt, wenn auch eines für Hand existiert. Aber die Ergebnisse zeigen auch, dass ein Körperteil, das mit einem anderen verbunden ist, mit größerer Wahrscheinlichkeit ein und denselben Namen hat. Ein Grund für dieses Muster ist, dass sich Sprachen wie Wolof auf die Funktionen konzentrieren, die zwei Teile miteinander verbinden. Die Sprecherinnen und Sprecher wissen, dass wir einen Ball mit unserer Hand und unserem Arm werfen oder dass wir mit unserem Bein und unserem Fuß gehen. Sprachen wie das Deutsche hingegen konzentrieren sich auf visuelle Hinweise wie das Handgelenk oder den Knöchel, um Teile voneinander zu trennen.

Themenseite

Generative Sprachmodelle haben disruptive Auswirkungen. An der Universität Passau untersuchen Forschende interdisziplinär die technischen, gesellschaftlichen, ethischen und rechtlichen Folgen.

Das Vokabular für Körperteile variiert von Sprache zu Sprache. Innerhalb dieser Vielfalt zeichnen sich jedoch allgemeine Tendenzen ab. „Um die Faktoren zu verstehen, die die sprachliche Vielfalt prägen, brauchen wir mehr Daten. Wir müssen die Sprachen dokumentieren, die in Gebieten mit einer hohen Sprachenvielfalt gesprochen werden. Und wir müssen Daten über den soziologischen Kontext sammeln, in dem diese Sprachen gesprochen werden, sammeln", sagt Dr. Tjuka.

Große Sammlung von Wortlisten für alle Sprachen der Welt

Für die aktuelle Studie verwendete das Team der Sprachwissenschaftlerinnen und -wissenschaftlern eine bestehende Datenbank, Lexibank, die Forschende am MPI-EVA in Leizpig und des Passauer Lehrstuhls für Multilinguale Computerlinguistik entwickeln. Dabei handelt es sich um eine große Sammlung von Wortlisten für alle Sprachen der Welt. Mit einem rechnergestützten Ansatz extrahierten die Passauer und Leipziger Forschenden die Wörter für 36 Körperteile in all diesen Sprachen und analysierten die Beziehungen zwischen den Wörtern in einer Netzwerkanalyse. „Wir haben mehrere Jahre gebraucht, um die Daten in der Lexibank-Sammlung zusammenzutragen“, sagt Professor List, der früher als leitender Forscher am MPI-EVA in Leipzig tätig war. „Jetzt können wir beginnen, die Daten auf verschiedene Weise zu analysieren.“

Professor List leitet die ERC-geförderte Forschungsgruppe „ProduSemy“ an der Universität Passau. Zusammen mit seinem Forschungsteam nutzt er die Datenbank auch, um zu verstehen, wie sich Wortfamilien in verschiedenen Sprachen bilden.

Prof. Dr. Johann-Mattis List

forscht zu Computergestütztem Sprachvergleich und Multilingualer Computerlinguistik

Wie kann man die mehr als 6000 Sprachen der Welt vergleichen und wie helfen Computermethoden dabei?

Wie kann man die mehr als 6000 Sprachen der Welt vergleichen und wie helfen Computermethoden dabei?

Der Sprachwissenschaftler Prof. Dr. Johann-Mattis List hat seit Januar 2023 den Lehrstuhl für Multilinguale Computerlinguistik an der Universität Passau inne und leitet die ERC-Forschungsgruppe „ProduSemy“. Davor war er unter anderem Vertretungsprofessor an der Universität Bielefeld, leitender Wissenschaftler am Max-Planck-Institut für Evolutionäre Anthropologie in Leipzig und am Max-Planck-Institut für Menschheitsgeschichte in Jena, wo er ebenfalls eine ERC-geförderte Forschungsgruppe zum computergestützten Sprachvergleich leitete. Er promovierte an der Heinrich Heine Universität Düsseldorf und schrieb seine Habilitation an der Friedrich-Schiller-Universität Jena.

ERC-Forschungsgruppe „ProduSemy“: Mit Algorithmen der Evolution von Wortfamilien auf der Spur

ERC-Forschungsgruppe „ProduSemy“: Mit Algorithmen der Evolution von Wortfamilien auf der Spur

Von „Elle“, „Bogen“ und „Gesell“ zu „Ellbogengesellschaft“: Eine neue ERC-geförderte Forschungsgruppe an der Universität Passau unter der Leitung von Prof. Dr. Johann-Mattis List untersucht mit Hilfe von computergesteuerten Modellen ein Thema, über das die Sprachwissenschaft wenig weiß.

Beim Anzeigen des Videos wird Ihre IP-Adresse an einen externen Server (Vimeo.com) gesendet.

Video anzeigen