Avec les récents développements dans le domaine de la linguistique de corpus, de plus en plus de données numérisées sont disponibles et peuvent être utilisées pour des recherches linguistiques. Étant intéressée par la linguistique diachronique, je suis particulièrement heureuse que de plus en plus de sources textuelles historiques des siècles passés soient digitalisées, préparées et mises à disposition sous la forme de corpus. Cela nous offre une occasion unique de tester des hypothèses scientifiques avec suffisamment de données du passé.

Dans une étude récente, je me suis penchée sur la problématique des constructions à verbes supports en allemand. Ces constructions se composent de deux éléments : un nom, qui est normalement dérivé d’un verbe, et un verbe qui est largement vidé de son sens lexical, p.ex. zur Aufführung bringen/ gelangen/ kommen, zum Vorschein bringen/ kommen, in Verlegenheit bringen/ geraten, Abschied nehmen. J’ai réalisé une étude sur une structure plus spécifique, à savoir les constructions composées de la préposition zu, d’un nom déverbal se terminant par le suffixe ung, et du verbe kommen « venir » (p.ex. zur Anwendung/Erfüllung kommen). L’étude se base sur les données du corpus DTA (https://www.deutschestextarchiv.de/) qui couvre les données entre le XVIIème et le XXème siècles. Les analyses statistiques de ces données étaient réalisées en employant différentes méthodes et en utilisant le logiciel R (https://www.r-project.org/) libre et open source.

Toutes les occurrences du verbe kommen en combinaison avec les groupes prépositionnels introduits par la préposition zu ont été sorties du corpus. 26 997 observations au total ont été analysées et assignées à l’une des six périodes de 50 ans (1 : 1600-1649, 2 : 1650-1699, 3 : 1700-1749, 4 : 1750-1799, 5 : 1800-1849, 6 : 1849-1899). Le graphique 1 contient les chiffres de fréquence des constructions par période.

Graphique 1 : Fréquence des constructions par période

Dans le graphique 2, la ligne verte indique les chiffres de fréquence des types, soit la fréquence des différents noms dans la construction. La ligne turquoise indique le nombre des nouveaux types, à savoir des nouvelles constructions qui apparaissent pour la première fois dans les périodes consécutives.

Graphique 2 : Fréquence des types par période

On voit alors que les combinaisons individuelles deviennent de plus en plus fréquentes, mais le patron lexico-syntaxique [zu + nom déverbal + le verbe kommen] lui aussi devient de plus en plus productif en donnant naissance à de plus en plus de nouvelles locutions verbales.

Une autre méthode d’analyse des mêmes changements, correspondence analysis, compare les locutions verbales qui nous intéressent avec les autres contextes syntaxiques du même verbe. On observe comment les locutions verbales se situent dans l’espace formé par les contextes syntaxiques les plus pertinents pour le verbe : le nom peut être utilisé sans article, par exemple zu Hause (zu_N) ; il peut être accompagné par une forme d’article défini amalgamée à la préposition, par exemple zum Haus (zuDEF_N) ; il peut avoir un déterminant qui n’est pas amalgamé avec la préposition, par exemple zu dem Haus (zu_DET_N) ; il peut être accompagné par une autre expression, comme un adjectif, par exemple zum schönen Haus (zu_x_N), ou le nom peut être accompagné par plusieurs expressions qui viennent se placer entre la préposition zu et le nom lui-même, par exemple zu einem alten schönen Haus (zu_xx_N). Une fois que l’espace est défini par ces contextes, on peut y placer des combinaisons du verbe kommen avec les différents types de noms. En outre, comme je m’intéresse à l’évolution diachronique, les combinaisons sont classées en fonction des intervalles historiques (1 à 6).

Graphique 3 : Analyse de correspondances

De cette manière, on arrive à obtenir une image beaucoup plus informative que les tableaux des fréquences. Trois classes de combinaisons de kommen avec des noms sont représentées : les noms de personnes, de lieux, et les déverbaux se terminant en ung. Les combinaisons avec les noms de personnes préfèrent le contexte syntaxique avec un déterminant entre la préposition et le nom ; ce qui est important, c’est que les combinaisons des différents intervalles historiques restent dans la même région. Pour les combinaisons avec les noms de lieux, on observe une situation semblable, à ceci près qu’elles démontrent une préférence pour d’autres contextes syntaxiques.

Si on suit la trace des combinaisons avec les déverbaux se terminant en ung, on constate qu’elles donnent une image tout à fait différente. Non seulement elles se trouvent dans une autre région de l’espace syntaxique, mais elles se distribuent aussi d’une manière régulière. Pendant l’ensemble de la période analysée, elles s’éloignent d’autres structures. Cela permet une interprétation diachronique : les locutions verbales avec kommen deviennent non seulement de plus en plus fréquentes, mais également de plus en plus indépendantes par rapport à l’ensemble des structures lexicales et syntaxiques du verbe kommen. On observe alors un développement graduel d’un nouveau pattern lexico-sémantique en allemand, un changement qui aurait pu échapper à une analyse purement qualitative.

Author(s) of this blog post

Web page | Other publications

Professor at the Institute of German Language and Literature at the University of Neuchâtel.