Un possible foyer originel des langues indo-européennes

et les migrations de leurs locuteurs, sous l'angle de la méthode développée de reconstitution du niveau de séparation (Separation Level Recovery under Two Distributions, SLR2D)

                           >Version anglaise                >Deutsche Version

Par Hans J. J. G. Holm (grand merci à Caroline Barzilaï pour la traduction primordiale)

0. La plupart des gens cultivés ont une vague idée de ce que sont les langues « indo-européennes »: ce sont les nombreuses langues qui sont parlées du nord-ouest de l’Europe au sous-continent indien (et même, historiquement, au Xinjiang, dans le nord-ouest de la Chine) et qui sont liées par leur grammaire et par un fond lexical commun hérité (système numérique ou pronoms, par exemple). Pour les notions de base, on peut se reporter aux grandes encyclopédies. Les correspondantes pages Wikipedia sont médiocres. La plus grande prudence s’impose concernant les nombreuses pages Internet ésotériques et farfelues qui sont dénuées de tout fondement linguistique, archéologique ou statistique (voir Holm 2007c); ces pages se reconnaissent souvent à leurs maigres références bibliographiques et à leurs inepties raciales.

1. La principale question qui fait encore débat concerne les liens originels et les développements préhistoriques de ces langues, l’ordre dans lequel les différentes branches se sont séparées du tronc commun. La principale erreur (commise encore aujourd’hui) consiste à croire que deux langues sont d’autant plus proches qu’elles possèdent un grand nombre de caractères communs. Cette vision superficielle néglige le fait que la quantité de caractères communs dépend, entre autres, du degré de conservation des caractères d’origine, autrement dit du nombre de remplacements lexicaux intervenus après la séparation des langues étudiées (voir Holm 2003). Il est évident que des langues ayant subi des pertes importantes (comme l’albanais et l’arménien) présentent moins de concordances, malgré leur étroite parenté, que des langues à grand corpus comme le grec ou l’indien. Malheureusement, cette donnée est trop souvent négligée.

1.1. Exprimés mathématiquement, ces paramètres sont dans un rapport de dépendance hypergéométrique et nécessitent une transformation préalable. Seule la transformation SLRD permet de déterminer la quantité de caractères communs à deux langues au moment de leur séparation, qu’on appellera leur « niveau de séparation ». On trouvera dans Holm 2000 le niveau de séparation de 91 paires de langues appartenant à 14 branches indo-européennes établies.

1.2. Comme le nombre de caractères linguistiques originels ne peut que diminuer avec le temps, par exemple en raison d'influences historiques, il existe une séquence claire de séparations (à ne pas confondre avec la « glottochronologie »), qui peut être visualisée par ce qu'on appelle un >"arbre généalogique", en utilisant ici l'exemple des mots les plus anciens pour "main" dans les 12 principaux groupes linguistiques indo-européens. Cet ordre de séparation peut et doit être appliqué aux différentes hypothèses concernant le foyer originel (« Urheimat ») et les migrations des locuteurs du proto-indo-européen.

1.3. Les premiers contacts linguistiquement prouvés entre les langues indo-européennes et ouraliennes prouvent clairement une maison d'origine dans les steppes forestières au nord de la mer Noire (région du Pont, voir par exemple Anthony 2007). Bien entendu, l'arbre généalogique présenté ci-dessus doit avoir été réalisé dans la zone géographique donnée, par exemple comme sur cette >carte de migrations. On notera qu’à ce jour, aucune thèse des voies de migration n’a pu être validée.

2. Si l’on remonte à partir des données historiques avérées sur les Hittites, il apparaît clairement que l’expansion des langues indo-européennes et l’adoption de la métallurgie du bronze, des charrettes à bœufs à quatre roues et des tumulus funéraires sont des phénomènes parallèles. Cela ne signifie pas que les Indo-Européens aient inventé ces techniques ou ces coutumes, mais cela indique tout de même qu’ils les ont largement employées. Les Indo-Européens étaient des bergers nomades qui possédaient des chevaux et savaient probablement les monter, ce qui devait leur conférer un avantage tactique déterminant dans les guerres. La tentative de confirmer ou d’infirmer la domestication du cheval au moyen de traces de mors achoppe sur un point : il existe des dizaines de brides sans mors. En l’état actuel des connaissances, les migrations ont pu se dérouler beaucoup plus rapidement, mais aussi un peu plus tôt ou un peu plus tard.

3. Les langues dites anatoliennes, en particulier le hittite, sont un autre sujet de débat :
- étaient-elles membres à part entière du proto-indo-européen
- ou les dernières n’ont-elles achevé leur développement qu’après la séparation du hittite ?

4. Reconstituer des arbres généalogiques à l’aide de paquets de logiciels issus de la biosystématique, qu’on utilise de manière machinale, semble être à la mode. Or ces reconstructions reposent sur au moins l’une des hypothèses erronées suivantes :
4.1. le principe primitif de ressemblance qui néglige totalement les interdépendances réelles évoquées au point [1] et prétend que plus les langues partagent de « cognates », plus elles sont proches (confusion avec la « distance créée par l’évolution », voir le « piège de la proportionnalité » dans Holm 2003),
4.2. l’hypothèse selon laquelle les mots seraient remplacés à un rythme donné, résurgence malheureuse de la glottochronologie douteuse. Il suffit de regarder n’importe quel mot dans un dictionnaire étymologique et de tenter de comprendre son origine pour voir l’absurdité de cette thèse : l’apparition d’un mot n’est jamais liée à un cycle quelconque, mais à un événement historique (culturel, technique ou militaire), par nature imprévisible et incalculable. Ainsi environ 50 % du vocabulaire germanique de l’anglais a été remplacé non pas à un rythme donné, mais du fait de la domination des Normands, qui ont remporté la bataille d’Hastings, et de la longue prédominance du latin en théologie et dans les sciences, comme tout Anglais un peu instruit le sait. Le fait que dans le « vocabulaire de base », ces remplacements lexicaux soient de moins en moins fréquents ne change rien au caractère imprévisible de leur origine socio-historique. D’ailleurs, le « vocabulaire de base » de l’anglais contient encore 6 % d’emprunts aux dialectes vikings – fait négligé par les « experts » (voir Holm 2007c). On ne peut reprocher aux journalistes de ne pas saisir les implications de ces théories. Mais il est regrettable que des chercheurs ignorent ces données de base et reprennent aveuglement des méthodes de comparaison machinales.
--------



 5. Publications : (Veuillez consulter également google scholar, academia.edu et Reserachgate.Net)
ORCID iD iconorcid.org/0000-0001-9527-0553 - Holm, Hans J. (révisé seulement occasionnellement): Les notes cartographiques de Hans J.J.G. Holm sur la (pré) histoire - du golfe de Gascogne à la mer Caspienne - de la dernière période glaciaire au moyen Âge; chacun avec barre climatique courante (basée sur Holm 2011a) et barre de culture courante. Afficher comme >Les cartes historiques de Holm. - J'essaie de garder les cartes à jour quand j'ai le temps... .
- Holm, Hans J. J. G. (2019): The Earliest Wheel Finds, their Archeology and Indo- European Terminology in Time and Space, and Early Migrations around the Caucasus. Nouveau ! Series Minor 43. Budapest: ARCHAEOLINGUA ALAPÍTVÁNY. ISBN 978-963-9911-30-5. - Les Indo-Européens ont-ils inventé la roue? Avec 306 références, 6 illustrations pour la plupart en couleur dans le texte, ainsi que des illustrations réduites de 130 trouvailles représentatives de roues (y compris des trouvailles récentes d'Allemagne et de Chine). Veuillez chercher sur google pour connaître la disponibilité !
[Résumé: Le rôle que la roue de chariot a joué dans la vie des Indo-Européens a jusqu'à présent été étudié principalement du point de vue des spécialistes, souvent sans prise en compte des disciplines voisines concernées. Nous avons recherché les plus anciennes découvertes de roues (avant environ 2000 avant JC) et présentons une sélection représentative de 130 découvertes entre la mer du Nord, l'Asie centrale et l'Inde sous forme tabulaire et géographique. Par la suite, nous avons élaboré les cinq noms de roue des principales familles indo- européennes, notamment en ce qui concerne les aspects onomasiologiques. Afin de pouvoir relier ces deux résultats au développement des langues indo-européennes, nous utilisons cadre glottochronologique actuel en arrière. Cela permet déjà de mieux comprendre l'âge de certains noms et d'établir des parallèles clairs avec certains types de construction. En outre, deux questions fréquemment débattues sont abordées dans ce contexte actualisé. D'une part, concernant la séparation des Anatoliens (indo-européens) et des Tochariens il y a de nombreuses indications que cela a eu lieu dans le Caucase à partir de la principale branche orientale. Enfin, les hypothèses pour l'"invention" de la roue sont remplacées par la proposition beaucoup plus réaliste d'un développement à long terme dans un large réseau de communication.] Correction: Dans la note de bas de page 5, c'est correct "S (usanne) Kuprella".
- Holm, Hans J. (2017): Steppe Homeland of Indo-Europeans Favored by a Bayesian Approach with Revised Data and Processing. Glottometrics 37: 54-81. accès ouvert à http://www.ram-verlag.eu/journals-e-journals/glottometrics/ - Approche Bayésienne, avec des parallèles archéologiques et linguistiques.
[Résumé : Malgré des dizaines d'hypothèses, l'origine et le développement de la famille des langues indo-européennes font encore débat. Une approche glottochronologique publiée dans Science (2012/2013) selon la méthodologie bayésienne prétend avoir fourni des preuves de simultanéité avec l'expansion néolithique, et donc de la prétendue "hypothèse anatolienne". Ces dates ont fait l'objet de nombreuses critiques de la part d'autres disciplines. Ici, la preuve alléguée pour les temps calculés fait maintenant l'objet d'une enquête en reproduisant la méthodologie publiée à l'aide de notre propre ensemble de données, qui a été amélioré. Il en résulta d'abord une origine vers 4800 ANE, bien que la structure des pedigrees ait varié considérablement dans plusieurs centaines d'essais. Ce problème a été contré par les travaux précédents avec des directives topologiques précises. La dichotomie ouest-est d'un travail lexicostatistique basé sur 1400 verbes a été choisie ici, ce qui a abouti à une origine vers 4100 ANE. Au cours de ces tests, une autre approche (Language, 2015) a permis de trouver une date d'origine comprise entre 3950 et 4740 ANE. L'une des conclusions de cette étude était que les résultats antérieurs avaient été considérablement perturbés par des langues mal attestées, qui ont donc été supprimées étape par étape. Le nouvel arbre généalogique reflète de nouvelles découvertes issues de la linguistique, de l'archéologie et de la recherche génétique, qui parlent en faveur de l'hypothèse de la steppe. Surtout, une nouvelle juxtaposition archéologique-linguistique de la terminologie des roues de wagons montre que les différentes désignations indo-européennes des roues de wagons sont en corrélation avec les différents types de construction dans les zones linguistiques correspondantes. Enfin, les cultures se trouvant sur les voies de propagation et les temps possibles sont placées en superposition sur le pedigree calculé, sans toutefois postuler leur caractère indo-européen.]
- Holm, Hans J.J.G. (2016, en cours): >Ma "liste Swadesh" - indo-européenne, basé sur la dernière édition (M. Swadesh 1971 à titre posthume). Leurs traductions dites "non marquées" dans 17 langues indo-européennes vivantes et éteintes représentatives ont donné 815 tiges de mots différentes. Environ 150 sources. - Développé principalement pour des travaux statistiques sur les 12 principales branches indo-européennes!
- Holm, Hans J. (2011b): "Swadesh lists" of Albanian Revisited and Consequences for Its Position in the Indo-European Languages. The Journal of Indo-European Studies 39-1&2. - Version anglaise et mise à jour (voir >Corrigenda) -
[Résumé: Au cours de la dernière décennie, un certain nombre de scientifiques ont affirmé avoir trouvé la subdivision correcte des langues indo-européennes en utilisant de nouvelles méthodes lexicostatistiques. Le public, bien sûr, n'a pas été en mesure de percevoir les résultats douteux, dont les positions différentes et idiosyncratiques de l'Albanais sont particulier remarquable. L'une des raisons en est l'inadéquation des méthodes, simplement copiées de la biosystématique (cf. Holm, H. J. 2007a ci-dessus). Que des données défectueuses contribuent beaucoup à ces erreurs, est maintenant ici démontré en analysant la partie albanaise de trois listes représentatives fréquemment employées dans ces études: Les 13% d'erreurs que l'on y trouve se mélangent inextricablement avec la dispersion stochastique négligée. Dix-sept nouvelles étymologies sont proposées, cependant, 30 % de la liste restent non résolus ou douteux. Ceci et l'influence fortement changeante des emprunts constituent finalement un argument supplémentaire contre l'hypothèse de base glottochronologique de taux de remplacement fixes.]
- Holm, Hans J. (2011a): Archäoklimatologie des Holozäns: Ein durchgreifender Vergleich der "Wuchshomogenität" mit der Sonnenaktivität und anderen Klimaanzeigern ("Proxies"). - Moyenne et tard holocène changements climatiques dans carottes de glace en Groenland Archäologisches Korrespondenzblatt 41-1: 119-132. en regard de limites d’arbre dans les Alpes - Pour voir le pdf, s.v.p. click >Archéoclimatologie de Holm
[Résumé : Les approches récentes en regard de la validité de l’homogénéité de croissance des chênes de l’Europe centrale et du deux proxies (indicateurs climatiques) de l’activité du soleil ne supportent pas notre comparaison tranchante. Ceci est valable avant tout á l’égard des allégations climatiques, p.ex. de la précipitation. Au contraire, des meilleures correspondances paraient reconnaissables pour les derniers 9 000 ans entre les limites d’arbre dans les Alpes, en tant que l’interprétation de la température de carotte de glace du forage NGRIP.]
- Holm, Hans J. (2010), Examen de Frank Sirocko (Hg.) "Wetter, Klima, Menschheitsentwickung, Von der Eiszeit bis ins 21. Jahrhundert". Critique, en allemand, voir >Mauvaise présentation du climat., s.v.p.)
- Holm, Hans J. (2009): Albanische Basiswortlisten und die Stellung des Albanischen in den indogermanischen Sprachen. Zeitschrift für Balkanologie Nr. 45-2. Wiesbaden, Harrassowitz: 171-205. - Examen critique de quelques listes lexicales utilisées dans les travaux lexicostatiques - (Note : Aujourd'hui, je remplacerais l'expression trompeuse "liste de mots de base" par "liste de concepts universels")
[Résumé : Après avoir étudié la méthodologie des nouvelles tentatives lexicostatiques de classification des langues indo-européennes dans Holm, Hans J. (2007: The new Arboretum of Indo-European 'trees', in: Journal of Quantitative Linguistics, 14-2), nous testons ici les données rapprochées, en l’occurrence la partie sur l’albanais de trois travaux représentatifs. Nous proposons de nouvelles solutions à de nombreux cas jusqu’alors problématiques, par exemple quelques emprunts au turc des Balkans. En outre, le fort taux de remplacement en albanais est un autre argument fort contre l’hypothèse des taux de remplacement de la glottochronologie.]
- Holm, Hans J. (2008): The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. In: Ch. Preisach, H. Burkhardt, L. Schmidt-Thieme, - Solution des problèmes de distribution R. Decker (Editors): Data Analysis, Machine Learning, and Applications. Proceedings - plus base de données verbale = emprunt minimisé of the 31th Annual Conference of the German Classification Society (GfKl), à -> « arbre généalogique » indo-européen amélioré - l'Université de Freiburg, Mars 7-9, 2007. Springer-Verlag, Heidelberg-Berlin: 629-636. Pour voir l'ébauche s.v.p. cliquer >Holm SLRD.pdf.
[Résumé : Les linguistes supposent généralement que deux langues sont d’autant plus proches qu’elles possèdent un nombre élevé de caractères communs, et en particulier d’innovations communes. Dans Holm 2003, nous avons démontré que cette thèse est erronée car le nombre de concordances entre deux langues est un phénomène stochastique qui dépend de trois autres paramètres. Seule l’utilisation de l’estimateur de probabilité maximale de la distribution hypergéométrique permet de déterminer le nombre de caractères communs à deux langues au moment de leur séparation. On peut ainsi obtenir un ordre de séparation des langues au sein des familles pour lesquelles on dispose des données requises. L’application aux données du « Indogermanisches Etymologisches Wörterbuch » (Pokorny 1959) a montré une séparation tardive du hittite, de l’albanais et de l’arménien – la chose s’expliquait assez naturellement par la situation géographique centrale de ces langues et ne paraissait donc pas suspecte. Mais l’application aux données de la famille Mixe-Zoque a permis la même observation, à savoir que les langues peu documentées semblaient s’être séparées tardivement. Nous avons alors soupçonné une erreur systématique. Les présents travaux révèlent l’origine de cette erreur, qui apparaît uniquement dans les corpus naturels, par opposition aux cas de tests stochastiques sur des données distribuées normalement utilisés dans Holm 2007a. Pour cette étude, nous avons pu puiser nos données dans le « Lexikon der indogermanischen Verben » (Rix et al. 2001), nettement plus moderne et plus fiable. Nos soupçons se sont effectivement confirmés, et nous montrons comment des listes de données mal distribuées peuvent néanmoins fournir un ordre de séparation correct. On obtient ainsi un nouvel ordre de séparation des principales branches indo-européennes qui concorde avec les réalités grammaticales et la distribution géographique. Il apparaît surtout clairement que les langues anatoliennes n’ont pas pu se séparer les premières, ce qui réfute de manière incontestable la thèse « indo-hittite ».]
- Holm, Hans J. (2007d): Ausgliederungsreihenfolge der Indogermania auf Grundlage des LIV2. Présentation donnée à l'Institut de linguistique indo-européenne comparée de l'Université de Bonn. Groupe cible / public: linguistes allemands Voici le diaporama en format pdf : >Holm délocalisation indo-européenne (Bonn)
- Holm, Hans J. (2007c): The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. Présentation pour la 31e conférence annuelle de la Société allemande Groupe cible / public: "linguistes quantitatifs", statisticiens de classification (GfKl), Univ. de Fribourg, 7-9 mars 2007. Voici le diaporama en format pdf : >Holm distribution, mots, listes (Freiburg)
- Holm, Hans J. (2007b): The new Arboretum of Indo-European "Trees". Can new Algorithms Reveal the Phylogeny and even Prehistory of IE? In: Journal of Quantitative Linguistics 14-2, S. 167-214. Le projet peut être consulté ici >Arboretum d'arbres indo-européens. - Actualisation jusqu’en 2006, nouvelles approches lexicostatistiques -
[Résumé : Les spécialisations dans les domaines de la linguistique, d’une part, et de la bioinformatique, d’autre part, conduisent à des méprises et à des résultats faux en raison d’une connaissance insuffisante des conditions des méthodes et des matériaux utilisés. Celles-ci sont analysées, et les résultats sont utilisés pour évaluer la multitude d’arbres généalogiques des langues indo-européennes qui fleurissent actuellement.]
- Holm, Hans J. (2007a): Language Subgrouping. In: Grzybek, P. & R. Köhler (Editors), Exact Methods in the Study of Language and Text. Dedicated to Professor Gabriel Altmann on the occasion of his 75th birthday. [Quantitative Linguistics 62]. Berlin: de-Gruyter: 225-235. - Utilisation de la dispersion stochastique dans les classifications multiples -
[Résumé : Après plusieurs années d’essais et face à la concurrence de nombreuses autres méthodes, nous affinons la méthode de reconstitution du niveau de séparation (Holm 2000, passim) en termes de données et d’exigences stochastiques. Nous cherchons à distinguer dispersion stochastique et mauvaises données et à améliorer l’acquisition des données.]
- Holm, Hans J. (2005): Genealogische Verwandtschaft. In: QUANTITATIVE LINGUISTIK; Ein internationales Handbuch [HSK-Serie, Bd. 27], Berlin: de Gruyter. Kapitel 45. - Les approches lexicostatiques dans la classification des langues au XXe siècle. Actualisation voir ci-dessous 2008 -
[Sommaire : 1. Wann sind Sprachen "verwandt"? 2. Datenbewertung; 3. Beziehungsmaße; 3.1. Synchrone Beziehungsmaße; 3.2. Diachrone Beziehungsmaße; 4. Strukturierung genealogischer Abhängigkeiten.]
- Holm, Hans J. (2003): The proportionality trap, Or: what is wrong with lexicostatistical subgrouping? In: Indogermanische Forschungen 108: 39-47. - Principes fondamentaux en anglais; convient aux non-mathématiciens -
[Résumé : Nous montrons, par le biais d’une expérience, que le chiffre brut des concordances (des cognats, par exemple) entre deux langues apparentées ne peut pas refléter leur degré de parenté généalogique. Nous démontrons ensuite qu’il est possible de reconstituer le niveau originel de points communs à deux langues et leur ordre de séparation en considérant tous les paramètres statistiques déterminants.]
- Holm, Hans J. & Embleton, Sheila (2001): Review of 'Mathematical foundations of Linguistics' (by Hubey, H.Mark, 1999, LINCOM handbooks in Linguistics 10, München: LINCOM); In: Journal of Quantitative Linguistics 8-2:149-62.
- Holm, Hans J. (2000): Genealogy of the Main Indo-European Branches Applying the Separation Base Method. In: Journal of Quantitative Linguistics 7-2:73-95. Quelques graphiques peuvent être trouvés dans>Holm Sep Base Meth Examples - Application au dictionnaire étymologique indo-européen de Pokorny; actualisation voir ci-dessous 2007,2008. Voir les actualisées 2007a,b -
[Résumé : Dans les analyses quantitatives des relations généalogiques entre des langues effectuées précédemment, la distorsion systématique due aux remplacements lexicaux n’a pas été éliminée correctement, ce qui a conduit à des résultats faux. Seul le dépouillement de l’immense masse de données du « Indogermanisches Etymologisches Wörterbuch » (J.Pokorny 1959, Bern: Francke) par N. Bird dans « Distribution of Indo-European root morphemes » (1982, Wiesbaden: Harrassowitz) a permis, en dépit de quelques défauts connus, d’évaluer le nombre de lexèmes communs à l’époque de la séparation de toute paire de langues à l’aide d’un estimateur robuste. Les résultats permettent de déduire leur ordre de séparation. Ces résultats plus différenciés devraient supplanter les hypothèses manichéennes habituelles qui ne rendent pas compte des développements réels – pour ou contre une parenté italo-celtique, par exemple.]
------------

Nouveaux à partir de 2010-05-27:
free counters