Eine mögliche Urheimat der indogermanischen Sprechergemeinschaft

und ihre Wanderwege nach der erweiterten Trennmengenmethode (Separation Level Recovery under Two Distributions, SLR2D).

 
           > Version française>                >English Version
   

By Hans J.J.G. Holm

0. Die meisten gebildeten Menschen haben zumindest eine grobe Vorstellung von den 'indogermanischen' (idg.) Sprachen: Es sind die vielen Sprachen zwischen dem Nordwesten Europas und dem indischen Subkontinent (historisch sogar bis Xinjiang im Nordwesten Chinas), die durch einen gemeinsamen Bestand ererbten Vokabulars (z.B. Zahlensystem, Pronomina) als auch der Grammatik verbunden sind. Über Grundlagen informieren die großen Lexika in ihrer Bibliothek, die einschlägigen Wikipediaseiten sind Substandard. Zu warnen ist vor den vielen Internetseiten unseriöser, esoterischer Spinner ohne das erforderliche Hintergrundwissen in Indogermanistik, Archäologie, und Statistik (weiteres vgl. Holm 2007c), oft erkennbar an Zitierungen weniger Sekundärquellen oder Rassenunsinn.

1. Worüber hier vor allem noch gestritten wird, sind die ursprünglichen Zusammenhänge und prähistorischen Entwicklungen, die Reihenfolge der Ausgliederung der idg. Sprachzweige. Hauptirrtum in diesen Diskussionen war und ist leider immer wieder die oberflächliche Annahme, dass Sprachen desto näher verwandt seien, je mehr Gemeinsamkeiten sie aufweisen, ohne zu bemerken, dass diese u.a. (!) vom Restbestand der erhaltenen Merkmale abhängen, also dem Ausmaß der Ersetzungen nach der jeweiligen Abtrennung (s. Holm 2003). Es ist leicht einsehbar, dass Sprachen mit starken Verlusten (wie Albanisch und Armenisch) trotz enger Verwandtschaft aufgrund der kleineren Datenbasis natürlich weniger Gemeinsamkeiten aufweisen als sogenannte Großkorpussprachen, wie Griechisch oder Indisch, was leider regelmäßig übersehen oder nicht beachtet wird.

1.1. Mathematisch ausgedrückt, stehen diese Parameter in einem hypergeometrischen Abhängigkeitsverhältnis und müssen zunächst transformiert werden. Erst aus dieser notwendigen SLRD-Transformation ergibt sich dann der quantitative Urzustand (der ursprüngliche Bestand an Merkmalen) im Zeitraum der Trennung jedes Sprachenpaares, die sog. 'Trennungsmenge'. Diese Mengen wurden in Holm 2000 für 91 Paarungen zwischen 14 belegten idg. Sprachzweigen publiziert.

1.2. Da die Menge an Originalmerkmalen im Laufe der geschichtlichen Einflüsse nur abnehmen kann, ergibt sich aus ihnen eine eindeutige Ausgliederungsreihenfolge (NICHT 'Glottochronologie'), die hier in der vereinfachten Form eines >Stammbaumes veranschaulicht wird, mit Einträgen der Wörter für 'Hand' in den verschiedenen Zweigen (jeweils älteste Form). Diese Ausgliederungsreihenfolge kann und sollte dann auf die verschiedenen Vorstellungen der ("Urheimat") angewendet werden, natürlich einschließlich der notwendigen Wanderbewegungen.

1.3. Die linguistisch erwiesenen Kontakte der indogermanischen mit den uralischen Sprachen von den frühesten Stadien an belegen eindeutig eine Urheimat in den Gebieten nördlich des Schwarzen Meeres ('Pontus') (vgl. z.B. Anthony 2007). Unsere >Ausbreitungskarte zeigt die von dort ausgehenden Migrationen. Es muss aber bemerkt werden, dass die Wanderwege bisher nicht überzeugend bewiesen werden konnten.

2. Rechnen wir chronologisch von den Daten der Hethiter zurück, scheint klar, dass die idg. Ausbreitung in etwa parallel zur Adaption der Bronze-Metallurgie, vierrädriger Ochsen-Karren, und überhügelter Gräber stattfand. Was nicht bedeutet(!), dass die Indogermanen diese Techniken und Sitten erfunden, aber sie zumindest intensiv angewandt haben. Als Hirtennomaden mit hohem Anteil an Pferden mussten sie auch gute Reiter sein, was natürlich auch einen ausschlaggebenden taktischen Vorteil beinhaltet. Der Versuch, die Zähmung von Pferden an Gebissspuren zu be- oder wiederlegen, übersieht, dass es Dutzende gebissloser Zäumungen gibt. Nach derzeitigem Wissen könnten die Migrationen sowohl in sehr viel kürzerer Zeit, oder auch etwas früher oder später stattgefunden haben.

3. Ein weiterer Diskussionspunkt ist die Frage, ob die sogenannten Anatolischen Sprachen, insbesondere Hethitisch,
- noch Vollmitglieder eines Ur-Indogermanisch waren;
- oder die letzteren ihre endgültige Ausprägung erst nach Abwanderung des Hethitischen vollendet haben.
Entgegen teilweise geäußerten Anspruchs können Methoden der Bio-Systematik nichts zur Lösung dieser Frage beitragen, aus Gründen, auf die in Absatz 4 eingegangen wird. Häufig mißverstehen Unbedarfte die a-priori-Ansetzung des Hethitischen als "Außengruppe" der angewandten Methoden (mit dem einzigen Zweck, einen rechnerisch nicht vorhandenen Ausgangspunkt zu schaffen), als Beweis ihrer frühen Abspaltung!

4. Die augenblicklich modischen Stammbaum-Rekonstruktionen durch mechanistische Anwendung von Computer-Programmpaketen aus der Biosystematik beruhen auf mindestens einer der folgenden irrigen Annahmen:
4.1. Dem primitiven Ähnlichkeits-Prinzip unter völliger Missachtung der in [1] dargestellten realen Abhängigkeiten ('Proportionalitätsfalle' - vgl. Ref. Holm 2003), dass Sprachen automatisch näher verwandt seien, je mehr "Kognaten" sie teilen (irrig mit 'evolutionärer Distanz' gleichgesetzt), oder sogar
4.2. Dass Wörter "nach der Uhr" ausgetauscht würden, was offensichtlich falsch ist, und eine blinde Wiederbelebung der obsoleten Glottochronologie darstellt: Kontrollieren Sie bitte irgendein Wort in einem etymologischen Wörterbuch und versuchen Sie, seine Geschichte zurückzuverfolgen: Es wird nie ein zeitlicher Automatismus sein, sondern - entsprechende Geschichtskenntnisse vorausgesetzt - eben historisch bedingte (kulturelle, technische, oder militärische) Ereignisse, die niemand vorhersehen oder gar berechnen kann. Z.B. ist im Englischen ca. 50 % des ursprünglich altsächsischen Vokabulars nicht "nach der Uhr" ersetzt worden, sondern, wie jeder geschichtlich etwas Gebildete weiß, durch die normannische Dominanz nach deren Sieg bei Hastings, neben einem langen lateinischen Bildungshintergrund in Kirche und Wissenschaft. Dass im "lexikostatistischen Grundwortschatz" diese Ersetzungen graduell geringer ausfallen, ändert nichts an der Unberechenbarkeit ihrer soziohistorischen Ursachen; doch selbst im englischen "Grundwortschatz" sind z.B. noch 6% - von diesen "Experten" unbemerkt - Entlehnungen aus nordischen Wikingerdialekten. Ausführlicher vgl. Holm 2007c. Man kann Journalisten nicht vorwerfen, dass Ihnen diese Zusammenhänge zunächst verborgen bleiben. Doch von Wissenschaftlern sollte erwartet werden können, dass sie sich um Hintergründe und Kausalitäten bemühen, statt diese mechanistischen Vergleiche blind zu übernehmen. --------

 
   
    5. Referenzen:                   
 
- Holm, Hans J. (in laufender Bearbeitung): >Holm's persönliche (Vor-)Geschichtskarten Europas 
  Von der Biscaya bis zum Kaspischen Meer - von der Eiszeit bis zum Mittelalter, in 27 Zeitscheiben  - Ich versuche, die Karten auf neuestem Stand zu halten, wenn ich Zeit habe.                   
 
- Holm, Hans J. (2016, in laufender Bearbeitung): >Meine "Swadesh-Liste" Indogermanisch
  (M. Swadesh's 1971 posthum =letzte Verbesserung). Mit den möglichst unmarkierten Übersetzungen 
  in 17 repräsentativen ausgestorbenen und lebenden indogermanischen Sprachen.                           - Ausschließlich für lexikostatistische Zwecke!                   
 
- Holm, Hans J. (2017): Steppe Homeland of Indo-Europeans Favored by a Bayesian Approach
  with Revised Data and Processing. Glottometrics 37, 54-81. Bochum: Ram-Verlag
  http://www.ram-verlag.eu/journals-e-journals/glottometrics/                                            - Bayes'scher Ansatz mit eigener Swadeshliste, im Vergleich mit Radbezeichnungen und Archäologie.
[Zusammenfassung: Trotz dutzender Hypothesen werden Ursprung und Ausbreitung der 
indogermanischen Sprachen weiterhin kontrovers diskutiert. Ein in Science (2012/2013) erschienener 
glottochronologischer Ansatz unter Bayes’scher Methodik beansprucht, den Beweis für die 
Gleichzeitigkeit mit der neolithischen Expansion, und damit für die sogenannte Anatolien-Hypothese, 
erbracht zu haben. Die Ergebnisse stießen jedoch auf verbreitete Kritik seitens anderer Disziplinen.
   Hier wird nun den Beweisen für die berechneten Zeiten durch Replikation der veröffentlichten 
Methodik auf den Grund gegangen. Während der Teste erbrachte ein weiterer, in Language (2015) 
erschienener Ansatz Ursprungsdaten zwischen 3950 – 4740 v.Chr. Eine Erkenntnis dieser Studie war, 
dass frühere Ergebnisse nur durch die Einbeziehung ausgestorbener, schlecht belegter Sprachen 
signifikant auseinander fielen, die man daher konsequent in mehreren Testschritten entfernte.
   Die vorliegende Arbeit vertieft dieses Vorgehen durch Gegenüberstellung der bisher verwendeten 
mit eigenen verbesserten Daten. Daraus ergab sich zunächst ein Ursprung bei etwa 4800 v.Chr., wobei 
allerdings die Struktur der Stammbäume in mehreren hundert Tests erheblich variierte. Diesem Problem 
begegneten die vorhergehenden Arbeiten durch scharfe topologische Vorgaben. Hier wurde dazu die West-
Ost-Dichotomie einer auf 1’400 Verben beruhenden lexikostatistischen Arbeit gewählt, wodurch sich nun 
ein Ursprung bei etwa 4100 v.Chr. ergab.
   Der neue Stammbaum wird zu einigen neuen Erkenntnissen zugunsten der Steppenhypothese aus Linguistik, 
Archäologie und Genforschung in Beziehung gesetzt. Vor allem zeigt eine neue archäologisch-linguistische 
Synopse der Wagenrad-Terminologie, dass nicht ein, sondern weitere indogermanische Wagenradbezeichnungen 
mit verschiedenen Konstruktionstypen in den entsprechenden Sprachräumen korrelieren. Zum Schluss werden 
in einem Overlay über den berechneten Stammbaum zeitgerecht die auf den möglichen Ausbreitungswegen und 
-zeiten liegenden Kulturen dargestellt, ohne allerdings damit deren indogermanischen Charakter zu postulieren.
   Keywords: Indogermanen, Stammbaumberechnung, Glottochronologie, Urheimat, Bayes, Swadesh Liste.]
 
  - Holm, Hans J. (2011a): Archäoklimatologie des Holozäns: Ein durchgreifender Vergleich
  der "Wuchshomogenität" mit der Sonnenaktivität und anderen Klimaanzeigern ("Proxies").              - Klimaänderungen im Mittel- und Spät-Holozäns in Eiskernen Grönlands und alpinen Baumgrenzen -
     Archäologisches Korrespondenzblatt 41-1:119-132. Zum PDF bitte>Archäoklimatologie klicken.<
[Zusammenfassung: Bisherige Ansätze zur Validität sowohl der Wuchshomogenität
mitteleuropäischer Eichenstandorte als auch verschiedener Anzeiger der
Sonnenaktivität halten einem durchgreifenden Vergleich nicht stand. Dies gilt vor
allem hinsichtlich behaupteter klimatischer Aussagen, z. B. zum Niederschlag.
   Bessere Übereinstimmungen scheinen dagegen über die letzten 9 000 Jahre zwischen
den Baumgrenzen der Alpen als auch Temperaturaussagen des
NGRIP-Eiskerns erkennbar zu sein.]
 
  - Holm, Hans J. (2011b): "Swadesh lists" of Albanian Revisited and Consequences for Its Position
in the Indo-European Languages. The Journal of Indo-European Studies 39-1&2.                             - English and updated version  (jetzt mit >Corrigenda)
[Abstract: In the last decade, several scholars pretended to have finally solved the
subgrouping of Indo-European by new lexicostatistical attempts. The public, of course,
was not able to perceive the questionable outcomes, of which the different and idiosyncratic
positions of Albanian are in particular conspicuous. One reason for this is the inadequate
methods, simply copied from bioinformatics (cf. Holm, H. J. 2007b above). That defective data
contribute a lot to these mistakes, is now here first demonstrated by analyzing the Albanian
part of three representative lists frequently employed in these studies: The presumably thirteen
percent mistakes there mix inextricably with the overlooked stochastic dispersion. Seventeen new
etymologies are proposed, however, thirty percent of the list remain unsolved or questionably.
Moreover, the high amount of recent replacements in Albanian is one more compelling argument
against the rate assumption in glottochronology.]
 
  - Holm, Hans J. (2010): Besprechung zu: Frank Sirocko (Hg.)
 "Wetter, Klima, Menschheitsentwicklung, Von der Eiszeit bis ins 21. Jahrhundert".
Bitte >Falsche Klimadarstellung klicken.                   
 
- Holm, Hans J. (2009): Albanische Basiswortlisten und die Stellung des Albanischen
in den indogermanischen Sprachen. Zeitschrift für Balkanologie Nr. 45-2. Wiesbaden,
Harrassowitz. 172-206. Printexemplar vom Autor oder >online    - Critical synopsis of some word lists adduced in lexicostatistical studies -
[Zusammenfassung: In der vergangenen Dekade hat eine Reihe von Wissenschaftlern den Anspruch
erhoben, mittels neuer lexikostatistischer Verfahren die Untergliederung der indogermanischen
Sprachen gelöst zu haben. Von der Öffentlichkeit konnte indes nicht erwartet werden, die
Fragwürdigkeit dieser Ergebnisse zu erkennen, wobei die unterschiedlichen und z.T.
idiosynkratischen Einordnungen des Albanischen besonders auffallen. Einer der Gründe hierfür
liegt sicher in der Unangemessenheit der oft aus der Bioinformatik übernommenen Methodik (vgl.
Holm, H. J. 2007, The new Arboretum of Indo-European ‘Trees’, in: Journal of Quantitative
Linguistics, 14-2). Dass zusätzlich in erheblichem Maße Datenfehler vorliegen, wird hier anhand
des albanischen Teils von drei häufig zu diesen Studien herangezogenen Listen nachgewiesen: Im
Ergebnis bilden die etwa dreizehn Prozent Fehler eine Mischung mit der vernachlässigten
stochastischen Streuung. Es werden siebzehn neue Etymologien vorgeschlagen, doch bleiben immer
noch etwa dreißig Prozent des albanischen Grundwortschatzes von unklarer Herkunft. Dies und der
stark wechselnde Einfluss von Entlehnungen bilden letztlich ein weiteres Argument gegen die
glottochronologische Grundannahme fester Ersetzungsraten.]
 
  - Holm, Hans J. (2008): The Distribution of Data in Word Lists and its Impact on the
 Subgrouping of Languages. In: C. Preisach, H. Burkhardt, L. Schmidt-Thieme,
 R. Decker (Editors): Data Analysis, Machine Learning, and Applications. Proceedings
 of the 31th Annual Conference of the Gesellschaft für Klassifikation e.V., Albert-Ludwigs-
 Universität Freiburg, März 7-9, 2007. Springer-Verlag, Heidelberg-Berlin: 629-636.
 ISBN 978-3-540-78239-1. Den Entwurf finden Sie hier >SLRD.pdf;                               - Lösung von Verteilungsproblemen in natürlichen Korpora -> verbesserter idg. "Stammbaum" -
 die Originalpräsentation finden Sie auf Holm_Indo-European_Subgrouping_by_SLRD_Freiburg_2007_21155000/.
 
[Zusammenfassung: Linguisten pflegen anzunehmen, dass Sprachen desto näher
verwandt sind, je mehr Merkmale, insbesondere gemeinsame Neuerungen, sie teilen. In
Holm (2003) wurde gezeigt, dass diese Annahme irrig ist, weil dabei übersehen wird,
dass die Menge gemeinsamer Übereinstimmungen stochastisch von drei weiteren
Parametern abhängt. Nur mit Hilfe des 'maximum likelihood Schätzers' der
Hypergeometrischen Verteilung sind wir in der Lage, die Anzahl derjenigen
gemeinsamen Merkmale herauszufinden, die im Zeitraum der Trennung von zwei
Sprachen diesen noch gemeinsam eigen war. Dadurch konnte eine Ausgliederungs-
reihenfolge innerhalb solcher Sprachfamilien gewonnen werden, für welche die
erforderlichen Daten verfügbar sind. Nach Anwendung auf die Daten des IEW (Pokorny
1959) waren die sich ergebenden späten Ausgliederungen des Hethitischen, Albanischen
und Armenischen zwanglos mit deren zentraler geographischen Lage erklärbar und
daher unverdächtig. Erst, als in einer weiteren Anwendung auf Daten der Mixe-Zoque-
Familie dieselbe Beobachtung gemacht wurde, dass stets schwach belegte Sprachen spät
auszugliedern schienen, konnte ein systematischer Fehler vermutet werden.
    Die Ursache dieses Fehlers wird aufgedeckt, der nur bei Merkmalslisten natürlicher
Sprachen auftritt, im Gegensatz zu den in Holm (2007a) benutzten Testlisten mit
stochastisch normalverteilten Daten. Für diese Untersuchung stand nun als erheblich
modernere und zuverlässigere Datenquelle das "Lexikon der indogermanischen Verben"
(Rix et al. 2001) zur Verfügung. In der Tat bewahrheitete sich der Verdacht, und es wird
gezeigt, wie aus solchen quasi-Pareto-verteilten Daten trotzdem die korrekte
Ausgliederungsreihenfolge gewonnen werden kann.
    Es ergibt sich eine (teilweise) neue Ausgliederungsreihenfolge der indogermanischen
Hauptzweige, die gut zu den grammatischen Tatsachen als auch der geographischen
Verteilung passt. Vor allem ergibt sich klar, dass sich die anatolischen Sprachen
keinesfalls als erste getrennt haben können und widerlegt damit eindeutig die "indo-
hethitische Hypothese".]

 
  - Holm, Hans J. (2007a): Language Subgrouping. In: Grzybek, P. & R. Köhler (Editors),
 Exact Methods in the Study of Language and Text. Dedicated to Professor Gabriel
 Altmann on the occasion of his 75th birthday. [Quantitative Linguistics  62].
 Berlin:  de-Gruyter: 225-235.- Umgang mit stat. Streuungen in mehrstufigen Untergliederungen
[Zusammenfassung: Nach mehreren Jahren der Erprobung, und angesichts vieler
konkurrierender Verfahren, wird die Trennmengenberechnungsmethode (Holm 2000,
passim) im Hinblick auf ihre Erfordernisse verfeinert. Es wird getestet, wie stochastische
Streuung von schlechten Daten unterschieden werden kann und wie Daten beschaffen
 
  - Holm, Hans J. (2007b): The new Arboretum of Indo-European "Trees" - Can new Algorithms
 Reveal the Phylogeny and even Prehistory of IE? In: Journal of Quantitative
 Linguistics 14-2, S. 167-214. -> in D verfügbar in den Uni-Bibliotheken B,
 BO, EF, F, Gö/Phil, M, TR. Original-Kopien über http://cats.tfinforma.com/PTS/in?t=rl&m=237780.
 Den Entwurf finden Sie hier >Arboretum IE trees.                              - Aktualisierung auf 2006, neuere lexikostatistische Ansätze
[Zusammenfassung: Die Spezialisierungen auf den Gebieten der Linguistik
einerseits und der Bioinformatik andrerseits führen zunehmend zu Missverständnissen
und falschen Ergebnissen, bedingt durch unzureichende Kenntnis der Bedingungen der
jeweils angewandten Methoden und Materialien. Diese werden analysiert und die
Ergebnisse zur Beurteilung der augenblicklichen Schwemme von Versuchen zur
Konstruktion neuer Stammbäume der indogermanischen Sprachen herangezogen.]
 
- Holm, Hans J. (2007c): Vortrag "SLRD-Methode in der Indogermanistik" beim Institut für
vergleichende Indogermanistische Sprachwissenschaft der Universität Bonn.
Bitreduzierte Folien (bitte Speichern und Entpacken) >SLRD_BN07.
 
- Holm, Hans J. (2005): Genealogische Verwandtschaft. Kapitel 45 in
 'QUANTITATIVE LINGUISTIK; Ein internationales Handbuch' [HSK-Serie, Bd. 27],
 Berlin: de Gruyter.      - Lexikostatistische Ansätze zur Gliederung von Sprachen im 20.Jh. Aktualisierung s.u. 2008 -
 
 [Inhalt:  1. Wann sind Sprachen "verwandt"? 2. Datenbewertung; 3. Beziehungsmaße; 3.1.
Synchrone ~; 3.2. Diachrone Beziehungsmaße; 4. Strukturierung genealogischer
Abhaengigkeiten.]
 
- Holm, Hans J. (2003): The proportionality trap, Or: what is wrong with
 lexicostatistical subgouping? In: Indogermanische Forschungen 108: 39-47.                         - Grundlagen auf englisch; auch für Nicht-Mathematiker geeignet -
[Zusammenfassung: Es wird anhand eines Experiments gezeigt, dass die rohe Anzahl
von Übereinstimmungen (z.B. der Kognaten) zwischen zwei verwandten Sprachen
prinzipiell nicht den Grad der genealogischen Verwandtschaft wiedergeben kann.
Anschließend wird demonstriert, wie durch Berücksichtigung aller statistisch
bestimmenden Parameter die unterschiedliche Ausgangsbasis der Paarungen und damit
die korrekte Ausgliederungsreihenfolge wieder hergestellt werden kann.]
 
  Review of 'Mathematical foundations
 of Linguistics' (by Hubey, H. Mark, 1999, LINCOM handbooks in Linguistics 10,
 Muenchen: LINCOM); In: Journal of Quantitative Linguistics 8-2:149-62.
- Holm, Hans J. (2000): Genealogy of the Main Indo-European Branches Applying the
 Separation Base Method. In: Journal of Quantitative Linguistics 7-2:73-95.                             -Anwendung auf Pokornys Indogermanisches Etymologisches  Wörterbuch; Aktualisierungen s.u. 2007a,b -
[Zusammenfassung: In bisherigen quantitativen Analysen der genealogischen
Beziehungen zwischen Sprachen wurde der durch Ersetzungen bedingte systematische
Fehler nicht angemessen eliminiert, was nur zu falschen Ergebnissen führen konnte. Erst
dank der Auszählung der riesigen und damit statistisch erst signifikanten Datenmenge
aus J. Pokorny „Indogermanisches Etymologisches Wörterbuch“ (Bern: Francke, 1959) in
N. Birds „Distribution of Indo-European root morphemes“ (Wiesbaden: Harrassowitz,
1982) war es trotz einiger bekannter Mängel möglich, die Anzahl der Lexeme im
Zeitraum der Trennung jedes Sprachenpaares mit Hilfe eines robusten Schätzers zu
berechnen und damit die Ausgliederungsreihenfolge zu erschließen. Die üblichen
Schwarz- Weiß-Hypothesen, z.B. pro oder kontra eine italo-keltische Verwandtschaft,
können den realen Entwicklungen nicht gerecht werden und sollten diesen differenzier-
teren Ergebnissen Platz machen.]
 
                  ------------

Neu ab 2010-05-27:
free counters