Eine mögliche Urheimat der indogermanischen Sprechergemeinschaft

und ihre Wanderwege nach der erweiterten Trennmengenmethode (Separation Level Recovery under Two Distributions, SLR2D).

           > Version française>                >English Version
   

By Hans J.J.G. Holm

0. Die meisten gebildeten Menschen haben zumindest eine grobe Vorstellung von den 'indogermanischen' (idg.) Sprachen: Es sind die vielen Sprachen zwischen dem Nordwesten Europas und dem indischen Subkontinent (historisch sogar bis Xinjiang im Nordwesten Chinas), die durch einen gemeinsamen Bestand ererbten Vokabulars (z.B. Zahlensystem, Pronomina) als auch der Grammatik verbunden sind. Über Grundlagen informieren die großen Lexika in ihrer Bibliothek, die einschlägigen Wikipediaseiten sind Substandard. Zu warnen ist vor den vielen Internetseiten unseriöser, esoterischer Spinner ohne das erforderliche Hintergrundwissen in Indogermanistik, Archäologie, und Statistik (weiteres vgl. Holm 2007c), oft erkennbar an Zitierungen weniger Sekundärquellen oder Rassenunsinn.

1. Worüber hier vor allem noch gestritten wird, sind die ursprünglichen Zusammenhänge und prähistorischen Entwicklungen, die Reihenfolge der Ausgliederung der idg. Sprachzweige. Hauptirrtum in diesen Diskussionen war und ist leider immer wieder die oberflächliche Annahme, dass Sprachen desto näher verwandt seien, je mehr Gemeinsamkeiten sie aufweisen, ohne zu bemerken, dass diese u.a. (!) vom Restbestand der erhaltenen Merkmale abhängen, also dem Ausmaß der Ersetzungen nach der jeweiligen Abtrennung (s. Holm 2003). Es ist leicht einsehbar, dass Sprachen mit starken Verlusten (wie Albanisch und Armenisch) trotz enger Verwandtschaft aufgrund der kleineren Datenbasis natürlich weniger Gemeinsamkeiten aufweisen als sogenannte Großkorpussprachen, wie Griechisch oder Indisch, was leider regelmäßig übersehen oder nicht beachtet wird.

1.1. Mathematisch ausgedrückt, stehen diese Parameter in einem hypergeometrischen Abhängigkeitsverhältnis und müssen zunächst transformiert werden. Erst aus dieser notwendigen SLRD-Transformation ergibt sich dann der quantitative Urzustand (der ursprüngliche Bestand an Merkmalen) im Zeitraum der Trennung jedes Sprachenpaares, die sog. 'Trennungsmenge'. Diese Mengen wurden in Holm 2000 für 91 Paarungen zwischen 14 belegten idg. Sprachzweigen publiziert.

1.2. Da die Menge an Originalmerkmalen im Laufe der geschichtlichen Einflüsse nur abnehmen kann, ergibt sich aus ihnen eine eindeutige Ausgliederungsreihenfolge (NICHT 'Glottochronologie'), die hier in der vereinfachten Form eines >Stammbaumes veranschaulicht wird, mit Einträgen der Wörter für 'Hand' in den verschiedenen Zweigen (jeweils älteste Form). Diese Ausgliederungsreihenfolge kann und sollte dann auf die verschiedenen Vorstellungen der ("Urheimat") angewendet werden, natürlich einschließlich der notwendigen Wanderbewegungen.

1.3. Die linguistisch erwiesenen Kontakte der indogermanischen mit den uralischen Sprachen von den frühesten Stadien an belegen eindeutig eine Urheimat in den Gebieten nördlich des Schwarzen Meeres ('Pontus') (vgl. z.B. Anthony 2007). Unsere >Ausbreitungskarte zeigt die von dort ausgehenden Migrationen. Es muss aber bemerkt werden, dass die Wanderwege bisher nicht überzeugend bewiesen werden konnten.

2. Rechnen wir chronologisch von den Daten der Hethiter zurück, scheint klar, dass die idg. Ausbreitung in etwa parallel zur Adaption der Bronze-Metallurgie, vierrädriger Ochsen-Karren, und überhügelter Gräber stattfand. Was nicht bedeutet(!), dass die Indogermanen diese Techniken und Sitten erfunden, aber sie zumindest intensiv angewandt haben. Als Hirtennomaden mit hohem Anteil an Pferden mussten sie auch gute Reiter sein, was natürlich auch einen ausschlaggebenden taktischen Vorteil beinhaltet. Der Versuch, die Zähmung von Pferden an Gebissspuren zu be- oder wiederlegen, übersieht, dass es Dutzende gebissloser Zäumungen gibt. Nach derzeitigem Wissen könnten die Migrationen sowohl in sehr viel kürzerer Zeit, oder auch etwas früher oder später stattgefunden haben.

3. Ein weiterer Diskussionspunkt ist die Frage, ob die sogenannten Anatolischen Sprachen, insbesondere Hethitisch,
- noch Vollmitglieder eines Ur-Indogermanisch waren;
- oder die letzteren ihre endgültige Ausprägung erst nach Abwanderung des Hethitischen vollendet haben.
Entgegen teilweise geäußerten Anspruchs können Methoden der Bio-Systematik nichts zur Lösung dieser Frage beitragen, aus Gründen, auf die in Absatz 4 eingegangen wird. Häufig mißverstehen Unbedarfte die a-priori-Ansetzung des Hethitischen als "Außengruppe" der angewandten Methoden (mit dem einzigen Zweck, einen rechnerisch nicht vorhandenen Ausgangspunkt zu schaffen), als Beweis ihrer frühen Abspaltung!

4. Die augenblicklich modischen Stammbaum-Rekonstruktionen durch mechanistische Anwendung von Computer-Programmpaketen aus der Biosystematik beruhen auf mindestens einer der folgenden irrigen Annahmen:
4.1. Dem primitiven Ähnlichkeits-Prinzip unter völliger Missachtung der in [1] dargestellten realen Abhängigkeiten ('Proportionalitätsfalle' - vgl. Ref. Holm 2003), dass Sprachen automatisch näher verwandt seien, je mehr "Kognaten" sie teilen (irrig mit 'evolutionärer Distanz' gleichgesetzt), oder sogar
4.2. Dass Wörter "nach der Uhr" ausgetauscht würden, was offensichtlich falsch ist, und eine blinde Wiederbelebung der obsoleten Glottochronologie darstellt: Kontrollieren Sie bitte irgendein Wort in einem etymologischen Wörterbuch und versuchen Sie, seine Geschichte zurückzuverfolgen: Es wird nie ein zeitlicher Automatismus sein, sondern - entsprechende Geschichtskenntnisse vorausgesetzt - eben historisch bedingte (kulturelle, technische, oder militärische) Ereignisse, die niemand vorhersehen oder gar berechnen kann. Z.B. ist im Englischen ca. 50 % des ursprünglich altsächsischen Vokabulars nicht "nach der Uhr" ersetzt worden, sondern, wie jeder geschichtlich etwas Gebildete weiß, durch die normannische Dominanz nach deren Sieg bei Hastings, neben einem langen lateinischen Bildungshintergrund in Kirche und Wissenschaft. Dass im "lexikostatistischen Grundwortschatz" diese Ersetzungen graduell geringer ausfallen, ändert nichts an der Unberechenbarkeit ihrer soziohistorischen Ursachen; doch selbst im englischen "Grundwortschatz" sind z.B. noch 6% - von diesen "Experten" unbemerkt - Entlehnungen aus nordischen Wikingerdialekten. Ausführlicher vgl. Holm 2007c. Man kann Journalisten nicht vorwerfen, dass Ihnen diese Zusammenhänge zunächst verborgen bleiben. Doch von Wissenschaftlern sollte erwartet werden können, dass sie sich um Hintergründe und Kausalitäten bemühen, statt diese mechanistischen Vergleiche blind zu übernehmen. --------


   
    5. Quellen:
- Holm, Hans J. (in laufender Bearbeitung): >Holm's persönliche (Vor-)Geschichtskarten Europas Von der Biscaya bis zum Kaspischen Meer - von der Eiszeit bis zum Mittelalter, in 27 Zeitscheiben - versuche, die Karten auf dem Laufenden zu halten, wenn ich Zeit habe. - Holm, Hans J. (2016, in laufender Bearbeitung): >Liste universaler indogermanischer Begriffe (M. Swadesh's 1971 posthum =letzte Verbesserung). Mit den möglichst unmarkierten Übersetzungen in 17 repräsentativen ausgestorbenen und lebenden indogermanischen Sprachen. - Ausschließlich (!) für lexikostatistische Zwecke gedacht! - Holm, Hans J. (2011a): Archäoklimatologie des Holozäns: Ein durchgreifender Vergleich der "Wuchshomogenität" mit der Sonnenaktivität und anderen Klimaanzeigern ("Proxies"). - Klimaänderungen im Mittel- und Spät-Holozäns in Eiskernen Grönlands und alpinen Baumgrenzen - Archäologisches Korrespondenzblatt 41-1:119-132. Zum PDF bitte>Archäoklimatologie klicken.
[Zusammenfassung: Bisherige Ansätze zur Validität sowohl der Wuchshomogenität mitteleuropäischer Eichenstandorte als auch verschiedener Anzeiger der Sonnenaktivität halten einem durchgreifenden Vergleich nicht stand. Dies gilt vor allem hinsichtlich behaupteter klimatischer Aussagen, z. B. zum Niederschlag. Bessere Übereinstimmungen scheinen dagegen über die letzten 9 000 Jahre zwischen den Baumgrenzen der Alpen als auch Temperaturaussagen des NGRIP-Eiskerns erkennbar zu sein.]

- Holm, Hans J. (2011b): "Swadesh lists" of Albanian Revisited and Consequences for Its Position in the Indo-European Languages. The Journal of Indo-European Studies 39-1&2. - English and updated version (jetzt mit >Corrigenda) -
[Abstract: In the last decade, several scholars pretended to have finally solved the subgrouping of Indo-European by new lexicostatistical attempts. The public, of course, was not able to perceive the questionable outcomes, of which the different and idiosyncratic positions of Albanian are in particular conspicuous. One reason for this is the inadequate methods, simply copied from bioinformatics (cf. Holm, H. J. 2007b above). That defective data contribute a lot to these mistakes, is now here first demonstrated by analyzing the Albanian part of three representative lists frequently employed in these studies: The presumably thirteen percent mistakes there mix inextricably with the overlooked stochastic dispersion. Seventeen new etymologies are proposed, however, thirty percent of the list remain unsolved or questionably. Moreover, the high amount of recent replacements in Albanian is one more compelling argument against the rate assumption in glottochronology.]

- Holm, Hans J. (2010): Besprechung zu: Frank Sirocko (Hg.) "Wetter, Klima, Menschheitsentwicklung, Von der Eiszeit bis ins 21. Jahrhundert". Bitte >Falsche Klimadarstellung klicken.
- Holm, Hans J. (2009): Albanische Basiswortlisten und die Stellung des Albanischen in den indogermanischen Sprachen. Zeitschrift für Balkanologie Nr. 45-2. Wiesbaden, Harrassowitz. 172-206. Printexemplar vom Autor oder >online - Critical synopsis of some word lists adduced in lexicostatistical studies -
[Zusammenfassung: In der vergangenen Dekade hat eine Reihe von Wissenschaftlern den Anspruch erhoben, mittels neuer lexikostatistischer Verfahren die Untergliederung der indogermanischen Sprachen gelöst zu haben. Von der Öffentlichkeit konnte indes nicht erwartet werden, die Fragwürdigkeit dieser Ergebnisse zu erkennen, wobei die unterschiedlichen und z.T. idiosynkratischen Einordnungen des Albanischen besonders auffallen. Einer der Gründe hierfür liegt sicher in der Unangemessenheit der oft aus der Bioinformatik übernommenen Methodik (vgl. Holm, H. J. 2007, The new Arboretum of Indo-European ‘Trees’, in: Journal of Quantitative Linguistics, 14-2). Dass zusätzlich in erheblichem Maße Datenfehler vorliegen, wird hier anhand des albanischen Teils von drei häufig zu diesen Studien herangezogenen Listen nachgewiesen: Im Ergebnis bilden die etwa dreizehn Prozent Fehler eine Mischung mit der vernachlässigten stochastischen Streuung. Es werden siebzehn neue Etymologien vorgeschlagen, doch bleiben immer noch etwa dreißig Prozent des albanischen Grundwortschatzes von unklarer Herkunft. Dies und der stark wechselnde Einfluss von Entlehnungen bilden letztlich ein weiteres Argument gegen die glottochronologische Grundannahme fester Ersetzungsraten.]

- Holm, Hans J. (2008): The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. In: C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker (Editors): Data Analysis, Machine Learning, and Applications. Proceedings of the 31th Annual Conference of the Gesellschaft für Klassifikation e.V., Albert-Ludwigs- Universität Freiburg, März 7-9, 2007. Springer-Verlag, Heidelberg-Berlin: 629-636. ISBN 978-3-540-78239-1. Den Entwurf finden Sie hier >SLRD.pdf; - Lösung von Verteilungsproblemen in natürlichen Korpora -> verbesserter idg. "Stammbaum" - die Originalpräsentation finden Sie auf Holm_Indo-European_Subgrouping_by_SLRD_Freiburg_2007_21155000/.
[Zusammenfassung: Linguisten pflegen anzunehmen, dass Sprachen desto näher verwandt sind, je mehr Merkmale, insbesondere gemeinsame Neuerungen, sie teilen. In Holm (2003) wurde gezeigt, dass diese Annahme irrig ist, weil dabei übersehen wird, dass die Menge gemeinsamer Übereinstimmungen stochastisch von drei weiteren Parametern abhängt. Nur mit Hilfe des 'maximum likelihood Schätzers' der Hypergeometrischen Verteilung sind wir in der Lage, die Anzahl derjenigen gemeinsamen Merkmale herauszufinden, die im Zeitraum der Trennung von zwei Sprachen diesen noch gemeinsam eigen war. Dadurch konnte eine Ausgliederungs- reihenfolge innerhalb solcher Sprachfamilien gewonnen werden, für welche die erforderlichen Daten verfügbar sind. Nach Anwendung auf die Daten des IEW (Pokorny 1959) waren die sich ergebenden späten Ausgliederungen des Hethitischen, Albanischen und Armenischen zwanglos mit deren zentraler geographischen Lage erklärbar und daher unverdächtig. Erst, als in einer weiteren Anwendung auf Daten der Mixe-Zoque- Familie dieselbe Beobachtung gemacht wurde, dass stets schwach belegte Sprachen spät auszugliedern schienen, konnte ein systematischer Fehler vermutet werden. Die Ursache dieses Fehlers wird aufgedeckt, der nur bei Merkmalslisten natürlicher Sprachen auftritt, im Gegensatz zu den in Holm (2007a) benutzten Testlisten mit stochastisch normalverteilten Daten. Für diese Untersuchung stand nun als erheblich modernere und zuverlässigere Datenquelle das "Lexikon der indogermanischen Verben" (Rix et al. 2001) zur Verfügung. In der Tat bewahrheitete sich der Verdacht, und es wird gezeigt, wie aus solchen quasi-Pareto-verteilten Daten trotzdem die korrekte Ausgliederungsreihenfolge gewonnen werden kann. Es ergibt sich eine (teilweise) neue Ausgliederungsreihenfolge der indogermanischen Hauptzweige, die gut zu den grammatischen Tatsachen als auch der geographischen Verteilung passt. Vor allem ergibt sich klar, dass sich die anatolischen Sprachen keinesfalls als erste getrennt haben können und widerlegt damit eindeutig die "indo- hethitische Hypothese".]

- Holm, Hans J. (2007a): Language Subgrouping. In: Grzybek, P. & R. Köhler (Editors), Exact Methods in the Study of Language and Text. Dedicated to Professor Gabriel Altmann on the occasion of his 75th birthday. [Quantitative Linguistics 62]. Berlin: de-Gruyter: 225-235. - Umgang mit stat. Streuungen in mehrstufigen Untergliederungen -
[Zusammenfassung: Nach mehreren Jahren der Erprobung, und angesichts vieler konkurrierender Verfahren, wird die Trennmengenberechnungsmethode (Holm 2000, passim) im Hinblick auf ihre Erfordernisse verfeinert. Es wird getestet, wie stochastische Streuung von schlechten Daten unterschieden werden kann und wie Daten beschaffen sein sollten.]

- Holm, Hans J. (2007b): The new Arboretum of Indo-European "Trees" - Can new Algorithms Reveal the Phylogeny and even Prehistory of IE? In: Journal of Quantitative Linguistics 14-2, S. 167-214. -> in D verfügbar in den Uni-Bibliotheken B, BO, EF, F, Gö/Phil, M, TR. Original-Kopien über http://cats.tfinforma.com/PTS/in?t=rl&m=237780. Den Entwurf finden Sie hier >Arboretum IE trees. - Aktualisierung auf 2006, neuere lexikostatistische Ansätze -
[Zusammenfassung: Die Spezialisierungen auf den Gebieten der Linguistik einerseits und der Bioinformatik andrerseits führen zunehmend zu Missverständnissen und falschen Ergebnissen, bedingt durch unzureichende Kenntnis der Bedingungen der jeweils angewandten Methoden und Materialien. Diese werden analysiert und die Ergebnisse zur Beurteilung der augenblicklichen Schwemme von Versuchen zur Konstruktion neuer Stammbäume der indogermanischen Sprachen herangezogen.]

- Holm, Hans J. (2007c): Vortrag "SLRD-Methode in der Indogermanistik" beim Institut für vergleichende Indogermanistische Sprachwissenschaft der Universität Bonn. Bitreduzierte Folien (bitte Speichern und Entpacken) >SLRD_BN07.
- Holm, Hans J. (2005): Genealogische Verwandtschaft. Kapitel 45 in 'QUANTITATIVE LINGUISTIK; Ein internationales Handbuch' [HSK-Serie, Bd. 27], Berlin: de Gruyter. - Lexikostatistische Ansätze zur Gliederung von Sprachen im 20.Jh. Aktualisierung s.u. 2008 -
[Inhalt: 1. Wann sind Sprachen "verwandt"? 2. Datenbewertung; 3. Beziehungsmaße; 3.1. Synchrone ~; 3.2. Diachrone Beziehungsmaße; 4. Strukturierung genealogischer Abhaengigkeiten.]

- Holm, Hans J. (2003): The proportionality trap, Or: what is wrong with lexicostatistical subgouping? In: Indogermanische Forschungen 108: 39-47. - Grundlagen auf englisch; auch für Nicht-Mathematiker geeignet -
[Zusammenfassung: Es wird anhand eines Experiments gezeigt, dass die rohe Anzahl von Übereinstimmungen (z.B. der Kognaten) zwischen zwei verwandten Sprachen prinzipiell nicht den Grad der genealogischen Verwandtschaft wiedergeben kann. Anschließend wird demonstriert, wie durch Berücksichtigung aller statistisch bestimmenden Parameter die unterschiedliche Ausgangsbasis der Paarungen und damit die korrekte Ausgliederungsreihenfolge wieder hergestellt werden kann.]

- Holm, Hans J. & Embleton, Sheila (2001): Review of 'Mathematical foundations of Linguistics' (by Hubey, H. Mark, 1999, LINCOM handbooks in Linguistics 10, Muenchen: LINCOM); In: Journal of Quantitative Linguistics 8-2:149-62.
- Holm, Hans J. (2000): Genealogy of the Main Indo-European Branches Applying the Separation Base Method. In: Journal of Quantitative Linguistics 7-2:73-95. -Anwendung auf Pokornys Indogermanisches Etymologisches Wörterbuch; Aktualisierungen s.u. 2007a,b -
[Zusammenfassung: In bisherigen quantitativen Analysen der genealogischen Beziehungen zwischen Sprachen wurde der durch Ersetzungen bedingte systematische Fehler nicht angemessen eliminiert, was nur zu falschen Ergebnissen führen konnte. Erst dank der Auszählung der riesigen und damit statistisch erst signifikanten Datenmenge aus J. Pokorny „Indogermanisches Etymologisches Wörterbuch“ (Bern: Francke, 1959) in N. Birds „Distribution of Indo-European root morphemes“ (Wiesbaden: Harrassowitz, 1982) war es trotz einiger bekannter Mängel möglich, die Anzahl der Lexeme im Zeitraum der Trennung jedes Sprachenpaares mit Hilfe eines robusten Schätzers zu berechnen und damit die Ausgliederungsreihenfolge zu erschließen. Die üblichen Schwarz- Weiß-Hypothesen, z.B. pro oder kontra eine italo-keltische Verwandtschaft, können den realen Entwicklungen nicht gerecht werden und sollten diesen differenzier- teren Ergebnissen Platz machen.]

------------

Neu ab 2010-05-27:
free counters
addr