Deutsch ist unendlich endlich und endlich unendlich.

Die Sprache ist das besondere Merkmal des vor etwa einhunderttausend Jahren entstandenen Menschen, das ihn unter den anderen Lebewesen der Welt hervorhebt. Zwar können sich anscheinend auch Tiere mittels eigentümlicher Verhaltensweisen untereinander in einem gewissen Maße verständigen. Umfangreichere Erfahrungsaustausche oder vielfältigere Mitteilungen sind ihnen aber nicht möglich.

Die dazu erforderliche Sprache ist dem Menschen nicht von der Natur mitgegeben. Zwar kann schon das Neugeborene gleich nach der Geburt schreien oder weinen. Sprechen kann es aber während einer längeren Zeit noch kein einziges Wort.

Allerdings hat die Natur den Menschen mit der Sprachmöglichkeit und der Lernfähigkeit ausgestattet. Notwendig dafür war einerseits eine anatomische Umgestaltung des Kehlkopfs, die sich im Lauf der Entwicklung vollzog. Hinzukommen musste außerdem eine Vergrößerung des Gehirns, die sich vielleicht aus dem aufrechten Gang in einer baumarmen, grasreichen Steppe oder dem Verzehr besonders hirnstärkender Nahrungsmittel allmählich ergab.

Wann auf dieser geänderten Grundlage der Mensch erstmals ein Wort sprach, ist ungewiss, doch ist am ehesten an eine Zeit vor rund fünfzigtausend Jahren zu denken. Ebenso unbekannt ist, ob dies an einem einzigen Ort geschah und sich von dort aus über die Erde verbreitete, oder ob verschiedene Menschen an unterschiedlichen Stellen von Anfang an verschiedene Sprachen erfanden. Jedenfalls entwickelten sich im Laufe der Zeit Tausende unterschiedlicher, meist eine Verständigung mit den Sprechern anderer Sprachen ausschließender Sprachen, von denen trotz des jüngeren weltweiten Sterbens vieler einzelner kleiner Sprachen infolge großräumigerer Begegnungen in der sich globalisierenden Gegenwart noch mehr als sechstausend leben.

Eine der zehn großen Sprachen der Welt mit ziemlich vielen Angehörigen ist das Deutsche, das mehr als 100 Millionen Menschen von derzeit etwa insgesamt 7,3 Milliarden Menschen der Welt sprechen und verstehen. Es gilt den Nichtdeutschen als schwer. Dennoch wird es von Kindern aus ihrem tatsächlich geeigneten Sprachumfeld in wenigen Jahren mit spielerischer Leichtigkeit aufgenommen.

Die Vielfalt der das Deutsche begründenden Teile bildet dabei für den mit bewundernswerten Rezeptionsfähigkeiten ausgestatteten Menschen kaum eine wirkliche Schwierigkeit. Das Kind versucht, wohl angeregt durch die von ihm gehörten Laute naher Menschen, mit und ohne unmittelbare Aufforderung mittels seines Mundes und seiner Stimmbänder und der bei dem Atmen bewegten Luft die Formung von Lauten. In der Regel die nächsten Mitmenschen greifen bei diesen Verhaltensweisen längere Zeit durch Vorsprechen oder Mitsprechen unterstützend und bessernd ein, bis dem Kind gelingt, was seine Zuhörer von ihm erwarten und immer besser verstehen.

Auf diese Weise ergreift in einem deutschen Umfeld das Kind mit vielen fehlerhaften Versuchen über a, o, u, i, e, Papa, Mama, Oma, Opa und andere ähnlich einfache Einheiten das Deutsche. Für nichtdeutsche Erwachsene ist dieser Lernvorgang erheblich anstrengender und schwieriger. Zwar kann das Vorhaben auch bei vielen von ihnen in seinem Ergebnis hervorragend gelingen, aber Deutsch ist eben für die meisten in einem anderssprachigen Umfeld aufgewachsenen Ausländer eine schwere Sprache mit zahlreichen Regeln und Ausnahmen und damit entsprechend vielen Fehlermöglichkeiten.

Wann und wie diese Sprache mit all ihrer gegenwärtigen vielfältigen Ausdruckskraft entstanden ist, lässt sich der seit Jahrhunderten wissenschaftlich betriebenen Sprachgeschichte entnehmen. Nach ihren Erkenntnissen gehört das Deutsche zu der weltweit führenden Sprachfamilie des nicht durch Überlieferung bezeugten, vielleicht 4500 wissenschaftlich erschlossene, im Sprechvorgang meist flektierbare Ansätze (wie beispielsweise *ablu-, Apfel oder *uk-, *euk-, schreien, rufen) in 29 weitgehend anerkannten Grundeinheiten (Buchstaben) erfassenden Indogermanischen, die in der Gegenwart vor allem in Europa, Südwestasien, Amerika, Australien und einigen Teilen Afrikas verbreitet ist. Sie entstand möglicherweise südlich des Ural an der Grenze zwischen Asien und seinem westlichen Halbkontinent Europa und dehnte sich von dort vor allem durch Wanderungen und Eroberungen ihrer Sprecher in viele Richtungen aus.

Innerhalb der noch schriftlosen und damit überlieferungsarmen und nur wissenschaftlich rekonstruierbaren vorgeschichtlichen Indogermanen entstanden im Zuge weitreichender und langdauernder Ortswechsel in Jahrhunderten oder Jahrtausenden neue Teilvölker wie die Inder und Iraner in Südwestasien oder die Griechen, Römer, Kelten, Balten und Slawen in Europa. Erste Spuren dieser sprachlichen Aufgliederung sind in der Mitte des zweiten vorchristlichen Jahrtausends in Südeuropa zu erkennen. Etwa tausend Jahre später berichten antike Autoren dann für die nördliche Mitte Europas erstmals von einzelnen Völkern der etwas später auch zusammenfassend genannten Germanen, deren Name noch der Gegenwart Rätsel aufgibt.

Nach der mit dem Leben und Tod des Religionsstifters Jesus Christus allmählich mehr und mehr aufgegriffenen zahlenmäßigen Zeitenwende lernten einzelne Germanen in dem kulturell bereits höher entwickelten italischen Umfeld des römischen Weltreichs die im Vorderen Orient während des zweiten vorchristlichen Jahrtausends aus älteren, konkreteren Bildern durch Verallgemeinerung geschaffene Kunst, Gedanken verhältnismäßig dauerhaft in wenigen abstrahierenden Zeichen festzuhalten. Sie verwendeten dazu eine später als Runen bezeichnete Umformung eines in Italien benutzten, aus 24 kaum systematisch von A, B und C bis X, Y und Z geordneten Systems von Zeichen, mit dessen Hilfe die erheblich größere Zahl der einzelmenschlichen Laute zu einem hilfreichen graphischen zwischenmenschlichen Verständigungsmittel umgebildet wurde. Nach ersten kurzen, oft schwer entzifferbaren und nicht immer leicht überzeugend erklärbaren germanischen Inschriften auf Stein und Metall entstand dabei mit wachsender Übernahme der christlichen Religion durch Germanen am Ende des vierten nachchristlichen Jahrhunderts das umfassendere Buch in germanischer bzw. genauer gotischer Sprache.

Für dieses Gotische lassen sich rund 5700, ganz überwiegend als Nomina deklinierbare oder als Verben konjugierbare Ansätze erweisen oder zumindest wahrscheinlich machen. Für das umfänglicher aus dem noch im Altertum überlieferten Gotischen und den späteren mittelalterlichen Stufen des Deutschen, des Friesischen, Englischen und Skandinavischen rekonstruierbare Germanische insgesamt sind es etwa 12000 Stichwörter. In dem Verhältnis zu dem Indogermanischen bedeutet dies eine gute Verzweieinhalbfachung des erkennbaren Wortschatzes.

Die in diesem Zusammenhang verwendeten Sprachen der Indogermanen und Germanen einschließlich der Goten waren demnach noch nicht Deutsch. Aber nur kurze Zeit nach dem mit der Völkerwanderung verbundenen Übergang des Altertums in das Mittelalter um 500 n. Chr. wurde auch das besondere Deutsche sichtbar. Jedenfalls sind nach und neben einzelnen älteren südgermanischen Runeninschriften spätestens seit dem achten Jahrhundert deutsche Texte in zunehmender Zahl und Länge überliefert.

Ein einheitliches Deutsch gab es zu dieser Zeit freilich nicht, weil die einzelnen aus den Germanen erwachsenen Völkerschaften wie Franken, Alemannen, Thüringer, Bayern, Langobarden und Sachsen jeweils ihre eigenen Sprachen Altfränkisch, Altalemannisch, Altthüringisch, Altbayerisch, Langobardisch und Altsächsisch nutzten. Unter der seit dem Ende des weströmischen Kaisertums im Jahre 476 n. Chr. kriegerisch aufgerichteten Herrschaft der seit der Völkerwanderung zunächst vom Geschlecht der Merowinger und dann ab 751 n. Chr. von der Familie der Karolinger geführten Franken wurden die Völker zwischen Alpen, Atlantik, Nordsee und Elbe einschließlich der Gallorömer aber zu einem neuen Großreich zusammengefasst, in dem allerdings noch verschiedene Sprachen in unterschiedlichen Gebieten gesprochen wurden. Zumindest notdürftig haben sich dabei jedoch Franken, Alemannen, Thüringer, Bayern, Langobarden und Sachsen auch untereinander verstanden.

Mit der Teilung dieses fränkischen Reiches in einen westlichen Teil und einen östlichen Teil unter den späteren Karolingern (843/877) sowie dem Aussterben erst der ostfränkischen Karolinger (911) und dann auch der westfränkischen Karolinger (987) entstanden das den alten Namen der Franken bewahrende gallorömische Frankreich im Westen und das einen neuen verbindenden Namen annehmende deutsche Land oder deutsche Reich im Osten. Ihnen entsprechen das galloromanische Französische auf der einen Seite und das germanistische Deutsche auf der andern Seite. Deutsch sind dabei das Althochdeutsche der südlicheren Franken, der Alemannen, Bayern, Thüringer sowie Langobarden und das von der althochdeutschen Lautverschiebung ausgesparte Altsächsische der Sachsen sowie das gleichfalls unverschobene Altniederfränkische der nordwestlichen Franken.

Der Umfang dieser ersten deutschen Sprachen lässt sich auf Grund der bekannt gebliebenen Überlieferung wie der einigermaßen gesicherten Rekonstruktion überschlägig berechnen. Er beträgt für das Althochdeutsche rund 40000 Ansätze und Verweise, deutlich weniger für das bescheidener überlieferte Altsächsische und nochmals viel weniger für das nur in wenigen Zeugnissen belegte Altniederfränkische, woraus sich ein additives Wörterbuch der drei altdeutschen Sprachen von mehr als 50000 Ansätzen (51491) ergibt, das den rekonstruierten Wortschatz des Germanischen doch bereits erheblich übersteigt.

Während des Übergangs vom Frühmittelalter zum Hochmittelalter werden diese ersten deutschen Sprachen aus nicht genau bekannten Gründen in ihren Formen umgebildet. Aus dem Althochdeutschen wird das Mittelhochdeutsche, aus dem Altsächsischen das Mittelniederdeutsche und aus dem Altniederfränkischen das Mittelniederländische. Der Wortschatz dieser neuen Sprachstufen Mittelhochdeutsch und Mittelniederdeutsch lässt sich auf der Grundlage der Überlieferung auf vielleicht etwa (je) 100000 Ansätze und Verweise aus der Zeit von 1070 bis 1500 bzw. von 1200 bis 1650 schätzen. Ursächlich für die allgemeine Zunahme des Wortschatzumfangs dürfte dabei neben der deutlich vermehrten Sprecherzahl und der zunehmenden Schriftlichkeit auch die erkennbare berufsständische Differenzierung der Lebensverhältnisse der wachsenden, Handel und Gewerbe in Städten neben Ackerbau und Viehzucht auf dem Land aufgreifenden Gesellschaften sein.

An dem Übergang des Mittelalters zu der Neuzeit ändern sich die deutschen Sprachen in ihren Formen nochmals erkennbar. Aus dem Mittelhochdeutschen wird über das derzeit lexikographisch grundlegend aufgegriffene, zwischen spätem Mittelhochdeutsch und frühem Neuhochdeutsch zusätzlich eingeschobene Frühneuhochdeutsche (1350-1650), dessen alphabetisch geordneter eigener Wortschatz dieser drei Jahrhunderte derzeit noch nicht vollständig erfasst ist, aber vielleicht auf 50000 Ansätze geschätzt werden kann, das bis in die Gegenwart reichende Neuhochdeutsche und aus dem Mittelniederdeutschen etwas später das Neuniederdeutsche. Unter dem Einfluss Martin Luthers wird dabei das Neuniederdeutsche seit dem 17. Jahrhundert als Schriftsprache aber von dem Neuhochdeutschen praktisch vollständig verdrängt.

Seitdem herrscht in den Ländern des deutschen Sprachraums bzw. in dem Heiligen römischen Reich das Neuhochdeutsche eindeutig vor. Für dieses werden seit der Erfindung des Buchdrucks mit beweglichen Lettern durch Johann Gutenberg um 1450 in fortführender Ablösung handschriftlicher mittelalterlicher Glossare und anderer Wörtersammlungen umfangreiche Wörterbücher in zahlreichen Exemplaren geschaffen. Wichtigste diesbezügliche Forscher waren nach Petrus Dasypodius (um 1490-1559, Dictionarium Latinogermanicum 1536) Josua Maaler (Die teutsch Spraach, 1561), Johann Leonhard Frisch (Teutsch-lateinisches Wörterbuch, 1741) und Johann Christoph Adelung (Versuch eines vollständigen grammatisch-kritischen Wörterbuches der hochdeutschen Mundart, 5 Bände 1774ff., überarbeitet als Grammatisch-kritisches Wörterbuch der hochdeutschen Mundart, 1811, rund 58500 Lemmata zum deutschen Wortschatz der zweiten Hälfte des 18. Jahrhunderts in vier Bänden).

Während des 19. Jahrhunderts unternahmen dann die aus politischen Gründen aus den Diensten konservativer bis reaktionärer Herren entlassenen Brüder Jakob Grimm (1785-1863) und Wilhelm Grimm (1786-1859) einen neuen wissenschaftlicheren Sammelversuch. Sie veröffentlichten ab 1838 ein eigenes Deutsches Wörterbuch. Es sollte den gesamten Wortschatz des Neuhochdeutschen seit dem Beginn der Neuzeit umfassen und enthält damit auch seitdem bereits veraltete oder sogar abgestorbene Ansätze.

Dabei hatten die Brüder Grimm allerdings wie jeder vorangehende Lexikograph eine grundsätzliche Vorgabe. Sie besteht darin, dass die (26) Buchstaben des deutschen Alphabets (mit j und w, aber ohne die zu a, o und u gebildeten und ihnen bei der Alphabetisierung meist zugeordneten Umlaute ä, ö und ü sowie das zu s zu stellende ß) nicht mathematisch gleichmäßig zu je einem Sechsundzwanzigstel oder 3,84 Prozent in Texten benutzt werden. Innerhalb eines ausreichend langen Textes des Neuhochdeutschen hat nach Wikipedia a vielmehr die Häufigkeit 6,51 Prozent, b 1,68 Prozent, c 3,06 Prozent, d 5,09 Prozent, e 17,39 Prozent, f 1,66 Prozent, g 3,01 Prozent, h 4,76 Prozent, i 7,55 Prozent, j 0,27 Prozent, k 1,21 Prozent, l 3,44 Prozent, m 2,53 Prozent, n 9,78 Prozent, o 2,51 Prozent, p 0,79 Prozent, q 0,02 Prozent, r 7 Prozent, s 7,27 Prozent, t 6,15 Prozent, u 4,35 Prozent, v 0,67 Prozent, w 1,89 Prozent, x 0,03 Prozent, y 0,04 Prozent und z 1,13 Prozent, so dass die Spanne von 17,39 Prozent (e als häufigster Buchstabe deutscher Texte vor n, i, s, r, a, t, d, h, u, l, c, g, m, o, b, w, f, k, z, p, v, j, y, x) bis zu 0,02 Prozent (q als seltenster Buchstabe deutscher Texte) reicht und e etwa 870mal öfter verwendet wird als q sowie alle fünf Vokale zusammen in 38,31 Prozenten aller Fälle.

Unklar ist dabei aber noch, ob jeder Buchstabe mit dieser Häufigkeit auch den Anfang der Wörter einnehmen kann. Dies ist deswegen besonders bedeutsam, weil die einfachste und zugleich gebräuchlichste Ordnung normalisierter deutscher Wörter in der Gegenwart nach dem Alphabet erfolgt. Deswegen fragt es sich, ob eine Betrachtung nur der Anfangsbuchstaben der Wörter eines Textes zu dem gleichen Ergebnis führt.

Prüft man dies beispielsweise für die etwa 260000 Wörter von Wahrigs Deutschem Wörterbuch, so ergeben sich für die Anfangsbuchstaben A 7,4 Prozent, B 6,3, C 0,7, D 3,8, E 5,3, F 4,9, G 5,9, H 6,1, I 1,6, J 0,6, K 7,0, L 3,2, M 4,5, N 2,5, O 1,1, P 4,7, Q 0,3, R 4,1, S 12,5, T 3,5, U 3,0, V 3,9, W 3,5, X 0,0242, Y 0,0242 und Z 3,03 Prozent sowie für alle 1757145 unterschiedlichen Wortformen des Textes der ersten Fassung des Wörterbuchs der Brüder Grimm für A 5,08 Prozent, B 5,18, C 2,55, D 3,09, E 3,84, F 4,28, G 8,26, H 5,06, I 1,23, J 0,66, K 4,98, L 3,04, M 3,66, N 2,39, O 1,48, P 3,69, Q 0,31, R 3,35, S 14,01, T 4,38, U 4,64, V 5,04, W 6,58, X 0,03, Y 0,08 und Z 3,12 Prozent.

Den Brüdern Grimm stand bei ihrer Arbeit keine dieser Vergleichsmöglichkeiten zur Verfügung. Zwar gingen auch ihnen lexikographische Arbeiten voraus, die sie zu Grunde legen konnten. Darüber hinaus musste aber ihr von 80 Mitarbeitern unterstützter eigener Sammlerfleiß in der verfügbaren Literatur entscheidend sein.

Auf dieser Grundlage kamen die Brüder Grimm bis zu ihrem Tode in einem ersten Band von A bis Biermolke (1854), in einem zweiten Band von Biermörder bis Dwatsch (1860) und in einem dritten Band von E bis Forsche (1862) und verstarb Jakob Grimm am 20. September 1863 über der Bearbeitung des für den vierten Band vorgesehenen Artikels „Frucht“. Dabei umfasste der Buchstabe A anscheinend 9689 Artikel, der Buchstabe B 13784, der Buchstabe C 514, der Buchstabe D 7710, der Buchstabe E 10365 und der Buchstabe F 14746. Insgesamt waren demnach in der Erstfassung von A bis F 59802 Lemmata enthalten.

Diese ursprünglich nur in wenigen hundert Exemplaren veröffentlichte Leistung beeindruckte die Allgemeinheit so sehr, dass in Wahrung des Erbes der Brüder Grimm eine Vollendung des Werkes bis zu dem Buchstaben Z durch Nachfolger beschlossen wurde. Ab 1878 erschienen deshalb durch andere Bearbeiter 13 weitere, mehrfach zusätzlich in eigenständige Unterbände untergliederte, bis Zypressenzweig reichende Bandeinheiten. Die 380. und letzte Lieferung konnte im Januar 1961 123 Jahre nach dem Beginn der Bearbeitung vorgelegt und das gesamte Vorhaben 1971 durch ein Quellenverzeichnis abgeschlossen werden.

Dabei wurden nacheinander die zunächst noch fehlenden 20 Buchstaben bearbeitet. Davon hatte G 37064 Ansätze, H 14407, I 884, J 1476, K 18994, L 8148, M 9475, N 7233, O 2855, P 9758, Q 1222, R 10444, S 59677, T 15365, U 15611, V 17331, W 30934, X 12, Y 29 und Z 14578. Das ergab nach einer Berechnung eine Gesamtsumme von vielleicht 332304 Stichwörtern.

Aus ihr lassen sich nachträglich die prozentualen Anteile der einzelnen Buchstaben ermitteln. Dabei hat A 2,92 Prozent, B 4,15, C 0,15, D 2,32, E 3,12, F 4,44, G 11,15, H 4,34, I 0,27, J 0,44, K 5,72, L 2,45, M 2,85, N 2,18, O 0,86, P 2,94, Q 0,37, R 3,14, S 17,96, T 4,62, U 4,70, V 5,22, W 9,31, X 0,00, Y 0,01 und Z 4,39. Demnach kamen die ersten sechs, im Wesentlichen von den Brüdern Grimm bearbeiteten Buchstaben insgesamt auf 17,10 Prozent, die übrigen 20 Buchstaben auf 82,90 Prozent.

Seit der Fertigstellung des Werkes gibt es damit neben eigenen (indogermanischen, germanischen, gotischen;) althochdeutschen, altsächsischen, altniederfränkischen, mittelhochdeutschen und mittelniederdeutschen Wörterbüchern ein großes Gesamtwörterbuch der (neuhoch-)deutschen Sprache. Es umfasst insgesamt 32 (mit Quellenverzeichnis 33) Einzelbände, die 1984 auch als Taschenbücher erschienen und inzwischen elektronisch zugänglich sind. Es hat 67744 Textspalten mit vor allem in den späteren Strecken oft ziemlich umfangreichen und für den eiligen Interessenten nicht immer sehr übersichtlichen Ansätzen bzw. Stichwörtern.

Allerdings veränderten sich während der mehr als 123 bzw. 130 Jahre währenden Bearbeitung sowohl die technischen Möglichkeiten wie auch die sprachwissenschaftlichen Ansprüche deutlich. Deswegen wurde bereits 1957 und damit noch vor dem vollständigen Abschluss der Erstbearbeitung eine teilweise Neubearbeitung dieses in allmählichem Fortschreiten gewonnenen Ergebnisses zwecks Vereinheitlichung und Verbesserung beschlossen. Sie sollte in einer Kooperation zwischen Forschergruppen in Ostberlin in der Deutschen Demokratischen Republik und Göttingen in der Bundesrepublik Deutschland den ältesten Teil von A bis einschließlich des gesamten Buchstabens F auf einen neueren und besseren bzw. auf einen neuesten Stand bringen.

Von diesem Vorhaben konnte die erste Lieferung bereits 1965 und damit nur wenige Jahre nach dem Textabschluss der Erstbearbeitung vorgelegt werden. Statt der ursprünglich etwas mehr als drei Bände der Wortstrecke von A bis Forsche bzw. Ende des Buchstabens F wurden nunmehr neun Bände geplant, von denen Band 1 von A bis Affrikata 1983, Band 2 von Affront bis ansüßen (ansüszen) 1998, Band 3 von Antagonismus bis azyklisch 2007, Band 4 von B bis Betreuung 2013, Band 5 von Betrieb bis (derzeit Bottich 2016), Band sechs von Anfang D bis D-Zug 1983, Band 7 von Anfang E bis Empörer 1993, Band 8 von emporheben bis exzitieren 1999 und Band 9 von Anfang F bis Fux 2006 vorgelegt werden konnten, so dass derzeit nur noch eine in Bearbeitung befindliche größere Lücke bei B und C in dem bereits zu mehr als der Hälfte (Bottich) erschienenen Band 5 besteht.

Die Neubearbeitung bietet für den Buchstaben A 12622 Lemmata, für den Buchstaben D 9264, für den Buchstaben E 14977 und für den Buchstaben F 49718. Dadurch wird der Wortbestand durch sie anscheinend nicht völlig einheitlich verändert. Für den Buchstaben B entsprechen für die Strecke vom Anfang des Buchstabens bis zu dem zuletzt veröffentlichten Lemma Bottich den 10292 Lemmata der Erstbearbeitung vielleicht (nur) 3597 Ansätze der Neubearbeitung. Bei gleichmäßiger Weiterbearbeitung von B könnten den restlichen Ansätzen des B der Erstfassung ab Bottich 1429 Stichwörter gleichstehen, woraus sich für den gesamten Buchstaben B eine Lemmatazahl von 5026 (statt 13784) ergäbe, während für C wegen seiner geringen Größe und Bedeutung derzeit rechnerisch am einfachsten von den 514 Lemmata der Erstfassung ausgegangen werden könnte.

Die Neubearbeitung sondert manche Einträge der Erstfassung aus. Sie fügt aber vor allem zusätzliche neue Einträge ein. In den bisher erschienenen Teilen enthält sie etwa 90000 Stichwörter, so dass insgesamt nach Vervollständigung des Buchstabens B in Band 5 rechnerisch 92099 Ansätze zu erwarten sein könnten.

Geht man davon aus, dass in der endgültigen Fassung der Neubearbeitung der Strecke von A bis F 32297 zusätzliche Lemmata enthalten sein könnten, so ergibt sich für das aus der Ursprungsfassung von G bis Z und den neubearbeiteten Teilen von A bis F zusammengesetzte und damit auf einen neueren Gesamtstand gebrachte Gesamtwörterbuch der Brüder Grimm eine neue Summe von rund 367596 neuhochdeutschen Stichwörtern. Damit ist der erfasste Wortschatz gegenüber dem bekannten Althochdeutschen etwa verneunfacht. Gegenüber dem bekannten Mittelhochdeutschen bzw. Mittelniederdeutschen ist er immerhin mehr als verdreifacht.

Deutlich zeigt sich dabei aber, dass den Auswahlentscheidungen der Bearbeiter erhebliches Gewicht zukommt. Anders lässt es sich kaum erklären, dass in der Neubearbeitung A, D und E erkennbar um etwa ein Drittel erweitert wurden, B eine deutliche Kürzung erfuhr und F sehr stark vermehrt wurde. Dementsprechend ist der neuhochdeutsche Wortschatz anscheinend durchaus relativ, wobei in der Gegenwart allgemein S (11,8 %), K (7,3 %), A (7,1 %), P (7,0 %), B (5,7 %) und M (5,7 %) als die sechs häufigsten Anfangsbuchstaben deutscher Wörterbücher mit fast der Hälfte aller Lemmataanfänge angesehen werden.

In losem Gefolge dieses auf Grund seiner langen Entstehungsgeschichte von vielleicht insgesamt 180 Jahren (1838-2018) in sich nicht vollständig einheitlichen und in der gezeigten Hinsicht irgendwie relativen Großwörterbuchs des Neuhochdeutschen wurden seit dem 19. Jahrhundert noch weitere Sprachwörterbücher begonnen und teilweise auch bereits vollendet. Neben zahllosen Gebrauchswörterbüchern auf der Grundlage des Werkes der Brüder Grimm sind vor allem zwei weiterführende Vorhaben besonders zu erwähnen. Das eine ist das Deutsche Rechtswörterbuch, das andere das Wörterbuch der deutschen Gegenwartssprache.

Das Deutsche Rechtswörterbuch der älteren deutschen (bzw. westgermanischen), von den ersten Anfängen der Überlieferung bis zu dem Todesjahr Johann Wolfgang Goethes (1832) reichenden Rechtssprache wurde 1896 einigermaßen gegenwartsnah von einer Kommission der preußischen Akademie der Wissenschaften vorgeschlagen. Es wurde in steter Kenntnis der Artikel des zeitlich in der Reihenfolge des Alphabets vorangehenden Deutschen Wörterbuchs der Brüder Grimm nach einigen Vorbereitungsjahren seit 1914 veröffentlicht (Band 1 1914-1932 11224 Artikel, Band 2 1935 12314 Artikel, Band 3 1938 9897 Artikel, Band 4 1951 7559 Artikel, Band 5 1960 9635 Artikel, Band 6 1972 7368 Artikel, Band 7 1983 5684 Artikel, Band 8 1981 5531 Artikel, Band 9 1996 6155 Artikel, Band 10 2001 5858 Artikel, Band 11 2007 5060 Artikel, Band 12 2013 5303 Artikel) und soll (nach 140 Jahren) bis 2036 in sechzehn, ebenfalls nicht stets wirklich einheitlich bearbeiteten Bänden mit etwa 120000 Ansätzen abgeschlossen sein. Erschienen sind bisher 12 bzw. noch nicht vollständig 13 Bände mit 93996 Artikeln (bis Sittenrecht, Stand im Internet vom 16. September 2016), zu denen seit einigen Jahren von etwa der Mitte des Alphabets an zahlreiche nur in einer Onlineversion registrierte, auch neuere Wörter einschließlich verständlicherer Zusammensetzungen (Wortbelegungen oder Kurznachweise) kommen, die auf eine Gesamtzahl von zuletzt 153474 Ansätzen (oder vielleicht insgesamt von A bis Z 200000 Ansätzen) führen könnten (www.deutsches-rechtswoerterbuch.de), von denen die Mehrzahl der neuhochdeutschen Ansätze auch in dem Deutschen Wörterbuch der Brüder Grimm enthalten sein dürfte.

Das Wörterbuch der deutschen Gegenwartssprache wurde zwischen 1961 und 1977 nach Abschluss sowie in Kenntnis des Deutschen Wörterbuchs der Brüder Grimm und gleich nach Beginn der Veröffentlichung der Neubearbeitung in der Deutschen Demokratischen Republik geschaffen. Es umfasst sechs Bände. Sie enthalten schätzungsweise 100000 Ansätze, von denen wohl die Mehrzahl auch in der ursprünglichen Fassung des 1961 bereits abgeschlossenen Deutschen Wörterbuchs der Brüder Grimm zu finden sein dürfte.

Fügt man diesen Werken aus allgemeinerem Interesse vor allem an der noch unvollständig erfassten besonderen Rechtssprache und den in dem Deutschen Wörterbuch der Brüder Grimm zunächst ausgesparten Fremdwörtern noch die Lemmata einiger kleineren Einheiten (Register zu Weiske, Julius, 1801-1877, Rechtslexikon für Juristen aller deutschen Staaten, Sachregister zu Juristischer Wochenschrift bzw. Neuer Juristischer Wochenschrift 1872-1960, Deutsches Fremdwörterbuch 1913ff., zweite Auflage in Bearbeitung, Neologismenlexikon, Köbler, Gerhard, Juristisches Wörterbuch) hinzu, so lässt sich eine total offene Lemmaliste des (Neuhoch-)Deutschen gewinnen. Sie reicht über das ergänzend bearbeitete Wörterbuch der Brüder Grimm deutlich hinaus, enthält dabei aber für den Bereich des Rechtes auch viele vorneuhochdeutsche Ansätze. Auf der Grundlage dieser Lemmaliste lässt sich trotz ihrer relativen Unvollständigkeit die am Anfang angesprochene Frage beantworten, ob das Deutsche unendlich oder endlich ist.

Das ist einerseits ganz einfach. Die Zeitlichkeit des Universums rechtfertigt den Satz, dass (zeitlich) alles ein Ende hat. Das Deutsche ist wie das Universum, die Sonne, die Erde, das Leben, der Mensch, die Sprache und das Indogermanische sowie das Germanische irgendwann entstanden und wird deshalb auch irgendwann einmal wieder enden, so dass es von daher endlich ist.

Während seines Bestandes hat sich aber die Einfallskraft der Menschen in ihrer Gesamtheit als beeindruckend und damit vielleicht eigentlich unendlich erwiesen. Deswegen entstehen jedenfalls im Deutschen allein durch Zusammensetzungen unaufhörlich zahllose neue Ansätze, wie sich besonders leicht an den Bezeichnungen für chemische Elemente und Verbindungen sowie für Arzneimittel und Heilverfahren erkennen lässt. Daneben gewinnt das fast täglich auch Wörter aus fremden Sprachen wie Herero, Marihuana, Amok, Tornado, Tsunami, Burkini oder Autophagie aufnehmende Deutsche wie viele andere Sprachen neben den neun mehr oder weniger allgemein anerkannten Wortarten Substantiv, Adjektiv, Adverb, Pronomen, Verb, Präposition, Konjunktion, Interjektion und Artikel, von denen die meisten leicht in Zusammensetzungen miteinander zu neuen Wörtern verbunden werden können, auch als zehnte Wortart Zahlwörter (Numerale bzw. Numeralia).

Sie beginnen als Grundzahlen bei (null oder) eins und als Ordnungszahlen bei erster und lassen sich von diesem einfachen Anfang an über zwei, drei, vier, fünf, sechs, sieben, acht, neun, zehn, elf, zwölf, zwanzig, dreißig, vierzig, fünfzig, sechzig, siebzig, achtzig, neunzig, (ein)hundert, zweihundert, dreihundert u. s. w., (ein)tausend, zweitausend, dreitausend u. s. w. bzw. zweiter, dritter, vierter, fünfter, sechster, siebter (siebenter), achter, neunter, zehnter, elfter, zwölfter, dreizehnter u. s. w. im Grunde wohl beliebig fortschreiben. Sie sind von daher zumindest theoretisch unendlich (z. B. weit über hundert Billiarden hinaus, als derzeit größte Zahl gibt Google eine 1 mit einhundert Nullen an). Damit ist das Deutsche jenseits der bisherigen Wörterbücher letztlich eigentlich zumindest theoretisch unendlich.

Hinzukommen könnten auch noch die Namen. Die Zahl der Orte wie der Personen ist zwar vielleicht nicht unendlich, aber doch sehr groß. Obwohl in der Wissenschaft Namensforschung und Appellativwortforschung meist mit guten Gründen einigermaßen getrennt werden, sind aber auch sehr viele Namen deutsch(e Wörter).

Trotz dieser eigentlichen Unendlichkeit kann es für die Sprachwissenschaft interessant sein, ein möglichst umfangreiches einheitliches Verzeichnis aller nicht nur theoretisch bildbaren, sondern auch möglichst vieler bereits gebildeter Wörter auf einfachem zeitgemäßem Stand zu haben. Seine Schaffung im Druck ist dem Einzelnen wegen der beschriebenen Unendlichkeit der Wörter und der gleichzeitigen Endlichkeit des einzelnen Lebens auch annäherungsweise nicht möglich. Es kann aber wie die Ermittlung beispielsweise aller (oder jedenfalls möglichst vieler) Primzahlen in der Mathematik in der gemeinschaftlichen Zusammenarbeit zahlreicher gutwilliger Interessierter zumindest immer wieder online versucht werden.

Zu diesem Zwecke eröffne ich auf meiner unentgeltlich zur Verfügung gestellten Homepage koeblergerhard.de ohne jede Gewinnerzielungsabsicht aus Freude an der Sache und dem Wissen sowie Freiheit, Gleichheit und Brüderlichkeit eine total offene Lemmaliste (TOLL) des Deutschen mit allen bisher einbezogenen Grundelementen (EDEL, http://www.koeblergerhard.de/EDEL-HP/edel.htm, derzeit bis F) und deren (bis jetzt erfassten) Formen (z. B. Abend, Abends, Abendes, Abende, Abenden oder groß, große, großem, großen, großer, großes, größer, größere, größerem, größeren, größerer, größeres, größte, größtem, größten, größter, größtes oder Wort, Wortes, Worts, Worte, Worten, Wörter, Wörtern als Grundlage eines zwar großen, aber gleichzeitig doch möglichst einfachen Lemmatisierungsprogramms aller neuhochdeutschen Texte). Ihr derzeitiger endlicher Umfang lässt sich auf mehr als 600000 Einheiten schätzen, die sich allein mit den Grundzahlen bis zweihunderttausend und den Ordnungszahlen bis zweihunderttausendster auf rund eine Million und sicher noch weit darüber hinaus erhöhen lässt. Jedermann darf sie in ehrendem Gedenken der Brüder Grimm in einer einheitlichen, vorgegebenen, knappen und klaren, in dem Projekt EDEL für die Anfänge beispielhaft vorgeführten Grundstruktur (Lemma, grammatische Angaben, (Doppelpunkt) neuhochdeutsche Bedeutung; möglichst Entstehungsjahr; vielleicht Etymologie; grammatikalische Formen; und möglicherweise Sonstiges) über e-mail (gerhard.koebler@uibk.ac.at) oder einfacher und schneller über Direkteintrag (ehrenamtlicher Mitarbeiter) in dem Internetprojekt Wikiling zum Wohle der Allgemeinheit bis zur Unendlichkeit unschädlich nutzen, erweitern und verbessern.