germ_zeichenhaeuf

Köbler, Gerhard

Die Häufigkeit der zur Darstellung des Germanischen verwendeten Buchstaben

Das Germanische ist eine indogermanische Sprache, die zur Gruppe der sogenannten Kentum-Sprachen gehört, aber mit keiner zweiten indogermanischen Sprache enger verwandt ist. Am nächsten stehen dem Germanischen das Keltische, das Italische, das Venetische, das Illyrische, das Baltische und das Slawische. Jedenfalls vom Keltischen ist es in früher Zeit auch beeinflusst worden.

Das Germanische ist im Zeitpunkt seiner ersten schriftlichen Überlieferung, wie sie nach wenigen älteren Einzelwörtern und Einzelnamen seit dem ersten nachchristlichen Jahrhundert allmählich einsetzt, keine einheitliche Sprache (mehr), sondern gliedert sich in verschiedene Sprachgruppen. Hierbei werden insbesondere Westgermanisch (Vorläufer des Altenglischen, Altfriesischen, Altniederdeutschen [Altniederfränkischen, Altsächsischen], Althochdeutschen einschließlich des Thüringischen und Langobardischen), Nordgermanisch (Urnordisch bis etwa 800 n. Ch.) und Ostgermanisch (Gotisch, Gepidisch, Vandalisch, Burgundisch, Rugisch, Skirisch) unterschieden, von denen das Nordgermanische und das Ostgermanische gegenüber dem Westgermanischen eine Reihe von gemeinsamen Unterscheidungsmerkmalen aufweisen (u. a. Fehlen der Verben tun, gehen, stehen, Umbildung von uu zu ggw im Nordgermanischen und Ostgermanischen gegenüber uw im Westgermanischen), Wie weit dem eine völlig einheitliche germanische Sprache vorausgeht, ist umstritten, Sie lässt sich jedenfalls durch tatsächliche Überlieferung nicht fassen. Immerhin lässt sich mit den gleichen guten Gründen wie für das Indogermanische ein im Wesentlichen einheitlicher Grundbestand des Germanischen vermuten, der allerdings nur im Wege der hypothetischen Rekonstruktion aus den überlieferten jüngeren Einzelsprachen zu gewinnen ist (Beispiel: urnord. gastiR, got. gasts, ae. giest, as. gast, ahd. gast führen auf germ. *gastiz Gast, anord. fiskr, got. fisks, ae. fisk, afries. fisk, as. fisk, ahd. fisk führen auf germ. *fiskaz Fisch).

Der Wortschatz des Germanischen wurde als Gesamtheit zuletzt von Torp, A./Falk, H. (Wortschatz der germanischen Spracheinheit) 1909, für die starken Verben von Elmar Seebold (1970) und für die Primäradjektive von Frank Heidermanns (1993) gesammelt und danach von Gerhard Köbler einfach und übersichtlich strikt alphabetisch zusammengefasst. Er enthält in seiner zuletzt festgelegten Fassung insgesamt 12051 mehr oder weniger allgemein anerkannte (normalisierte) Ansätze mit 68793 Zeichen (d. h. 5,7087 Zeichen pro Ansatz), die aber - wie nahezu alles in den Geisteswissenschaften - , einer eigenen Geschichte und Zukunft unterworfen sind. Zu ihrer Darstellung ist grundsätzlich von den frühen Schreibern bis zu den gegenwärtigen Wissenschaftlern das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Germanischen angepasst werden muss(te). Dementsprechend umfasst diese Zeichenmenge nicht - wie das Lateinische - 24 Zeichen (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z), sondern wegen der drei germanischen Zusatzzeichen j, þ und w 27 Buchstaben (a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, þ, u, v, w, x, y, z).

Die Häufigkeit der Verwendung der einzelnen Buchstaben in den (normalisierten) Ansätzen hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller (27 anerkannten) Buchstaben (z. B. a, b, c usw.) und (57) Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden leicht gerundeten Erkenntnissen:

Asc	Hex	Zeichen	Häufigkeit
97	61	a	11604
65	41	A	49
257	101	ā	16
98	62	b	1738
66	42	B	25
99	63	c	62
67	43	C	19
100	64	d	1811
68	44	D	6
273	111	đ	1
101	65	e	3101
69	45	E	7
275	113	ē	787
102	66	f	1125
70	46	F	7
103	67	g	2141
71	47	G	11
104	68	h	2087
72	48	H	3
105	69	i	3869
73	49	I	10
299	012B	ī	833
106	006A	j	1992
74	004A	J	5
107	006B	k	2792
75	004B	K	8
108	006C	l	3538
76	004C	L	12
109	006D	m	1562
77	004D	M	20
110	006E	n	6136
78	004E	N	9
111	006F	o	206
79	004F	O	3
333	014D	ō	3281
112	70	p	1028
80	50	P	6
113	71	q	4
81	51	Q	2
114	72	r	4158
82	52	R	11
115	73	s	3814
83	53	S	11
116	74	t	2749
84	54	T	18
254	00FE	þ	1469
117	75	u	3472
85	55	U	2
363,774	016B,0306	ū̆	3
363	016B	ū	293
118	76	v	47
86	56	V	11
119	77	w	2438
87	57	W	5
120	78	x	2
121	79	y	2
122	007A	z	372

Hieraus lassen sich in etwa folgende Häufigkeiten ermitteln:
Zeichen	Varianten	Häufigkeit	Prozent
A	a A ā	11669	17,00%
B	b B	1763	2,60%
C	c C	81	0,10%
D	d D đ	1818	2,60%
E	e E ē	3895	5,70%
F	f F	1132	1,60%
G	g G	2152	3,10%
H	h H	2090	3,00%
I	i I ī	4712	6,80%
J	j J	1997	2,90%
K	k K	2800	4,10%
L	l L	3550	5,20%
M	m M	1582	2,30%
N	n N	6145	8,90%
O	o O ō	3490	5,10%
P	p P	1034	1,50%
Q	q Q	6	0,00%
R	r R	4169	6,10%
S	s S	3825	5,60%
T	t T	2767	4,00%
Þ	þ	1469	2,10%
U	u U ū̆ ū	3770	5,50%
V	v V	58	0,10%
W	w W	2443	3,60%
X	x	2	0,00%
Y	y	2	0,00%
Z	z	372	0,50%
Summe		68793	100%

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung

A	a A ā	11669	17,00%
N	n N	6145	8,90%
I	i I ī	4712	6,80%
R	r R	4169	6,10%
E	e E ē	3895	5,70%
S	s S	3825	5,60%
U	u U ū̆ ū	3770	5,50%
L	l L	3550	5,20%
O	o O ō	3490	5,10%
K	k K	2800	4,10%
T	t T	2767	4,00%
W	w W	2443	3,60%
G	g G	2152	3,10%
H	h H	2090	3,00%
J	j J	1997	2,90%
D	d D đ	1818	2,60%
B	b B	1763	2,60%
M	m M	1582	2,30%
Þ	þ	1469	2,10%
F	f F	1132	1,60%
P	p P	1034	1,50%
Z	z	372	0,50%
C	c C	81	0,10%
V	v V	58	0,10%
Q	q Q	6	0,00%
X	x	2	0,00%
Y	y	2	0,00%

Danach ist der am häufigsten zur Darstellung des in der Gegenwart anerkannten germanischen Wortschatzes verwendete Buchstabe das a vor n, i, r, e, s u, l und o, während c, v, q, x und y nur ziemlich selten gebraucht werden.