Köbler, Gerhard
Die Häufigkeit der zur Darstellung des
Germanischen verwendeten Buchstaben
Das
Germanische ist eine indogermanische Sprache, die zur Gruppe der sogenannten
Kentum-Sprachen gehört, aber mit keiner zweiten indogermanischen Sprache enger
verwandt ist. Am nächsten stehen dem Germanischen das Keltische, das Italische,
das Venetische, das Illyrische, das Baltische und das Slawische. Jedenfalls vom
Keltischen ist es in früher Zeit auch beeinflusst worden.
Das
Germanische ist im Zeitpunkt seiner ersten schriftlichen Überlieferung, wie sie
nach wenigen älteren Einzelwörtern und Einzelnamen seit dem ersten nachchristlichen
Jahrhundert allmählich einsetzt, keine einheitliche Sprache (mehr), sondern
gliedert sich in verschiedene Sprachgruppen. Hierbei werden insbesondere
Westgermanisch (Vorläufer des Altenglischen, Altfriesischen, Altniederdeutschen
[Altniederfränkischen, Altsächsischen], Althochdeutschen einschließlich des
Thüringischen und Langobardischen), Nordgermanisch (Urnordisch bis etwa 800 n.
Ch.) und Ostgermanisch (Gotisch, Gepidisch, Vandalisch, Burgundisch, Rugisch,
Skirisch) unterschieden, von denen das Nordgermanische und das Ostgermanische
gegenüber dem Westgermanischen eine Reihe von gemeinsamen
Unterscheidungsmerkmalen aufweisen (u. a. Fehlen der Verben tun, gehen, stehen,
Umbildung von uu zu ggw im Nordgermanischen und Ostgermanischen gegenüber uw im
Westgermanischen), Wie weit dem eine völlig einheitliche germanische Sprache
vorausgeht, ist umstritten, Sie lässt sich jedenfalls durch tatsächliche
Überlieferung nicht fassen. Immerhin lässt sich mit den gleichen guten Gründen
wie für das Indogermanische ein im Wesentlichen einheitlicher Grundbestand des
Germanischen vermuten, der allerdings nur im Wege der hypothetischen
Rekonstruktion aus den überlieferten jüngeren Einzelsprachen zu gewinnen ist
(Beispiel: urnord. gastiR, got. gasts, ae. giest, as. gast, ahd. gast führen
auf germ. *gastiz Gast, anord. fiskr, got. fisks, ae. fisk, afries. fisk, as.
fisk, ahd. fisk führen auf germ. *fiskaz Fisch).
Der Wortschatz des Germanischen wurde als
Gesamtheit zuletzt von Torp, A./Falk, H. (Wortschatz der germanischen
Spracheinheit) 1909, für die starken Verben von Elmar Seebold (1970) und für
die Primäradjektive von Frank Heidermanns (1993) gesammelt und danach von
Gerhard Köbler einfach und übersichtlich strikt alphabetisch zusammengefasst.
Er enthält in seiner zuletzt festgelegten Fassung insgesamt 12051 mehr oder
weniger allgemein anerkannte (normalisierte) Ansätze mit 68793 Zeichen (d. h.
5,7087 Zeichen pro Ansatz), die aber - wie nahezu alles in den
Geisteswissenschaften - , einer eigenen Geschichte und Zukunft unterworfen
sind. Zu ihrer Darstellung ist grundsätzlich von den frühen Schreibern bis zu
den gegenwärtigen Wissenschaftlern das Buchstabensystem (Alphabet) des
klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf
Besonderheiten des Germanischen angepasst werden muss(te). Dementsprechend
umfasst diese Zeichenmenge nicht - wie das Lateinische - 24 Zeichen (a, b, c,
d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z), sondern wegen
der drei germanischen Zusatzzeichen j, þ und w 27 Buchstaben (a, b, c, d, e, f,
g, h, i, j, k, l, m, n, o, p, q, r, s, t, þ, u, v, w, x, y, z).
Die Häufigkeit der Verwendung der
einzelnen Buchstaben in den (normalisierten) Ansätzen hat mich schon von Beginn
meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber
in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden.
Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise
für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der
elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller (27
anerkannten) Buchstaben (z. B. a, b, c usw.) und (57) Buchstabenvarianten (z.
B. a, á, à usw.) zu folgenden leicht gerundeten Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
11604 |
65 |
41 |
A |
49 |
257 |
101 |
ā |
16 |
98 |
62 |
b |
1738 |
66 |
42 |
B |
25 |
99 |
63 |
c |
62 |
67 |
43 |
C |
19 |
100 |
64 |
d |
1811 |
68 |
44 |
D |
6 |
273 |
111 |
đ |
1 |
101 |
65 |
e |
3101 |
69 |
45 |
E |
7 |
275 |
113 |
ē |
787 |
102 |
66 |
f |
1125 |
70 |
46 |
F |
7 |
103 |
67 |
g |
2141 |
71 |
47 |
G |
11 |
104 |
68 |
h |
2087 |
72 |
48 |
H |
3 |
105 |
69 |
i |
3869 |
73 |
49 |
I |
10 |
299 |
012B |
ī |
833 |
106 |
006A |
j |
1992 |
74 |
004A |
J |
5 |
107 |
006B |
k |
2792 |
75 |
004B |
K |
8 |
108 |
006C |
l |
3538 |
76 |
004C |
L |
12 |
109 |
006D |
m |
1562 |
77 |
004D |
M |
20 |
110 |
006E |
n |
6136 |
78 |
004E |
N |
9 |
111 |
006F |
o |
206 |
79 |
004F |
O |
3 |
333 |
014D |
ō |
3281 |
112 |
70 |
p |
1028 |
80 |
50 |
P |
6 |
113 |
71 |
q |
4 |
81 |
51 |
Q |
2 |
114 |
72 |
r |
4158 |
82 |
52 |
R |
11 |
115 |
73 |
s |
3814 |
83 |
53 |
S |
11 |
116 |
74 |
t |
2749 |
84 |
54 |
T |
18 |
254 |
00FE |
þ |
1469 |
117 |
75 |
u |
3472 |
85 |
55 |
U |
2 |
363,774 |
016B,0306 |
ū̆ |
3 |
363 |
016B |
ū |
293 |
118 |
76 |
v |
47 |
86 |
56 |
V |
11 |
119 |
77 |
w |
2438 |
87 |
57 |
W |
5 |
120 |
78 |
x |
2 |
121 |
79 |
y |
2 |
122 |
007A |
z |
372 |
|
|
|
|
Hieraus lassen sich in etwa folgende Häufigkeiten
ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā |
11669 |
17,00% |
B |
b B |
1763 |
2,60% |
C |
c C |
81 |
0,10% |
D |
d D đ |
1818 |
2,60% |
E |
e E ē |
3895 |
5,70% |
F |
f F |
1132 |
1,60% |
G |
g G |
2152 |
3,10% |
H |
h H |
2090 |
3,00% |
I |
i I ī |
4712 |
6,80% |
J |
j J |
1997 |
2,90% |
K |
k K |
2800 |
4,10% |
L |
l L |
3550 |
5,20% |
M |
m M |
1582 |
2,30% |
N |
n N |
6145 |
8,90% |
O |
o O ō |
3490 |
5,10% |
P |
p P |
1034 |
1,50% |
Q |
q Q |
6 |
0,00% |
R |
r R |
4169 |
6,10% |
S |
s S |
3825 |
5,60% |
T |
t T |
2767 |
4,00% |
Þ |
þ |
1469 |
2,10% |
U |
u U ū̆ ū |
3770 |
5,50% |
V |
v V |
58 |
0,10% |
W |
w W |
2443 |
3,60% |
X |
x |
2 |
0,00% |
Y |
y |
2 |
0,00% |
Z |
z |
372 |
0,50% |
Summe |
68793 |
100% |
Ordnet man die Buchstaben nach ihren Häufigkeiten,
so entsteht folgende Reihung
A |
a A ā |
11669 |
17,00% |
N |
n N |
6145 |
8,90% |
I |
i I ī |
4712 |
6,80% |
R |
r R |
4169 |
6,10% |
E |
e E ē |
3895 |
5,70% |
S |
s S |
3825 |
5,60% |
U |
u U ū̆ ū |
3770 |
5,50% |
L |
l L |
3550 |
5,20% |
O |
o O ō |
3490 |
5,10% |
K |
k K |
2800 |
4,10% |
T |
t T |
2767 |
4,00% |
W |
w W |
2443 |
3,60% |
G |
g G |
2152 |
3,10% |
H |
h H |
2090 |
3,00% |
J |
j J |
1997 |
2,90% |
D |
d D đ |
1818 |
2,60% |
B |
b B |
1763 |
2,60% |
M |
m M |
1582 |
2,30% |
Þ |
þ |
1469 |
2,10% |
F |
f F |
1132 |
1,60% |
P |
p P |
1034 |
1,50% |
Z |
z |
372 |
0,50% |
C |
c C |
81 |
0,10% |
V |
v V |
58 |
0,10% |
Q |
q Q |
6 |
0,00% |
X |
x |
2 |
0,00% |
Y |
y |
2 |
0,00% |
Danach ist der
am häufigsten zur Darstellung des in der Gegenwart anerkannten germanischen
Wortschatzes verwendete Buchstabe das a vor n, i, r, e, s u, l und o, während c,
v, q, x und y nur ziemlich selten gebraucht werden.