Köbler, Gerhard
Die Häufigkeit der
zur Darstellung des Germanischen verwendeten Buchstaben
Das Germanische ist eine indogermanische Sprache, die zur
Gruppe der sogenannten Kentum-Sprachen gehört, aber mit keiner zweiten
indogermanischen Sprache enger verwandt ist. Am nächsten stehen dem
Germanischen das Keltische, das Italische, das Venetische, das Illyrische, das
Baltische und das Slawische. Jedenfalls vom Keltischen ist es in früher Zeit
auch beeinflusst worden.
Das Germanische ist im Zeitpunkt seiner ersten
schriftlichen Überlieferung, wie sie nach wenigen älteren Einzelwörtern und
Einzelnamen seit dem ersten nachchristlichen Jahrhundert allmählich einsetzt,
keine einheitliche Sprache (mehr), sondern gliedert sich in verschiedene
Sprachgruppen. Hierbei werden insbesondere Westgermanisch (Vorläufer des
Altenglischen, Altfriesischen, Altniederdeutschen [Altniederfränkischen, Altsächsischen],
Althochdeutschen einschließlich des Thüringischen und Langobardischen),
Nordgermanisch (Urnordisch bis etwa 800 n. Ch.) und Ostgermanisch (Gotisch,
Gepidisch, Vandalisch, Burgundisch, Rugisch, Skirisch) unterschieden, von denen
das Nordgermanische und das Ostgermanische gegenüber dem Westgermanischen eine
Reihe von gemeinsamen Unterscheidungsmerkmalen aufweisen (u. a. Fehlen der
Verben tun, gehen, stehen, Umbildung von uu zu ggw im Nordgermanischen und
Ostgermanischen gegenüber uw im Westgermanischen), Wie weit dem eine völlig
einheitliche germanische Sprache vorausgeht, ist umstritten, Sie lässt sich
jedenfalls durch tatsächliche Überlieferung nicht fassen. Immerhin lässt sich
mit den gleichen guten Gründen wie für das Indogermanische ein im Wesentlichen
einheitlicher Grundbestand des Germanischen vermuten, der allerdings nur im
Wege der hypothetischen Rekonstruktion aus den überlieferten jüngeren
Einzelsprachen zu gewinnen ist (Beispiel: urnord. gastiR, got. gasts, ae.
giest, as. gast, ahd. gast führen auf germ. *gastiz Gast, anord. fiskr, got.
fisks, ae. fisk, afries. fisk, as. fisk, ahd. fisk führen auf germ. *fiskaz
Fisch).
Der Wortschatz des
Germanischen wurde als Gesamtheit zuletzt von Torp, A./Falk, H. (Wortschatz der
germanischen Spracheinheit) 1909, für die starken Verben von Elmar Seebold
(1970) und für die Primäradjektive von Frank Heidermanns (1993) gesammelt und
danach von Gerhard Köbler einfach und übersichtlich strikt alphabetisch
zusammengefasst. Er enthält in seiner zuletzt festgelegten Fassung insgesamt
12051 mehr oder weniger allgemein anerkannte (normalisierte) Ansätze mit 68793
Zeichen (d. h. 5,7087 Zeichen pro Ansatz), die aber - wie nahezu alles in den
Geisteswissenschaften - , einer eigenen Geschichte und Zukunft unterworfen
sind. Zu ihrer Darstellung ist grundsätzlich von den frühen Schreibern bis zu
den gegenwärtigen Wissenschaftlern das Buchstabensystem (Alphabet) des
klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf
Besonderheiten des Germanischen angepasst werden muss(te). Dementsprechend
umfasst diese Zeichenmenge nicht - wie das Lateinische - 24 Zeichen (a, b, c,
d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z), sondern wegen
der drei germanischen Zusatzzeichen j, þ und w 27 Buchstaben (a, b, c, d, e, f,
g, h, i, j, k, l, m, n, o, p, q, r, s, t, þ, u, v, w, x, y, z).
Die Häufigkeit der
Verwendung der einzelnen Buchstaben in den (normalisierten) Ansätzen hat mich
schon von Beginn meiner Beschäftigung mit dieser Sprache besonders
interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen
genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef
Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst
ermittelt.
Dieses gelangt unter
der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung
aller (27 anerkannten) Buchstaben (z. B. a, b, c usw.) und (57)
Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden leicht gerundeten
Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
11604 |
65 |
41 |
A |
49 |
257 |
101 |
ā |
16 |
98 |
62 |
b |
1738 |
66 |
42 |
B |
25 |
99 |
63 |
c |
62 |
67 |
43 |
C |
19 |
100 |
64 |
d |
1811 |
68 |
44 |
D |
6 |
273 |
111 |
đ |
1 |
101 |
65 |
e |
3101 |
69 |
45 |
E |
7 |
275 |
113 |
ē |
787 |
102 |
66 |
f |
1125 |
70 |
46 |
F |
7 |
103 |
67 |
g |
2141 |
71 |
47 |
G |
11 |
104 |
68 |
h |
2087 |
72 |
48 |
H |
3 |
105 |
69 |
i |
3869 |
73 |
49 |
I |
10 |
299 |
012B |
ī |
833 |
106 |
006A |
j |
1992 |
74 |
004A |
J |
5 |
107 |
006B |
k |
2792 |
75 |
004B |
K |
8 |
108 |
006C |
l |
3538 |
76 |
004C |
L |
12 |
109 |
006D |
m |
1562 |
77 |
004D |
M |
20 |
110 |
006E |
n |
6136 |
78 |
004E |
N |
9 |
111 |
006F |
o |
206 |
79 |
004F |
O |
3 |
333 |
014D |
ō |
3281 |
112 |
70 |
p |
1028 |
80 |
50 |
P |
6 |
113 |
71 |
q |
4 |
81 |
51 |
Q |
2 |
114 |
72 |
r |
4158 |
82 |
52 |
R |
11 |
115 |
73 |
s |
3814 |
83 |
53 |
S |
11 |
116 |
74 |
t |
2749 |
84 |
54 |
T |
18 |
254 |
00FE |
þ |
1469 |
117 |
75 |
u |
3472 |
85 |
55 |
U |
2 |
363,774 |
016B,0306 |
ū̆ |
3 |
363 |
016B |
ū |
293 |
118 |
76 |
v |
47 |
86 |
56 |
V |
11 |
119 |
77 |
w |
2438 |
87 |
57 |
W |
5 |
120 |
78 |
x |
2 |
121 |
79 |
y |
2 |
122 |
007A |
z |
372 |
|
|
|
|
Hieraus lassen sich in etwa folgende Häufigkeiten
ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā |
11669 |
17,00% |
B |
b B |
1763 |
2,60% |
C |
c C |
81 |
0,10% |
D |
d D đ |
1818 |
2,60% |
E |
e E ē |
3895 |
5,70% |
F |
f F |
1132 |
1,60% |
G |
g G |
2152 |
3,10% |
H |
h H |
2090 |
3,00% |
I |
i I ī |
4712 |
6,80% |
J |
j J |
1997 |
2,90% |
K |
k K |
2800 |
4,10% |
L |
l L |
3550 |
5,20% |
M |
m M |
1582 |
2,30% |
N |
n N |
6145 |
8,90% |
O |
o O ō |
3490 |
5,10% |
P |
p P |
1034 |
1,50% |
Q |
q Q |
6 |
0,00% |
R |
r R |
4169 |
6,10% |
S |
s S |
3825 |
5,60% |
T |
t T |
2767 |
4,00% |
Þ |
þ |
1469 |
2,10% |
U |
u U ū̆ ū |
3770 |
5,50% |
V |
v V |
58 |
0,10% |
W |
w W |
2443 |
3,60% |
X |
x |
2 |
0,00% |
Y |
y |
2 |
0,00% |
Z |
z |
372 |
0,50% |
Summe |
68793 |
100% |
Ordnet man die Buchstaben
nach ihren Häufigkeiten, so entsteht folgende Reihung
A |
a A ā |
11669 |
17,00% |
N |
n N |
6145 |
8,90% |
I |
i I ī |
4712 |
6,80% |
R |
r R |
4169 |
6,10% |
E |
e E ē |
3895 |
5,70% |
S |
s S |
3825 |
5,60% |
U |
u U ū̆ ū |
3770 |
5,50% |
L |
l L |
3550 |
5,20% |
O |
o O ō |
3490 |
5,10% |
K |
k K |
2800 |
4,10% |
T |
t T |
2767 |
4,00% |
W |
w W |
2443 |
3,60% |
G |
g G |
2152 |
3,10% |
H |
h H |
2090 |
3,00% |
J |
j J |
1997 |
2,90% |
D |
d D đ |
1818 |
2,60% |
B |
b B |
1763 |
2,60% |
M |
m M |
1582 |
2,30% |
Þ |
þ |
1469 |
2,10% |
F |
f F |
1132 |
1,60% |
P |
p P |
1034 |
1,50% |
Z |
z |
372 |
0,50% |
C |
c C |
81 |
0,10% |
V |
v V |
58 |
0,10% |
Q |
q Q |
6 |
0,00% |
X |
x |
2 |
0,00% |
Y |
y |
2 |
0,00% |
Danach ist der am häufigsten zur Darstellung des in der Gegenwart
anerkannten germanischen Wortschatzes verwendete Buchstabe das a vor n, i, r,
e, s u, l und o, während c, v, q, x und y nur ziemlich selten gebraucht werden.