Köbler, Gerhard
Die Häufigkeit der zur
Darstellung des Althochdeutschen verwendeten Buchstaben
Das seit Jakob Grimm (1819) so bezeichnete
Althochdeutsche ist die älteste Sprachstufe der hochdeutschen Sprache. Diese
unterscheidet sich vom durch Rekonstruktion gewonnenen Germanischen durch die
vielleicht schon im 6. Jahrhundert (Personenname Idorih auf der Lanzenspitze
von Wurmlingen) einsetzende, aber erst ab 750 besser belegte althochdeutsche
Lautverschiebung (Verschiebung von p, t, k zu Doppelspiranten [ff, zz, hh] oder
Affrikaten [pf/ph, z/tz, altoberdeutsch kh/ch] und von đ, ƀ, ǥ zu t, b, g). Gegenüber dem um
1070 einsetzenden Mittelhochdeutschen, der zweitältesten Sprachstufe der
hochdeutschen Sprache, ist das Althochdeutsche durch die vollen Vokale der
nicht hochbetonten Silben gekennzeichnet, die im Mittelhochdeutschen zu e oder
i abgeschwächt sind.
Räumlich grenzt das Althochdeutsche im Norden an
das Altsächsische, zu dem noch Essen, Werden, das Rothaargebirge und der
Südharz gehören, und im Nordwesten an das Altniederfränkische. Über die
Westgrenze des geschlossenen althochdeutschen Sprachgebietes lässt sich keine
Sicherheit gewinnen. Im Osten (Thüringen) fehlen umfangreiche Zeugnisse. Im
Süden weist noch das Langobardische althochdeutsche Züge auf.
Das Althochdeutsche ist - abgesehen von den
bloßen Nennungen althochdeutscher Personennamen und Ortsnamen - durch rund 1200
Handschriften, in denen sich althochdeutsche Elemente sehr verschiedenen Umfangs
finden, überliefert. Die wichtigsten althochdeutschen Schreiborte sind dabei in
Bayern Salzburg, Mondsee, Passau, Regensburg, Tegernsee und Freising, in
Alemannien St. Gallen, Reichenau und Murbach sowie im fränkischen Gebiet
Weißenburg, Lorsch, Mainz, Frankfurt, Würzburg, Bamberg, Fulda, Trier,
Echternach und Aachen. Allerdings sind auch von wichtigen Sprachdenkmälern die
Entstehungsorte wie die Schreiborte nicht bekannt und müssen neben den
genannten Schreiborten weitere, nicht sicher identifizierbare angenommen
werden. Außerdem stammen die Schreiber eines Schreiborts vielfach aus
anderssprachigen Gebieten.
Zur Aufzeichnung wird das lateinische Alphabet
verwendet. Die lateinischen Schriftzeichen ermöglichen nur eine unvollkommene
Wiedergabe des althochdeutschen Lautsystems. Zusätzliche Zeichen wurden
gleichwohl für das Althochdeutsche nicht entwickelt.
Am nächsten verwandt ist das Althochdeutsche mit
dem Altniederdeutschen (Altsächsischen und Altniederfränkischen). Mit diesem
und dem Altfriesischen sowie dem Altenglischen hat es viele Spracherscheinungen
gemeinsam (Konsonantengemination, Bildung der zweiten Person Singular
Praeteriti der starken Verben, Suffixe -heit, -schaft, -tum,
Wortschatzübereinstimmungen). Von daher ist es im Gegensatz zum ostgermanischen
Gotischen und zum nordgermanischen Altnordischen dem sog. Westgermanischen
zuzurechnen.
In sich ist das Althochdeutsche nicht
einheitlich, so dass von althochdeutsch nur im Sinne einer wissenschaftlichen
Zusammenfassung verschiedener Einzelmundarten gesprochen werden kann. Zu
unterscheiden sind vor allem das altmitteldeutsche Altfränkische und die
altoberdeutschen Mundarten des Altbayerischen und Altalemannischen (sowie das Thüringische
und Langobardische). Das Altfränkische lässt sich dabei weiter in
Altsüdrheinfränkisch (Weißenburg), Altrheinfränkisch (Mainz, Lorsch, Frankfurt,
Fulda [seit 10. Jh.]), Altostfränkisch (Würzburg, Bamberg, Fulda [bis 10. Jh.])
und Altmittelfränkisch (Trier, Echternach usw.) (sowie das altniederdeutsche
Altniederfränkische) gliedern.
Für wissenschaftliche Zwecke wird das
Althochdeutsche in seinen Ansätzen in der Regel auf den Lautstand des in Fulda
um 830 durch Übersetzung geschaffenen althochdeutschen Tatian normalisiert.
Dadurch werden zwar sowohl räumliche Verschiedenheiten sowohl wie auch
zeitliche Entwicklungen künstlich vernachlässigt. Andererseits wird dadurch
aber so viel praktische Übersicht gewonnen, dass deswegen auch hier
normalisiert wird.
Ediert sind die althochdeutschen Quellen in
unterschiedlichen Publikationen. Hervorzuheben sind dabei vor allem die Ausgaben
der umfassenderen Texte (Notker, Otfrid, Tatian, Isidor, Mondseer Fragmente,
Murbacher Hymnen), der kleineren Sprachdenkmäler (Steinmeyer 1916, Köbler
1986), der Glossen (Steinmeyer/Sievers) und zahlreicher einzelner
Glossennachträge (zusammenfassend Köbler 1993) sowie die Ausgaben der
lateinischen frühmittelalterlichen Texte bzw. Handschriften.
In den 40794 erfassten
Ansätzen und Verweisen sind 315137 Zeichen enthalten. Daraus errechnet sich
eine durchschnittliche Ansatzlänge von 7,7251 Zeichen. Zur Darstellung des
Althochdeutschen ist grundsätzlich das Buchstabensystem (Alphabet) des
klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf
Besonderheiten des Althochdeutschen angepasst werden muss.
Ausgangspunkt sind
also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k,
l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als althochdeutsche
Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26
Zeichen.
Die Häufigkeit ihrer
Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache
besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine
besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines
von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms
selbst ermittelt.
Dieses gelangt unter
der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung
aller 26 Buchstaben (z. B. a, b, c, d usw.) und 55 Buchstabenvarianten (z. B.
a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
29279 |
65 |
41 |
A |
15 |
257 |
101 |
ā |
3727 |
230 |
0 |
æ |
1 |
98 |
62 |
b |
8365 |
66 |
42 |
B |
28 |
99 |
63 |
c |
568 |
67 |
43 |
C |
3 |
100 |
64 |
d |
7044 |
68 |
44 |
D |
7 |
101 |
65 |
e |
17344 |
69 |
45 |
E |
7 |
275 |
113 |
ē |
1709 |
102 |
66 |
f |
8591 |
70 |
46 |
F |
17 |
103 |
67 |
g |
14301 |
71 |
47 |
G |
8 |
104 |
68 |
h |
14091 |
72 |
48 |
H |
8 |
105 |
69 |
i |
31395 |
73 |
49 |
I |
3 |
299 |
012B |
ī |
8723 |
106 |
006A |
j |
271 |
74 |
004A |
J |
6 |
107 |
006B |
k |
7527 |
75 |
004B |
K |
13 |
108 |
006C |
l |
16453 |
76 |
004C |
L |
14 |
109 |
006D |
m |
7555 |
77 |
004D |
M |
7 |
110 |
006E |
n |
29333 |
78 |
004E |
N |
3 |
111 |
006F |
o |
12877 |
79 |
004F |
O |
2 |
333 |
014D |
ō |
4789 |
112 |
70 |
p |
2331 |
80 |
50 |
P |
7 |
113 |
71 |
q |
7 |
114 |
72 |
r |
22437 |
82 |
52 |
R |
21 |
115 |
73 |
s |
15937 |
83 |
53 |
S |
35 |
116 |
74 |
t |
18310 |
84 |
54 |
T |
19 |
117 |
75 |
u |
14735 |
85 |
55 |
U |
5 |
363 |
016B |
ū |
1834 |
118 |
76 |
v |
178 |
86 |
56 |
V |
2 |
119 |
77 |
w |
7700 |
87 |
57 |
W |
23 |
120 |
78 |
x |
10 |
121 |
79 |
y |
13 |
122 |
007A |
z |
7474 |
90 |
005A |
Z |
1 |
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā æ |
33022 |
10,50% |
B |
b B |
8393 |
2,70% |
C |
c C |
571 |
0,20% |
D |
d D |
7051 |
2,20% |
E |
e E ē |
19060 |
6,00% |
F |
f F |
8608 |
2,70% |
G |
g G |
14309 |
4,50% |
H |
h H |
14099 |
4,50% |
I |
i I ī |
40121 |
12,70% |
J |
j J |
277 |
0,10% |
K |
k K |
7540 |
2,40% |
L |
l L |
16467 |
5,20% |
M |
m M |
7562 |
2,40% |
N |
n N |
29336 |
9,30% |
O |
o O ō |
17668 |
5,60% |
P |
p P |
2338 |
0,70% |
Q |
q |
7 |
0,00% |
R |
r R |
22458 |
7,10% |
S |
s S |
15972 |
5,10% |
T |
t T |
18329 |
5,80% |
U |
u U ū |
16574 |
5,30% |
V |
v V |
180 |
0,10% |
W |
w W |
7723 |
2,50% |
X |
x |
10 |
0,00% |
Y |
y |
13 |
0,00% |
Z |
z Z |
7475 |
2,40% |
Summe |
315164 |
100% |
Ordnet man die Buchstaben nach ihren Häufigkeiten, so
entsteht folgende Reihung:
I |
i I ī |
40121 |
12,70% |
A |
a A ā æ |
33022 |
10,50% |
N |
n N |
29336 |
9,30% |
R |
r R |
22458 |
7,10% |
E |
e E ē |
19060 |
6,00% |
T |
t T |
18329 |
5,80% |
O |
o O ō |
17668 |
5,60% |
U |
u U ū |
16574 |
5,30% |
L |
l L |
16467 |
5,20% |
S |
s S |
15972 |
5,10% |
G |
g G |
14309 |
4,50% |
H |
h H |
14099 |
4,50% |
F |
f F |
8608 |
2,70% |
B |
b B |
8393 |
2,70% |
W |
w W |
7723 |
2,50% |
M |
m M |
7562 |
2,40% |
K |
k K |
7540 |
2,40% |
Z |
z Z |
7475 |
2,40% |
D |
d D |
7051 |
2,20% |
P |
p P |
2338 |
0,70% |
C |
c C |
571 |
0,20% |
J |
j J |
277 |
0,10% |
V |
v V |
180 |
0,10% |
Y |
y |
13 |
0,00% |
X |
x |
10 |
0,00% |
Q |
q |
7 |
0,00% |