Köbler, Gerhard
Die Häufigkeit der zur Darstellung des
Mittelhochdeutschen verwendeten Buchstaben
Das
Mittelhochdeutsche ist die mittlere Sprachstufe des über das Germanische vom
Indogermanischen abstammenden Hochdeutschen der Zeit von etwa 1070 bis ins
Spätmittelalter (1350-1500). Ihm geht das aus dem südlichen Altfränkischen, aus
dem Altalemannischen und aus dem Altbayerischen sowie dem Altthüringischen und
wohl auch dem frühmittelalterlichen Langobardischen im Raum ungefähr
zwischen Ruhr, Harz und den Alpen in den
Jahren etwa zwischen 500 und 1070 bestehende Althochdeutsche voraus. Ihm folgt
seit (dem Spätmittelalter oder) der Neuzeit das Neuhochdeutsche, das seit
Martin Luther (1483-1546) das im Norden aus dem Altsächsischen und
Mittelniederdeutschen erwachsende Neuniederdeutsche als Hochsprache verdrängt
und die ebenfalls ältere Sprachstufen (Altniederfränkisch, Mittelniederländisch
bzw. Altfriesisch) aufweisenden Sprachen Niederländisch und Friesisch auf
Randgebiete einengt.
Das in
Vereinfachung und Zusammenfassung der älteren germanistischen Wörterbücher des
Mittelhochdeutschen vorgelegte mittelhochdeutsche Wörterbuch will den gesamten
Wortschatz der mittelhochdeutschen Sprache aufgrund der bisherigen Literatur
als einfache, streng alphabetisch geordnete Einheit erfassen. Hierfür setzt es
eine auf der tatsächlichen Überlieferung aufbauende, Homonyme durch
eingeklammerte Zahlenangaben individualisierende Hauptform jedes aufgrund
seiner Bestandteile bestimmte Stichworts an, wie sie am ehesten der lautlichen
Entwicklung vom Althochdeutschen zum Neuhochdeutschen entspricht. Hinzu kommen
bei Bedarf durch die Quellen vermittelte oder dem Entwicklungsverständnis
dienende Nebenformen, von deren durch das Alphabet festgelegen Stellung auf die
Hauptform verwiesen wird.
Dem Stichwort
folgen eine an sich überflüssige, aber wegen übergeordneter Zusammenhänge doch
sinnvolle Sprachangabe (mhd.) und eine schlichte grammatische Bestimmung der
Wortart (z. B. st. V., sw. M.). Danach werden dem heutigen Leser die Inhalte
der Lemmata durch mehr oder weniger viele neuhochdeutsche Bedeutungsangaben
verständlich gemacht, wobei an manchen Stellen auch eine jeweils in spitzen
Klammern (»«) gesetzte Glied-für-Glied-Wiedergabe verwendet wird. Bei den
modernen Verständnishilfen wird so gut wie möglich vom Anschaulichen zum
Übertragenen vorwärts geschritten.
Gelegentlich lässt
sich eine lateinische Vorlage eines mittelhochdeutschen Textes erkennen. In
diesen Fällen sind lateinisch-mittelhochdeutsche Übersetzungsgleichungen
feststellbar. Sie sind grundsätzlich in einer eigenen Rubrik (ÜG.:)
verzeichnet.
Als nächstes legen
Verweise und Hinweise binnensprachliche Zusammenhänge offen. Verweise (Vw.:)
führen von Grundwörtern auf die mit ihnen gebildeten Zusammensetzungen und von
Nebenformen auf Hauptformen. Hinweise (Hw.:) erschließen sonstige
wahrscheinliche sprachliche Verbindungen oder Beziehungen.
Danach werden in
grundsätzlich chronologischer Reihung die von der Literatur berücksichtigten
literarischen Quellen in Form mehr oder weniger leicht auflösbarer Siglen
verzeichnet, deren Zahl einen ersten verhältnismäßigen Rückschluss auf die
Häufigkeit des Stichwortes im Mittelhochdeutschen ermöglicht. Stets wird dabei
zur Erleichterung des Verständnisses die von der vorausgehenden Literatur
angesetzte Normalform hinzugefügt. Die jeweils früheste Quelle wird mit einer
Jahreszahl versehen, sodass das Wörterbuch erstmals für jedermann auf einen
Blick das erste Auftreten eines mittehochdeutschen Wortes in der Überlieferung
offen legt. Dabei werden zuerst die Quellen des Findebuchs in der Reihenfolge
der dortigen Siglen verzeichnet. Im Anschluss daran sind weitere Siglen aus
anderen Quellen in alphabetischer Reihenfolge verzeichnet, am Schluss stehen
noch Angaben zu Vorkommen in Glossen und Urkunden.
Beeinflusst kann
ein mittelhochdeutsches Wort von einer fremden Sprache sein. Als verschiedene
Erscheinungsfälle werden dabei Fremdwort, Lehnwort, Lehnübersetzung,
Lehnübertragung, Lehnschöpfung und Lehnbildung unterschieden. Nach Möglichkeit
ist auf eine solche Interferenz (I.:) besonders hingewiesen.
Im weiteren
Unterschied zu allen bisherigen mittelhochdeutschen Wörterbüchern werden
systematisch Hinweise auf althochdeutsche Vorformen und Angaben zu sonstigen
etymologischen Zusammenhängen (E.:) geboten. Dem folgen ebenfalls erstmals
Aussagen zum Weiterleben (und negativ zum Untergang) im älteren (ält.) und
gegenwärtigen Neuhochdeutschen (W.:), wobei im Einzelfall die Beschränkung auf
das Frühneuhochdeutsche (1350-1650) hervorgehoben sein kann. Auf diese Weise
wird erstmals die Einbettung des Mittelhochdeutschen in die Entwicklung vom
Althochdeutschen zum Neuhochdeutschen umfassend in leicht verständlicher Art
dargestellt.
Im Einzelfall
werden mit dem jeweiligen Stichwort gebildete Redewendungen (R.:) aufgenommen, bei denen grundsätzlich
die normalisierte Hauptform des Ansatzes verwendet wird. Am Schluss stehen
Angaben zur verwerteten Literatur unter Einbeziehung der dortigen Normalformen,
welche die Herkunft des Materials offenlegen. Dabei eröffnet das an dieser
Stelle einbezogene Wörterbuch der mittelhochdeutschen Urkundensprache einen zusätzlichen
Einblick in erste Nennung und Häufigkeit des jeweiligen Stichworts in den etwa
4000 von etwa 1200 bis 1300 verfassten, im Original der wissenschaftlichen
Gegenwart überlieferten Urkunden der mittelhochdeutschen Wirklichkeit.
Über die bisherige
Literatur hinaus will das Wörterbuch im Übrigen auch als zufällig angesehene
Überlieferungslücken schließen. Deswegen entnimmt es beispielsweise den
Zusammensetzungen auch die nicht einzeln belegten Grundwörter oder regelmäßig
gebildeten Adverbien auch die ihnen zugrundeliegenden Adjektive. Dabei werden
aus technischen Gründen die Zeichen *** für nicht belegte Wörter und * für
(wahrscheinlich) nicht belegte Formen (am Ende des Ansatzes) verwendet.
In den 99363 erfassten Ansätzen und Verweisen
sind 841903 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche
Ansatzlänge von 8,4730 Zeichen. Zur Darstellung des Mittelhochdeutschen ist
grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen
verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des
Mittelhochdeutschen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des
lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s,
t, u, v, x, y, z). Hinzu kommen als mittelhochdeutsche Zusatzzeichen gegenüber
dem Lateinischen j und w.
Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon
von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich
habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben
vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger
freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 66 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
28332 |
65 |
41 |
A |
28 |
257 |
101 |
ā |
5402 |
230 |
0 |
æ |
6583 |
483 |
1000 |
ǣ |
5 |
228 |
0 |
ä |
77 |
98 |
62 |
b |
22388 |
66 |
42 |
B |
33 |
99 |
63 |
c |
34728 |
67 |
43 |
C |
8 |
100 |
64 |
d |
18114 |
68 |
44 |
D |
1 |
240 |
00F0 |
ð |
6 |
101 |
65 |
e |
155617 |
69 |
45 |
E |
11 |
235 |
00EB |
ë |
13 |
275 |
113 |
ē |
2266 |
274 |
112 |
Ē |
2 |
102 |
66 |
f |
10281 |
70 |
46 |
F |
8 |
103 |
67 |
g |
27187 |
71 |
47 |
G |
1 |
104 |
68 |
h |
40319 |
72 |
48 |
H |
4 |
105 |
69 |
i |
46563 |
73 |
49 |
I |
10 |
299 |
012B |
ī |
12548 |
106 |
006A |
j |
1157 |
74 |
004A |
J |
2 |
107 |
006B |
k |
11710 |
75 |
004B |
K |
11 |
108 |
006C |
l |
44566 |
76 |
004C |
L |
7 |
109 |
006D |
m |
17575 |
77 |
004D |
M |
4 |
110 |
006E |
n |
77355 |
78 |
004E |
N |
8 |
111 |
006F |
o |
17581 |
79 |
004F |
O |
1 |
243 |
00F3 |
ó |
1 |
333 |
014D |
ō |
3474 |
339 |
153 |
œ |
1020 |
339,772 |
153,0304 |
œ̄ |
5 |
246 |
00F6 |
ö |
1145 |
245 |
00F5 |
õ |
4 |
112 |
70 |
p |
9536 |
80 |
50 |
P |
17 |
113 |
71 |
q |
305 |
114 |
72 |
r |
66948 |
82 |
52 |
R |
15 |
115 |
73 |
s |
38283 |
83 |
53 |
S |
35 |
116 |
74 |
t |
49974 |
84 |
54 |
T |
29 |
117 |
75 |
u |
26648 |
85 |
55 |
U |
3 |
363 |
016B |
ū |
5349 |
252 |
00FC |
ü |
8456 |
118 |
76 |
v |
15622 |
86 |
56 |
V |
7 |
119 |
77 |
w |
17099 |
87 |
57 |
W |
15 |
120 |
78 |
x |
49 |
121 |
79 |
y |
122 |
122 |
007A |
z |
17223 |
90 |
005A |
Z |
2 |
|
|
|
|
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā æ ǣ ä |
40427 |
4,80% |
B |
b B |
22421 |
2,70% |
C |
c C |
34736 |
4,10% |
D |
d D ð |
18121 |
2,20% |
E |
e E ë ē Ē |
157909 |
18,80% |
F |
f F |
10289 |
1,20% |
G |
g G |
27188 |
3,20% |
H |
h H |
40323 |
4,80% |
I |
i I ī |
59121 |
7,00% |
J |
j J |
1159 |
0,10% |
K |
k K |
11721 |
1,40% |
L |
l L |
44573 |
5,30% |
M |
m M |
17579 |
2,10% |
N |
n N |
77363 |
9,20% |
O |
o O ó ō œ œ̄ ö õ |
23231 |
2,80% |
P |
p P |
9553 |
1,10% |
Q |
q |
305 |
0,00% |
R |
r R |
66963 |
8,00% |
S |
s S |
38318 |
4,60% |
T |
t T |
50003 |
5,90% |
U |
u U ū ü |
40456 |
4,80% |
V |
v V |
15629 |
1,90% |
W |
w W |
17114 |
2,00% |
X |
x |
49 |
0,00% |
Y |
y |
122 |
0,00% |
Z |
z Z |
17225 |
2,00% |
Summe |
841898 |
100% |
Ordnet
man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:
E |
e E ë ē Ē |
157909 |
18,80% |
N |
n N |
77363 |
9,20% |
R |
r R |
66963 |
8,00% |
I |
i I ī |
59121 |
7,00% |
T |
t T |
50003 |
5,90% |
L |
l L |
44573 |
5,30% |
U |
u U ū ü |
40456 |
4,80% |
A |
a A ā æ ǣ ä |
40427 |
4,80% |
H |
h H |
40323 |
4,80% |
S |
s S |
38318 |
4,60% |
C |
c C |
34736 |
4,10% |
G |
g G |
27188 |
3,20% |
O |
o O ó ō œ œ̄ ö õ |
23231 |
2,80% |
B |
b B |
22421 |
2,70% |
D |
d D ð |
18121 |
2,20% |
M |
m M |
17579 |
2,10% |
Z |
z Z |
17225 |
2,00% |
W |
w W |
17114 |
2,00% |
V |
v V |
15629 |
1,90% |
K |
k K |
11721 |
1,40% |
F |
f F |
10289 |
1,20% |
P |
p P |
9553 |
1,10% |
J |
j J |
1159 |
0,10% |
Q |
q |
305 |
0,00% |
Y |
y |
122 |
0,00% |
X |
x |
49 |
0,00% |