Köbler, Gerhard

 

Die Häufigkeit der zur Darstellung des Mittelhochdeutschen verwendeten Buchstaben

 

Das Mittelhochdeutsche ist die mittlere Sprachstufe des über das Germanische vom Indogermanischen abstammenden Hochdeutschen der Zeit von etwa 1070 bis ins Spätmittelalter (1350-1500). Ihm geht das aus dem südlichen Altfränkischen, aus dem Altalemannischen und aus dem Altbayerischen sowie dem Altthüringischen und wohl auch dem frühmittelalterlichen Langobardischen im Raum ungefähr zwischen  Ruhr, Harz und den Alpen in den Jahren etwa zwischen 500 und 1070 bestehende Althochdeutsche voraus. Ihm folgt seit (dem Spätmittelalter oder) der Neuzeit das Neuhochdeutsche, das seit Martin Luther (1483-1546) das im Norden aus dem Altsächsischen und Mittelniederdeutschen erwachsende Neuniederdeutsche als Hochsprache verdrängt und die ebenfalls ältere Sprachstufen (Altniederfränkisch, Mittelniederländisch bzw. Altfriesisch) aufweisenden Sprachen Niederländisch und Friesisch auf Randgebiete einengt.

 

Das in Vereinfachung und Zusammenfassung der älteren germanistischen Wörterbücher des Mittelhochdeutschen vorgelegte mittelhochdeutsche Wörterbuch will den gesamten Wortschatz der mittelhochdeutschen Sprache aufgrund der bisherigen Literatur als einfache, streng alphabetisch geordnete Einheit erfassen. Hierfür setzt es eine auf der tatsächlichen Überlieferung aufbauende, Homonyme durch eingeklammerte Zahlenangaben individualisierende Hauptform jedes aufgrund seiner Bestandteile bestimmte Stichworts an, wie sie am ehesten der lautlichen Entwicklung vom Althochdeutschen zum Neuhochdeutschen entspricht. Hinzu kommen bei Bedarf durch die Quellen vermittelte oder dem Entwicklungsverständnis dienende Nebenformen, von deren durch das Alphabet festgelegen Stellung auf die Hauptform verwiesen wird.

 

Dem Stichwort folgen eine an sich überflüssige, aber wegen übergeordneter Zusammenhänge doch sinnvolle Sprachangabe (mhd.) und eine schlichte grammatische Bestimmung der Wortart (z. B. st. V., sw. M.). Danach werden dem heutigen Leser die Inhalte der Lemmata durch mehr oder weniger viele neuhochdeutsche Bedeutungsangaben verständlich gemacht, wobei an manchen Stellen auch eine jeweils in spitzen Klammern (»«) gesetzte Glied-für-Glied-Wiedergabe verwendet wird. Bei den modernen Verständnishilfen wird so gut wie möglich vom Anschaulichen zum Übertragenen vorwärts geschritten.

 

Gelegentlich lässt sich eine lateinische Vorlage eines mittelhochdeutschen Textes erkennen. In diesen Fällen sind lateinisch-mittelhochdeutsche Übersetzungsgleichungen feststellbar. Sie sind grundsätzlich in einer eigenen Rubrik (ÜG.:) verzeichnet.

 

Als nächstes legen Verweise und Hinweise binnensprachliche Zusammenhänge offen. Verweise (Vw.:) führen von Grundwörtern auf die mit ihnen gebildeten Zusammensetzungen und von Nebenformen auf Hauptformen. Hinweise (Hw.:) erschließen sonstige wahrscheinliche sprachliche Verbindungen oder Beziehungen.

 

Danach werden in grundsätzlich chronologischer Reihung die von der Literatur berücksichtigten literarischen Quellen in Form mehr oder weniger leicht auflösbarer Siglen verzeichnet, deren Zahl einen ersten verhältnismäßigen Rückschluss auf die Häufigkeit des Stichwortes im Mittelhochdeutschen ermöglicht. Stets wird dabei zur Erleichterung des Verständnisses die von der vorausgehenden Literatur angesetzte Normalform hinzugefügt. Die jeweils früheste Quelle wird mit einer Jahreszahl versehen, sodass das Wörterbuch erstmals für jedermann auf einen Blick das erste Auftreten eines mittehochdeutschen Wortes in der Überlieferung offen legt. Dabei werden zuerst die Quellen des Findebuchs in der Reihenfolge der dortigen Siglen verzeichnet. Im Anschluss daran sind weitere Siglen aus anderen Quellen in alphabetischer Reihenfolge verzeichnet, am Schluss stehen noch Angaben zu Vorkommen in Glossen und Urkunden.

 

Beeinflusst kann ein mittelhochdeutsches Wort von einer fremden Sprache sein. Als verschiedene Erscheinungsfälle werden dabei Fremdwort, Lehnwort, Lehnübersetzung, Lehnübertragung, Lehnschöpfung und Lehnbildung unterschieden. Nach Möglichkeit ist auf eine solche Interferenz (I.:) besonders hingewiesen.

 

Im weiteren Unterschied zu allen bisherigen mittelhochdeutschen Wörterbüchern werden systematisch Hinweise auf althochdeutsche Vorformen und Angaben zu sonstigen etymologischen Zusammenhängen (E.:) geboten. Dem folgen ebenfalls erstmals Aussagen zum Weiterleben (und negativ zum Untergang) im älteren (ält.) und gegenwärtigen Neuhochdeutschen (W.:), wobei im Einzelfall die Beschränkung auf das Frühneuhochdeutsche (1350-1650) hervorgehoben sein kann. Auf diese Weise wird erstmals die Einbettung des Mittelhochdeutschen in die Entwicklung vom Althochdeutschen zum Neuhochdeutschen umfassend in leicht verständlicher Art dargestellt.

 

Im Einzelfall werden mit dem jeweiligen Stichwort gebildete Redewendungen  (R.:) aufgenommen, bei denen grundsätzlich die normalisierte Hauptform des Ansatzes verwendet wird. Am Schluss stehen Angaben zur verwerteten Literatur unter Einbeziehung der dortigen Normalformen, welche die Herkunft des Materials offenlegen. Dabei eröffnet das an dieser Stelle einbezogene Wörterbuch der mittelhochdeutschen Urkundensprache einen zusätzlichen Einblick in erste Nennung und Häufigkeit des jeweiligen Stichworts in den etwa 4000 von etwa 1200 bis 1300 verfassten, im Original der wissenschaftlichen Gegenwart überlieferten Urkunden der mittelhochdeutschen Wirklichkeit.

 

Über die bisherige Literatur hinaus will das Wörterbuch im Übrigen auch als zufällig angesehene Überlieferungslücken schließen. Deswegen entnimmt es beispielsweise den Zusammensetzungen auch die nicht einzeln belegten Grundwörter oder regelmäßig gebildeten Adverbien auch die ihnen zugrundeliegenden Adjektive. Dabei werden aus technischen Gründen die Zeichen *** für nicht belegte Wörter und * für (wahrscheinlich) nicht belegte Formen (am Ende des Ansatzes) verwendet.

 

In den 99363 erfassten Ansätzen und Verweisen sind 841903 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 8,4730 Zeichen. Zur Darstellung des Mittelhochdeutschen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Mittelhochdeutschen angepasst werden muss.

 

Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z). Hinzu kommen als mittelhochdeutsche Zusatzzeichen gegenüber dem Lateinischen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.

 

Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

 

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 66 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:

 

Asc

Hex

Zeichen

Häufigkeit

97

61

a

28332

65

41

A

28

257

101

ā

5402

230

0

æ

6583

483

1000

ǣ

5

228

0

ä

77

98

62

b

22388

66

42

B

33

99

63

c

34728

67

43

C

8

100

64

d

18114

68

44

D

1

240

00F0

ð

6

101

65

e

155617

69

45

E

11

235

00EB

ë

13

275

113

ē

2266

274

112

Ē

2

102

66

f

10281

70

46

F

8

103

67

g

27187

71

47

G

1

104

68

h

40319

72

48

H

4

105

69

i

46563

73

49

I

10

299

012B

ī

12548

106

006A

j

1157

74

004A

J

2

107

006B

k

11710

75

004B

K

11

108

006C

l

44566

76

004C

L

7

109

006D

m

17575

77

004D

M

4

110

006E

n

77355

78

004E

N

8

111

006F

o

17581

79

004F

O

1

243

00F3

ó

1

333

014D

ō

3474

339

153

œ

1020

339,772

153,0304

œ̄

5

246

00F6

ö

1145

245

00F5

õ

4

112

70

p

9536

80

50

P

17

113

71

q

305

114

72

r

66948

82

52

R

15

115

73

s

38283

83

53

S

35

116

74

t

49974

84

54

T

29

117

75

u

26648

85

55

U

3

363

016B

ū

5349

252

00FC

ü

8456

118

76

v

15622

86

56

V

7

119

77

w

17099

87

57

W

15

120

78

x

49

121

79

y

122

122

007A

z

17223

90

005A

Z

2

 

 

 

 

Hieraus lassen sich folgende Häufigkeiten ermitteln:

Zeichen

Varianten

Häufigkeit

Prozent

A

a A ā æ ǣ ä

40427

4,80%

B

b B

22421

2,70%

C

c C

34736

4,10%

D

d D ð

18121

2,20%

E

e E ë ē Ē

157909

18,80%

F

f F

10289

1,20%

G

g G

27188

3,20%

H

h H

40323

4,80%

I

i I ī

59121

7,00%

J

j J

1159

0,10%

K

k K

11721

1,40%

L

l L

44573

5,30%

M

m M

17579

2,10%

N

n N

77363

9,20%

O

o O ó ō œ œ̄ ö õ

23231

2,80%

P

p P

9553

1,10%

Q

q

305

0,00%

R

r R

66963

8,00%

S

s S

38318

4,60%

T

t T

50003

5,90%

U

u U ū ü

40456

4,80%

V

v V

15629

1,90%

W

w W

17114

2,00%

X

x

49

0,00%

Y

y

122

0,00%

Z

z Z

17225

2,00%

Summe

841898

100%

 

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:

E

e E ë ē Ē

157909

18,80%

N

n N

77363

9,20%

R

r R

66963

8,00%

I

i I ī

59121

7,00%

T

t T

50003

5,90%

L

l L

44573

5,30%

U

u U ū ü

40456

4,80%

A

a A ā æ ǣ ä

40427

4,80%

H

h H

40323

4,80%

S

s S

38318

4,60%

C

c C

34736

4,10%

G

g G

27188

3,20%

O

o O ó ō œ œ̄ ö õ

23231

2,80%

B

b B

22421

2,70%

D

d D ð

18121

2,20%

M

m M

17579

2,10%

Z

z Z

17225

2,00%

W

w W

17114

2,00%

V

v V

15629

1,90%

K

k K

11721

1,40%

F

f F

10289

1,20%

P

p P

9553

1,10%

J

j J

1159

0,10%

Q

q

305

0,00%

Y

y

122

0,00%

X

x

49

0,00%