Köbler, Gerhard

 

Die Häufigkeit der zur Darstellung des Germanischen verwendeten Buchstaben

 

Das Germanische ist eine indogermanische Sprache, die zur Gruppe der sogenannten Kentum-Sprachen gehört, aber mit keiner zweiten indogermanischen Sprache enger verwandt ist. Am nächsten stehen dem Germanischen das Keltische, das Italische, das Venetische, das Illyrische, das Baltische und das Slawische. Jedenfalls vom Keltischen ist es in früher Zeit auch beeinflusst worden.

 

Das Germanische ist im Zeitpunkt seiner ersten schriftlichen Überlieferung, wie sie nach wenigen älteren Einzelwörtern und Einzelnamen seit dem ersten nachchristlichen Jahrhundert allmählich einsetzt, keine einheitliche Sprache (mehr), sondern gliedert sich in verschiedene Sprachgruppen. Hierbei werden insbesondere Westgermanisch (Vorläufer des Altenglischen, Altfriesischen, Altniederdeutschen [Altniederfränkischen, Altsächsischen], Althochdeutschen einschließlich des Thüringischen und Langobardischen), Nordgermanisch (Urnordisch bis etwa 800 n. Ch.) und Ostgermanisch (Gotisch, Gepidisch, Vandalisch, Burgundisch, Rugisch, Skirisch) unterschieden, von denen das Nordgermanische und das Ostgermanische gegenüber dem Westgermanischen eine Reihe von gemeinsamen Unterscheidungsmerkmalen aufweisen (u. a. Fehlen der Verben tun, gehen, stehen, Umbildung von uu zu ggw im Nordgermanischen und Ostgermanischen gegenüber uw im Westgermanischen), Wie weit dem eine völlig einheitliche germanische Sprache vorausgeht, ist umstritten, Sie lässt sich jedenfalls durch tatsächliche Überlieferung nicht fassen. Immerhin lässt sich mit den gleichen guten Gründen wie für das Indogermanische ein im Wesentlichen einheitlicher Grundbestand des Germanischen vermuten, der allerdings nur im Wege der hypothetischen Rekonstruktion aus den überlieferten jüngeren Einzelsprachen zu gewinnen ist (Beispiel: urnord. gastiR, got. gasts, ae. giest, as. gast, ahd. gast führen auf germ. *gastiz Gast, anord. fiskr, got. fisks, ae. fisk, afries. fisk, as. fisk, ahd. fisk führen auf germ. *fiskaz Fisch).

 

Der Wortschatz des Germanischen wurde als Gesamtheit zuletzt von Torp, A./Falk, H. (Wortschatz der germanischen Spracheinheit) 1909, für die starken Verben von Elmar Seebold (1970) und für die Primäradjektive von Frank Heidermanns (1993) gesammelt und danach von Gerhard Köbler einfach und übersichtlich strikt alphabetisch zusammengefasst. Er enthält in seiner zuletzt festgelegten Fassung insgesamt 12051 mehr oder weniger allgemein anerkannte (normalisierte) Ansätze mit 68793 Zeichen (d. h. 5,7087 Zeichen pro Ansatz), die aber - wie nahezu alles in den Geisteswissenschaften - , einer eigenen Geschichte und Zukunft unterworfen sind. Zu ihrer Darstellung ist grundsätzlich von den frühen Schreibern bis zu den gegenwärtigen Wissenschaftlern das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Germanischen angepasst werden muss(te). Dementsprechend umfasst diese Zeichenmenge nicht - wie das Lateinische - 24 Zeichen (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s, t, u, v, x, y, z), sondern wegen der drei germanischen Zusatzzeichen j, þ und w 27 Buchstaben (a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, þ, u, v, w, x, y, z).

 

Die Häufigkeit der Verwendung der einzelnen Buchstaben in den (normalisierten) Ansätzen hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

 

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller (27 anerkannten) Buchstaben (z. B. a, b, c usw.) und (57) Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden leicht gerundeten Erkenntnissen:

 

Asc

Hex

Zeichen

Häufigkeit

97

61

a

11604

65

41

A

49

257

101

ā

16

98

62

b

1738

66

42

B

25

99

63

c

62

67

43

C

19

100

64

d

1811

68

44

D

6

273

111

đ

1

101

65

e

3101

69

45

E

7

275

113

ē

787

102

66

f

1125

70

46

F

7

103

67

g

2141

71

47

G

11

104

68

h

2087

72

48

H

3

105

69

i

3869

73

49

I

10

299

012B

ī

833

106

006A

j

1992

74

004A

J

5

107

006B

k

2792

75

004B

K

8

108

006C

l

3538

76

004C

L

12

109

006D

m

1562

77

004D

M

20

110

006E

n

6136

78

004E

N

9

111

006F

o

206

79

004F

O

3

333

014D

ō

3281

112

70

p

1028

80

50

P

6

113

71

q

4

81

51

Q

2

114

72

r

4158

82

52

R

11

115

73

s

3814

83

53

S

11

116

74

t

2749

84

54

T

18

254

00FE

þ

1469

117

75

u

3472

85

55

U

2

363,774

016B,0306

ū̆

3

363

016B

ū

293

118

76

v

47

86

56

V

11

119

77

w

2438

87

57

W

5

120

78

x

2

121

79

y

2

122

007A

z

372

 

 

 

 

Hieraus lassen sich in etwa folgende Häufigkeiten ermitteln:

Zeichen

Varianten

Häufigkeit

Prozent

A

a A ā

11669

17,00%

B

b B

1763

2,60%

C

c C

81

0,10%

D

d D đ

1818

2,60%

E

e E ē

3895

5,70%

F

f F

1132

1,60%

G

g G

2152

3,10%

H

h H

2090

3,00%

I

i I ī

4712

6,80%

J

j J

1997

2,90%

K

k K

2800

4,10%

L

l L

3550

5,20%

M

m M

1582

2,30%

N

n N

6145

8,90%

O

o O ō

3490

5,10%

P

p P

1034

1,50%

Q

q Q

6

0,00%

R

r R

4169

6,10%

S

s S

3825

5,60%

T

t T

2767

4,00%

Þ

þ

1469

2,10%

U

u U ū̆ ū

3770

5,50%

V

v V

58

0,10%

W

w W

2443

3,60%

X

x

2

0,00%

Y

y

2

0,00%

Z

z

372

0,50%

Summe

68793

100%

 

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung

A

a A ā

11669

17,00%

N

n N

6145

8,90%

I

i I ī

4712

6,80%

R

r R

4169

6,10%

E

e E ē

3895

5,70%

S

s S

3825

5,60%

U

u U ū̆ ū

3770

5,50%

L

l L

3550

5,20%

O

o O ō

3490

5,10%

K

k K

2800

4,10%

T

t T

2767

4,00%

W

w W

2443

3,60%

G

g G

2152

3,10%

H

h H

2090

3,00%

J

j J

1997

2,90%

D

d D đ

1818

2,60%

B

b B

1763

2,60%

M

m M

1582

2,30%

Þ

þ

1469

2,10%

F

f F

1132

1,60%

P

p P

1034

1,50%

Z

z

372

0,50%

C

c C

81

0,10%

V

v V

58

0,10%

Q

q Q

6

0,00%

X

x

2

0,00%

Y

y

2

0,00%

 

Danach ist der am häufigsten zur Darstellung des in der Gegenwart anerkannten germanischen Wortschatzes verwendete Buchstabe das a vor n, i, r, e, s u, l und o, während c, v, q, x und y nur ziemlich selten gebraucht werden.