Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Altnordischen verwendeten Buchstaben
Das
Altnordische ist neben dem Gotischen, Altenglischen, Althochdeutschen,
Altniederdeutschen (Altsächsischen, Altniederfränkischen) und Altfriesischen
eine germanistische Einzelsprache. Sie tritt nach den ältesten, bis ins zweite
nachchristliche Jahrhundert zurückreichenden Runeninschriften des Urnordischen
im 12. Jahrhundert in schriftlicher Überlieferung hervor. Dabei betrifft die
Aufzeichnung vor allem poetische und prosaische Literatur, daneben auch
Rechtstexte. Die Grenze zum Neunordischen wird bei etwa 1500 gezogen.
Der
durch die Quellen überkommene Wortschatz der verschiedenen altnordischen
Einzelsprachen (altostnordisch = altdänisch, altschwedisch; altwestnordisch,
altnorwegisch, altisländisch, altfaröisch) ist schon mehrfach lexikalisch
erfasst worden. Die einzelnen Lexika sind aber insgesamt noch unzureichend. Am
besten gibt wohl den Grundwortschatz Jan de Vries' Altnordisches etymologisches
Wörterbuch, 2. A. Leiden 1962 wieder, das freilich auch, da zu spekulativ, als
etymologisch nicht völlig zuverlässig eingeschätzt wird.
Immerhin
ermöglicht es in Parallele zu entsprechenden Arbeiten zum Indogermanischen
(1980, 2. A. 1982), Germanischen (1981), Gotischen (1981), Altniederdeutschen
(2. A. 1982), Altfriesischen (1983), Altenglischen (1985) und Althochdeutschen
(3. A. 1987) eine erste, nach dem altwestnordischen Altisländischen
normalisierte streng alphabetisch geordnete Erfassung des Grundwortschatzes,
der sich auf etwa 12000 Wörter schätzen lässt. Dabei beginnt der einzelne
Artikel mit dem Lemma in einer normalisierten Hauptform und eventuellen
Nebenformen, welche grundsätzlich auch als Verweise auf die Hauptform
aufgenommen sind. Es folgt die Angabe der Sprache (an.). Dem ist eine
grammatikalische Bestimmung des Wortes angefügt. Bei der anschließenden
Ermittlung der Bedeutung ist ein Mittelweg zwischen ganz spezieller Bedeutung
im einzelnen Kontext und allgemeiner, durch die Kontexte nicht immer
gesicherter etymologisch ausgerichteter Bedeutung versucht worden. Im Anschluss
hieran werden fremdsprachliche Wörter angeführt, welche formal oder inhaltlich
das nationalsprachliche Wort beeinflusst haben (könnten). Weiter werden Hinweise
auf nahestehende Wörter gegeben, wie etwa von Grundwörtern auf Komposita. Den
Beschluss bildet meist ein Hinweis auf die einschlägige Seitenzahl de Vries'.
Darüberhinaus sind, soweit vorhanden, lateinische Übersetzungsgleichungen
angefügt, um deren altnordische Bestandteile das Material de Vries' auch
erweitert ist.
Formal
ist erschlossenes Material durch * und sind Homonyme durch (1), (2) usw., hapax
legomena durch 1 kenntlich gemacht. Klammern und Fragezeichen deuten
Unsicherheiten und Vorbehalte an. Erkennbare Teile von Wörtern sind durch
Bindestriche abgesondert. Þ bzw. þ steht hinter t, ð hinter d, j hinter i, æ, ø, œ
und ǫ hinter y.
In den 12443 erfassten Ansätzen und Verweisen
sind 69496 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche
Ansatzlänge von 5,5851 Zeichen. Zur Darstellung des Altnordischen ist
grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen
verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des
Altnordischen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des
lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q, r, s,
t, u, v, x, y, z), wobei das q aber im Altnordischen nicht verwendet wird.
Hinzu kommen als altnordische Sonderzeichen j, þ und w sowie æ, œ, ø, ǫ.
Hieraus ergibt sich eine Gesamtzeichenzahl von 30 (23 + 7) Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 30 Buchstaben (z. B. a, b, c, d usw.) und 60 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
7458 |
65 |
41 |
A |
5 |
257 |
101 |
ā |
768 |
230 |
0 |
æ |
603 |
98 |
62 |
b |
1022 |
66 |
42 |
B |
29 |
384 |
180 |
ƀ |
3 |
99 |
63 |
c |
5 |
100 |
64 |
d |
1325 |
68 |
44 |
D |
13 |
240 |
00F0 |
ð |
1768 |
101 |
65 |
e |
2968 |
69 |
45 |
E |
17 |
275 |
113 |
ē |
154 |
102 |
66 |
f |
1982 |
70 |
46 |
F |
13 |
103 |
67 |
g |
3106 |
71 |
47 |
G |
27 |
104 |
68 |
h |
1443 |
72 |
48 |
H |
36 |
105 |
69 |
i |
5131 |
73 |
49 |
I |
4 |
299 |
012B |
ī |
580 |
298 |
012A |
Ī |
4 |
106 |
006A |
j |
1319 |
74 |
004A |
J |
4 |
107 |
006B |
k |
3306 |
108 |
006C |
l |
4622 |
76 |
004C |
L |
4 |
109 |
006D |
m |
1725 |
77 |
004D |
M |
10 |
110 |
006E |
n |
4495 |
78 |
004E |
N |
14 |
111 |
006F |
o |
979 |
79 |
004F |
O |
9 |
333 |
014D |
ō |
702 |
339 |
153 |
œ |
365 |
248 |
00F8 |
ø |
134 |
491 |
01EB |
ǫ |
713 |
112 |
70 |
p |
1197 |
114 |
72 |
r |
8205 |
82 |
52 |
R |
27 |
115 |
73 |
s |
4074 |
83 |
53 |
S |
25 |
116 |
74 |
t |
3391 |
84 |
54 |
T |
2 |
254 |
00FE |
þ |
493 |
222 |
00DE |
Þ |
3 |
117 |
75 |
u |
1573 |
363 |
016B |
ū |
522 |
362 |
016A |
Ū |
2 |
117,815 |
0075,032F |
u̯ |
1 |
118 |
76 |
v |
1525 |
86 |
56 |
V |
17 |
119 |
77 |
w |
29 |
120 |
78 |
x |
57 |
121 |
79 |
y |
1010 |
89 |
59 |
Y |
4 |
563 |
233 |
ȳ |
331 |
122 |
007A |
z |
142 |
|
|
|
|
Hieraus
lassen sich folgende Häufigkeiten ermitteln |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
|
|
|
|
A |
a A ā æ |
8834 |
12,70% |
(a |
aA ā [ohne æ] |
8231 |
11,8 %) |
(ae |
æ |
603 |
0,9 %) |
B |
b B ƀ |
1054 |
1,50% |
C |
c |
5 |
0,00% |
D |
d D ð |
3106 |
4,50% |
E |
e E ē |
3139 |
4,50% |
F |
f F |
1995 |
2,90% |
G |
g G |
3133 |
4,50% |
H |
h H |
1479 |
2,10% |
I |
i I ī Ī |
5719 |
8,20% |
J |
j J |
1323 |
1,90% |
K |
k |
3306 |
4,80% |
L |
l L |
4626 |
6,70% |
M |
m M |
1735 |
2,50% |
N |
n N |
4509 |
6,50% |
O |
o O ō œ ø ǫ |
2902 |
4,20% |
(o |
o O ō [ohne œ, ø, ǫ] |
1690 |
2,4 %) |
(œ |
œ |
365 |
0,5 %) |
(ø |
ø |
134 |
0,2 %) |
(ǫ |
ǫ |
713 |
1,0 %) |
P |
p |
1197 |
1,70% |
R |
r R |
8232 |
11,80% |
S |
s S |
4099 |
5,90% |
T |
t T |
3393 |
4,90% |
Þ |
þ Þ |
496 |
0,70% |
U |
u ū Ū |
2097 |
3,00% |
V |
u̯ v V |
1543 |
2,20% |
W |
w |
29 |
0,00% |
X |
x |
57 |
0,10% |
Y |
y Y ȳ |
1345 |
1,90% |
Z |
z |
142 |
0,20% |
|
|
|
|
Summe (ohne Sonderzeichen) |
69495 |
100% |
Ordnet
man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung
A |
a A ā æ |
8834 |
12,70% |
R |
r R |
8232 |
11,80% |
(a |
aA ā |
8231 |
11,8 %) |
I |
i I ī Ī |
5719 |
8,20% |
L |
l L |
4626 |
6,70% |
N |
n N |
4509 |
6,50% |
S |
s S |
4099 |
5,90% |
T |
t T |
3393 |
4,90% |
K |
k |
3306 |
4,80% |
E |
e E ē |
3139 |
4,50% |
G |
g G |
3133 |
4,50% |
D |
d D ð |
3106 |
4,50% |
O |
o O ō œ ø ǫ |
2902 |
4,20% |
U |
u ū Ū |
2097 |
3,00% |
F |
f F |
1995 |
2,90% |
M |
m M |
1735 |
2,50% |
(o |
o O ō |
1690 |
2,4 %) |
V |
u̯ v V |
1543 |
2,20% |
H |
h H |
1479 |
2,10% |
Y |
y Y ȳ |
1345 |
1,90% |
J |
j J |
1323 |
1,90% |
P |
p |
1197 |
1,70% |
B |
b B ƀ |
1054 |
1,50% |
(ǫ |
ǫ |
713 |
1,0 %) |
(ae |
æ |
603 |
0,9 %) |
Þ |
þ Þ |
496 |
0,70% |
(œ |
œ |
365 |
0,5 %) |
Z |
z |
142 |
0,20% |
(ø |
ø |
134 |
0,2 %) |
X |
x |
57 |
0,10% |
W |
w |
29 |
0,00% |
C |
c |
5 |
0,00% |