Köbler, Gerhard
Die Häufigkeit der zur
Darstellung des Altfriesischen verwendeten Buchstaben
Das Altfriesische ist
neben dem Gotischen, Altnordischen, Altenglischen, Altniederdeutschen
(Altsächsischen, Altniederfränkischen) und Althochdeutschen eine
germanisch/germanistische Einzelsprache. Sie tritt nach Einzelwörtern vor allem
des 9. Jahrhunderts im (11. bzw.) 13. Jahrhundert in schriftlicher
Überlieferung hervor. Dabei betrifft die Aufzeichnung vor allem Rechtstexte.
Seine Grenze zum Neufriesischen - bzw. dem von einigen Forschern darüber hinaus
angenommenen (zeitlich gesehenen und für die Zeit zwischen 1550 und 1800
angesetzten) Mittelfriesischen - wird bei etwa 1550 gezogen (unübersehbare
Überlieferungslücke).
Der dadurch
überkommene Wortschatz des Altfriesischen ist schon mehrfach lexikalisch
erfasst worden. Karl Freiherr von Richthofens Wörterbuch aus der Mitte des 19.
Jahrhunderts verzeichnet dabei zwar auch die Belege der von ihm
veröffentlichten Texte, ist aber sowohl quellenmäßig wie auch
sprachwissenschaftlich nur auf dem Stande seiner Zeit und behandelt außerdem
nicht jedes selbständige Wort als selbständigen Ansatz. Ferdinand Holthausens
Wörterbuch des frühen 20. Jahrhundets verbessert diesen Stand durch die
Aufnahme zahlreicher weiterer Wörter (ca. 1800) und durch philologische
Korrekturen. Sein nach Wortstämmen geordnetes, durch zwei Nachträge ergänztes
und gleichwohl möglicherweise nicht mehr als 60-75 Prozent des überlieferten
Wortschatzes erfassendes Werk ist aber sehr unübersichtlich und in Einzelheiten
überholt.
Aus diesem Grunde ist
auf der Grundlage beider - durchaus nicht vollkommener und vollständiger
Wörterbücher und - in Parallele zu einem indogermanisch-neuhochdeutschen
Wörterbuch, einem germanisch-neuhochdeutschen Wörterbuch, einem
gotisch-neuhochdeutschen Wörterbuch, einem altnordisch-neuhochdeutschen
Wörterbuch, einem altenglisch-neuhochdeutschen Wörterbuch, einem
altniederdeutschen-neuhochdeutschen Wörterbuch und einem althochdeutsch-neuhochdeutschen
Wörterbuch auch ein altfriesisch-neuhochdeutsches Wörterbuch mit rund 7500
Stichwörtern und Verweisen in streng alphabetischer Reihenfolge erarbeitet
worden. Dabei beginnt der einzelne Artikel mit dem Lemma in einer normalisierten
Hauptform und eventuellen Nebenformen, die grundsätzlich auch als Verweise
(verweisende Ansätze) auf die Hauptform aufgenommen sind. Es folgen die Angaben
der (ungefähren) Anzahl (z. B. 1 für hapax legomena) der Belegstellen (und aus
übergeordneten Erwägungen die Angabe der [altfriesischen] Sprache). Dem ist
(grundsätzlich) eine grammatikalische Bestimmung des Wortes angefügt. Bei der
anschließenden Ermittlung der Bedeutung im Neuhochdeutschen ist ein Mittelweg
zwischen ganz besonderer Bedeutung im einzelnen, vermutlich öfter auch vom
Zufall bestimmten Kontext und allgemeinerer, durch die überlieferten Kontexte
nicht immer gesicherter etymologisch ausgerichteter Bedeutung eingeschlagen
worden. Im Anschluss hieran wird eine englische Bedeutung angeführt. Darüber
hinaus sind, soweit vorhanden, lateinische Übersetzungsgleichungen angefügt.
Weiter werden Verweise von Grundwörtern auf Komposita und Hinweise auf
nahestehende Wörter gegeben. Unter den Hinweisen finden sich auch verwandte
Wörter anderer germanischer/germanistischer Sprachen (Gotisch, Altnordisch,
Altenglisch, Altniederfränkisch, Altsächsisch, Althochdeutsch,
Mittelniederdeutsch, Mittelniederländisch, Mittelhochdeutsch und
Plattdeutsch/Neuniederdeutsch). Anschließend werden (die) Quellen des Lemmas
durch summarische Siglen angegeben, wobei gelegentlich eine Jahreszahl für den
ältesten Beleg angeführt wird. Im Anschluss hieran werden unter Interferenz
fremdsprachliche Wörter genannt, die formal oder inhaltlich das
nationalsprachliche Wort beeinflusst haben (könnten). Dem folgt (erstmals
grundsätzlich) die Etymologie des Lemmas. Danach wird unter Literatur die
lexikalische Fundstelle für das Stichwort offengelegt oder ein sonstiger
weiterführender Hinweis geboten. Vereinzelt folgen dem geläufige Redewendungen
oder Erklärungen von Besonderheiten eines Lemmas.
Erschlossenes Material
ist durch * kenntlich gemacht, wobei für erschlossene Lemmata der Asterisk am
Beginn steht, für nicht belegte, erschlossene Formen des Stichworts dagegen am
Ende. Klammern und Fragezeichen deuten Unsicherheiten und Vorbehalte an. Als
Bausteine etymologisch erkennbare Teile von Wörtern sind durch Bindestriche
abgesondert.
Die Ordnung der
Lemmata ist streng alphabetisch. Lange und kurze Vokale werden dabei
grundsätzlich nicht geschieden, doch folgt bei Gleichheit im übrigen das Wort
mit langem Vokal dem Wort mit kurzem Vokal nach. Th steht hinter t, j hinter i.
Wie für das
Indogermanische, Germanische, Gotische, Altnordische, Altenglische,
Altniederdeutsche und Althochdeutsche so ist auch für das Altfriesische
(erstmals) ein neuhochdeutsch-altfriesisches Wörterbuch verfasst worden,
welches das Altfriesische von der neuhochdeutschen Sprache her aufschließen
soll, indem es eine Antwort etwa auf die Frage ermöglicht, wie das Altfriesische
den Sachverhalt bezeichnet, den das Neuhochdeutsche etwa als „Abend“,
„Kopf“, „Monat“, „Schulter“ oder „Wasser“ benennt. Dass auch hier noch manche
Frage bleibt und Verbesserungen möglich sind, versteht sich von selbst. Möge
wie hier auch insgesamt die germanistische Sprachforschung weiterführend
eintreten und die Grundlage für das Altfriesische überhaupt und damit für ein
altfriesisch-neuhochdeutsches wie ein neuhochdeutsch-altfriesisches Wörterbuch
verbessern - wie dies etwa durch die nahezu vollständige Verzettelung des
altfriesischen Wörterschatzes im Friesischen Institut in Groningen (Fries
Institut, Westersingel 28-30, Groningen) vorbereitet bzw. geschehen ist.
In den 12496 erfassten
Ansätzen und Verweisen des Grundwortschatzes sind 88758 Zeichen enthalten. Daraus
errechnet sich eine durchschnittliche Ansatzlänge von 7,1029 Zeichen. Zur
Darstellung des Altfriesischen ist grundsätzlich das Buchstabensystem
(Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten
Hinsichten auf Besonderheiten des Altfriesischen angepasst werden muss.
Ausgangspunkt sind
also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k,
l, m, n, o, p, q[1x], r, s, t, u, v, x, y, z). Hinzu kommen als altfriesische
Sonderzeichen j und w. Hieraus
ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer
Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache
besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine
besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines
von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms
selbst ermittelt.
Dieses gelangt unter
der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung
aller 26 Buchstaben (z. B. a, b, c, d usw.) und 54 Buchstabenvarianten (z. B.
a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
6578 |
65 |
41 |
A |
3 |
257,774 |
101,0306 |
ā̆ |
5 |
257 |
101 |
ā |
534 |
226 |
0 |
â |
725 |
98 |
62 |
b |
1896 |
66 |
42 |
B |
4 |
99 |
63 |
c |
1142 |
100 |
64 |
d |
4595 |
101 |
65 |
e |
10396 |
69 |
45 |
E |
2 |
275,774 |
113,0306 |
ē̆ |
32 |
275 |
113 |
ē |
1141 |
234 |
00EA |
ê |
1202 |
102 |
66 |
f |
2307 |
70 |
46 |
F |
5 |
103 |
67 |
g |
2397 |
104 |
68 |
h |
4135 |
105 |
69 |
i |
6628 |
73 |
49 |
I |
2 |
299,774 |
012B,0306 |
ī̆ |
5 |
299 |
012B |
ī |
953 |
238 |
00EE |
î |
30 |
106 |
006A |
j |
341 |
74 |
004A |
J |
1 |
107 |
006B |
k |
3292 |
75 |
004B |
K |
2 |
108 |
006C |
l |
4405 |
76 |
004C |
L |
2 |
109 |
006D |
m |
2081 |
77 |
004D |
M |
4 |
110 |
006E |
n |
6971 |
78 |
004E |
N |
2 |
111 |
006F |
o |
2613 |
333,774 |
014D,0306 |
ō̆ |
17 |
333 |
014D |
ō |
763 |
244 |
00F4 |
ô |
17 |
112 |
70 |
p |
1326 |
80 |
50 |
P |
4 |
113 |
71 |
q |
33 |
114 |
72 |
r |
6421 |
82 |
52 |
R |
5 |
115 |
73 |
s |
4604 |
83 |
53 |
S |
3 |
116 |
74 |
t |
5393 |
117 |
75 |
u |
1868 |
85 |
55 |
U |
2 |
363 |
016B |
ū |
660 |
118 |
76 |
v |
677 |
119 |
77 |
w |
2099 |
87 |
57 |
W |
4 |
120 |
78 |
x |
80 |
121 |
79 |
y |
2 |
122 |
007A |
z |
290 |
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A ā̆ ā â |
7845 |
8,80% |
B |
b B |
1900 |
2,10% |
C |
c |
1142 |
1,30% |
D |
d |
4595 |
5,20% |
E |
e E ē̆ ē ê |
12773 |
14,40% |
F |
f F |
2312 |
2,60% |
G |
g |
2397 |
2,70% |
H |
h |
4135 |
4,70% |
I |
i I ī̆ ī î |
7618 |
8,60% |
J |
j J |
342 |
0,40% |
K |
k K |
3294 |
3,70% |
L |
l L |
4407 |
5,00% |
M |
m M |
2085 |
2,40% |
N |
n N |
6973 |
7,90% |
O |
o ō̆ ō ô |
3410 |
3,80% |
P |
p P |
1330 |
1,50% |
Q |
q |
33 |
0,00% |
R |
r R |
6426 |
7,20% |
S |
s S |
4607 |
5,20% |
T |
t |
5393 |
6,10% |
U |
u U ū |
2530 |
2,90% |
V |
v |
677 |
0,80% |
W |
w W |
2103 |
2,40% |
X |
x |
80 |
0,10% |
Y |
y |
2 |
0,00% |
Z |
z |
290 |
0,30% |
Summe |
88699 |
100% |
Ordnet man die Buchstaben nach ihren Häufigkeiten, so
entsteht folgende Reihung:
E |
e E ē̆ ē ê |
12773 |
14,40% |
A |
a A ā̆ ā â |
7845 |
8,80% |
I |
i I ī̆ ī î |
7618 |
8,60% |
N |
n N |
6973 |
7,90% |
R |
r R |
6426 |
7,20% |
T |
t |
5393 |
6,10% |
S |
s S |
4607 |
5,20% |
D |
d |
4595 |
5,20% |
L |
l L |
4407 |
5,00% |
H |
h |
4135 |
4,70% |
O |
o ō̆ ō ô |
3410 |
3,80% |
K |
k K |
3294 |
3,70% |
U |
u U ū |
2530 |
2,90% |
G |
g |
2397 |
2,70% |
F |
f F |
2312 |
2,60% |
W |
w W |
2103 |
2,40% |
M |
m M |
2085 |
2,40% |
B |
b B |
1900 |
2,10% |
P |
p P |
1330 |
1,50% |
C |
c |
1142 |
1,30% |
V |
v |
677 |
0,80% |
J |
j J |
342 |
0,40% |
Z |
z |
290 |
0,30% |
X |
x |
80 |
0,10% |
Q |
q |
33 |
0,00% |
Y |
y |
2 |
0,00% |