Köbler, Gerhard
Die Häufigkeit der zur
Darstellung des Altenglischen verwendeten Buchstaben
Das Altenglische ist
die zeitlich zwischen dem Germanischen und dem Mittelenglischen liegende
Sprachstufe des Englischen. Ihr Beginn setzt vielleicht schon mit der auf den
Rückzug der Römer (407) folgenden Landnahme germanischer Stämme auf der
britischen, wohl seit der Mitte des ersten vorchristlichen Jahrtausends von
Kelten besiedelten und seit 43 n. Chr. von den Römern eroberten Insel im Jahre
449 (vielleicht schon 428) ein, mit der eine räumliche Absonderung von den
übrigen germanischen Stämmen einhergeht, welche faktisch die Wahrscheinlichkeit
gesonderter Sprachentwicklung begünstigt. Aus dieser frühen Zeit sind aber
keine altenglischen Texte überliefert, so dass sich der Anfang der
Überlieferung um etwa 700 als Anfangszeitpunkt des Altenglischen anbietet. Im
11. Jahrhundert treten dann so viele, vor allem durch die den skandinavischen
Einfällen seit 787 folgende normannische Eroberung Englands im Jahre 1066 (14.
10. 1066 Schlacht bei Senlac/Hastings) bewirkte Veränderungen (vor allem
Abschwächung der vollen kurzen Endsilbenvokale zu e) ein, dass mit dem Ende
dieses Jahrhunderts auch die altenglische Sprachstufe endet und das
Mittelenglische beginnt. Gegen Ende des 12. Jahrhunderts werden Handschriften
mit altenglischen Texten bereits allgemein nicht mehr verstanden.
Das Altenglische
stammt aus dem nur durch Rekonstruktion erkennbaren Germanischen und ist somit
eine germanistische Sprache. Über das Germanische gehört es zugleich zum
Indogermanischen oder Indoeuropäischen, und zwar zur Gruppe der sogenannten
Kentum-Sprachen (lat. centum = hundert), zu welchen außer dem Germanischen das
Griechische, das Italische, das Keltische, das Hethitische und das Tocharische
zählen und welche im Gegensatz zu den sogenannten Satem-Sprachen stehen.
Innerhalb des
Germanischen unterscheidet man zwischen Ostgermanisch, Nordgermanisch und
Westgermanisch. Das Altenglische entwickelt sich zusammen mit dem
Altfriesischen, dem Altniederdeutsche (Altsächsischen, Altniederfränkischen)
und dem Althochdeutschen aus dem Westgermanischen. Von diesem unterscheiden
sich Ost- und Nordgermanisch vor allem durch das Fehlen der Verben tun, gehen, stehen
und die Umbildung von gemeingermanisch uu zu ggw gegenüber uw im
Westgermanische. Innerhalb des Westgermanischen steht das Altenglische dem
Altfriesischen am nächsten und dem Altniederdeutschen näher als dem
Althochdeutschen.
Geographisch umfasst
das Altenglische England mit Ausnahme von Cornwall. Seine wichtigsten
Schreiborte sind Winchester, Canterbury, London, York und Lindisfarne.
Dialektal (diatopisch)
gliedert sich das Altenglische im wesentlichen nach den Siedlungsräumen der
einzelnen nach Britannien gewanderten und seit etwa 600 von Irland - über Iona
und Lindisfarne und York - wie Rom - über Kent - aus christianisierten
germanischen Stämme, wobei die sprachwissenschaftliche Bestimmung dieser
Dialekte sowohl aus der altenglischen als auch aus der mittelenglischen
Überlieferung erfolgt. Danach unterscheidet man Kentisch, Westsächsisch und
Anglisch. Dabei entspricht das nur bruchstückhaft überlieferte Kentische dem
Siedlungsbereich der aus Jütland gekommenen Jüten im Bereich der heutigen,
Canterbury als Hauptort einschließenden Grafschaft Kent und der Insel Wight.
Das Westsächsische gehört zum Siedlungsgebiet der insgesamt in Essex, Sussex
und Wessex siedelnden Sachsen südlich der Themse und westlich von Kent. Sein
Hauptort ist Winchester. Es ist der am reichsten überlieferte Dialekt, der von
der zweiten Hälfte des 10. Jahrhunderts an die Normalform des Altenglischen
bietet (Spätwestsächsisch). Das im Endergebnis namengebende Anglische
schließlich umfasst das nördlich der Themse liegende Siedlungsgebiet der aus
dem Gebiet zwischen Flensburg und Schleswig gekommenen Angeln, das 867 von
Skandinaviern (Dänen) erobert wurde (Denalagu). Es gliedert sich in das Ostanglische,
nordöstlich von London, das recht unvollkommen überlieferte Mercische (zu mearc
Mark, Grenze) zwischen Themse und Humber
und das nur burchstückhaft überlieferte Northumbrische nördlich des Humber.
Politisch lag dabei die Vorherrschaft zunächst in Northumbrien (Edwin, Oswald,
Oswin), dann in Mercien (Penda, Offa) und schließlich in Wessex (Egbert
802-839, Alfred 879-900).
Zeitlich
(diachronisch) lässt sich das Altenglische in das nicht überlieferte
Uraltenglische, das von 700 bis etwa (900 oder) 950 reichende Frühaltenglische,
zu dem vor allem die von Alfred dem Großen angefertigten oder angeregten
westsächsischen Prosaübersetzungen gehören, und das Spätaltenglische (900 bzw.
950-1100), in dem besonders die Werke Aelfrics (um 1000) und Wulfstans verfasst
sind, gliedern.
Sozial (diastratisch)
erlaubt die Überlieferung kaum eine Unterscheidung, da die Umgangssprache so
gut wie nicht erhalten ist.
Das somit vor allem
dialektisch wie zeitlich in sich sehr differenzierte Altenglische bedarf für
wissenschaftliche Zwecke einer normalisierenden Standardisierung. Hierfür hat
Henry Sweet in der Einleitung zu seiner Ausgabe von König Alfreds altenglischer
Übersetzung der lateinischen Cura Pastoralis Gregors des Großen das
Frühwestsächsische Alfreds des Großen (Cura Pastoralis, Orosius,
Parker-Handschrift der Sachsenchronik) zur Grundlage gemacht. Ihm sind die
wichtigsten Grammatike (Cosijn, Sievers, Wright, Girvan) und das Wörterbuch
Holthausens gefolgt, obgleich das Spätwestsächsiche Aelfrics (um 1000) der alfredischen
Sprache überlegen sein dürfte.
Die altenglischen
poetischen Denkmäler mit ihren insgesamt etwa 10000 Langzeilen sind vermutlich
seit etwa 700 und im erheblichem Umfang im anglischen Sprachgebiet entstanden,
aber fast durchwegs nur in vier westsächsischen Abschriften des 10.
Jahrhunderts überliefert.
Die
Beowulf-Handschrift des British Museum in London enthält drei altenglische
Prosatexte, den Beowulf (1. Hälfte 8. Jh.?), und die fragmentarische
Judith-Dichtung. Sie war wohl 1563 im Besitz von Laurence Nowell, Dekan von
Lichfield und danach Sir Robert Cottons (1571-1631), in dessen Bibliothek sie
1731 durch Brand beschädigt wurde. Sie wurde 1815 von G. J. Thorkelin, 1833 von
J. M. Kemble und 1882 in Faksimile von J. Zupitza veröffentlicht.
Die
Caedmon-Handschrift der Bodleian Library in Oxford enthält Genesis (1. Hälfte
8. Jh.), Exodus (1. Hälfte 8. Jh.), Daniel, Christ und Satan. Sie gehörte einst
dem Erzbischof James Usher, der sie Franciscus Junius schenkte, der 1655 den
Erstdruck besorgte und dann die Handschrift der Universität Oxford überließ. Im
Faksimile wurde sie 1927 von I. Gollancz herausgegeben.
Die Exeter-
Handschrift der Kathedrale zu Exeter enthält vor allem Christ, Guthlac, Phönix,
Juliana, Wanderer, Der Menschen Gaben, Des Vaters Lehren, Seefahrer, Der
Menschen Gemüt, Widsith, Der Menschen Geschicke, Reimlied, Panther, Walfisch,
Rebhuhn, Rede der Seele an den Leichnam (I), Deors Klage, Klage der Frau, Das
jüngste Gericht, Botschaft des Gemahls, Ruine und Rätsel. Die Kathedrale von
Exeter erhielt die Handschrift von Leofric, Bischof von Devon und Cornwall († 1072).
Die erste vollständige Ausgabe erfolgte 1842 durch B. Thorpe, eine Ausgabe mit
Übersetzung 1895 durch I. Gollancz, eine Faksimileausgabe 1933 durch R. W.
Chambers, M. Förster und R. Flower.
Die
Vercelli-Handschrift enthält Homilien, Andreas, Schicksale der zwölf Apostel,
Rede der Seele an den Leichnam (II), Der Menschen Falschheit, Traumgesicht vom
Kreuze, Elene, (Leben des Guthlac). Wie sie in die Dombibliothek von Vercelli
gelangte, ist unbekannt. Sie wurde 1836 von M. G. Maier unter B. Thorpes
Leitung erstmals und 1894 von R. Wülker in ihrem poetischen Teil und 1913 von
M. Förster umfassend in Faksimile ediert.
Zu den poetischen
Denkmälern kommen dann noch zahlreiche prosaische Texte. Neben verschiedenen
kleineren, teilweise auch in Runen geschriebenen und seit etwa 700
überlieferten Texten sind hier vor allem die altenglischen Urkunden, die
altenglischen Gesetze, die im 8. Jahrhundert einsetzenden mercischen Glossen,
die Interlinearversion des Psalters und der Evangelien und die Übersetzungen
der Cura Pastoralis Gregors des Großen (540-604), der Historia ecclesiastica
Bedas (672-735), der De consolatione philosophiae des Boethius (480-524), der
Soliloquia Augustins (354-430), der Disticha Catonis, der Metra Boethius' und
der Dialoge Gregors des Großen durch König Alfred zu nennen.
Hinzuweisen ist
daneben auf die reiche Namensüberlieferung sowie auf verschiedene
Runeninschriften. Die Edition der altenglischen Denkmäler ist weit verstreut
erfolgt und noch nicht abgeschlossen. Eine Zusammenfassung der ältesten - voralfredischen - Texte bietet Sweet, eine
Zusammenfassung der poetischen Werke Grein sowie Krapp und Dobbie, einen
Zusammenfassung der Urkunden Kemble, Thorpe und Robertson. Um Vereinigung
wenigstens in einer Reihe bemühen sich auch die Bände der Early English Text
Society.
Das führende
altenglische Wörterbuch stammt von Bosworth/Toller, ist aber trotz späterer
Ergänzungen (Supplement, Additions, Corrections) nicht vollständig. Das
insofern bessere Wörterbuch Halls ist allerdings trotz einer späteren Ergänzung
ebenfalls nicht erschöpfend, vernachlässigt lateinische Lemmata und verzeichnet
die Quellen nur global. Sein Wortschatz lässt sich auf mehr als 40000 Wörter
schätzen. Holthausens etymologisches Wörterbuch bietet deutsche
Bedeutungsangaben, ist jedoch auf den Grundwortschatz beschränkt. Greins
Wörterbuch erfasst nur die poetischen Denkmäler.
In den 25068 erfassten
Ansätzen und Verweisen des Grundwortschatzes sind 177465 Zeichen enthalten.
Daraus errechnet sich eine durchschnittliche Ansatzlänge von 7,0793 Zeichen.
Zur Darstellung des Altenglischen
ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen
verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des
Altenglischen angepasst werden muss.
Ausgangspunkt sind
also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k,
l, m, n, o, p, q [1x], r, s, t, u, v, x, y, z). Hinzu kommen als altenglische Zusatzzeichen
bzw. Sonderzeichen þ und w.
Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer
Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache
besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine
besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines
von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms
selbst ermittelt.
Dieses gelangt unter
der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung
aller 26 Buchstaben (z. B. a, b, c, d usw.) und 67 Buchstabenvarianten (z. B.
a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
12736 |
65 |
41 |
A |
10 |
225 |
0 |
á |
2 |
257,774 |
101,0306 |
ā̆ |
1 |
257 |
101 |
ā |
1949 |
230 |
0 |
æ |
1561 |
198 |
00C6 |
Æ |
1 |
483,774 |
01E3,0306 |
ǣ̆ |
33 |
483 |
1000 |
ǣ |
2029 |
98 |
62 |
b |
2981 |
66 |
42 |
B |
12 |
99 |
63 |
c |
6900 |
67 |
43 |
C |
8 |
100 |
64 |
d |
6697 |
68 |
44 |
D |
2 |
101 |
65 |
e |
17277 |
69 |
45 |
E |
18 |
233 |
0 |
é |
2122 |
201 |
00C9 |
É |
2 |
279 |
117 |
ė |
3402 |
275,774 |
113,0306 |
ē̆ |
45 |
275 |
113 |
ē |
637 |
102 |
66 |
f |
5278 |
70 |
46 |
F |
12 |
103 |
67 |
g |
8872 |
71 |
47 |
G |
8 |
104 |
68 |
h |
4323 |
72 |
48 |
H |
3 |
105 |
69 |
i |
8405 |
73 |
49 |
I |
12 |
237 |
00ED |
í |
885 |
299,774 |
012B,0306 |
ī̆ |
34 |
299 |
012B |
ī |
1768 |
298 |
012A |
Ī |
3 |
107 |
006B |
k |
2 |
108 |
006C |
l |
9860 |
76 |
004C |
L |
6 |
109 |
006D |
m |
3881 |
77 |
004D |
M |
4 |
110 |
006E |
n |
17998 |
78 |
004E |
N |
4 |
111 |
006F |
o |
6749 |
333,774 |
014D,0306 |
ō̆ |
209 |
333 |
014D |
ō |
1033 |
339 |
153 |
œ |
30 |
339,772 |
153,0304 |
œ̄ |
551 |
112 |
70 |
p |
2184 |
80 |
50 |
P |
4 |
113 |
71 |
q |
1 |
114 |
72 |
r |
11852 |
82 |
52 |
R |
6 |
115 |
73 |
s |
10456 |
83 |
53 |
S |
26 |
116 |
74 |
t |
7552 |
84 |
54 |
T |
3 |
254 |
00FE |
þ |
3194 |
222 |
00DE |
Þ |
6 |
117 |
75 |
u |
3673 |
363,774 |
016B,0306 |
ū̆ |
11 |
363 |
016B |
ū |
629 |
118 |
76 |
v |
3 |
119 |
77 |
w |
5460 |
87 |
57 |
W |
6 |
120 |
78 |
x |
213 |
121 |
79 |
y |
2383 |
563 |
233 |
ȳ |
560 |
122 |
007A |
z |
4 |
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A á ā̆ ā æ Æ ǣ̆ ǣ |
18322 |
10,40% |
B |
b B |
2993 |
1,70% |
C |
c C |
6908 |
3,90% |
D |
d D |
6699 |
3,80% |
E |
e E é É ė ē̆ ē |
23503 |
13,30% |
F |
f F |
5290 |
3,00% |
G |
g G |
8880 |
5,00% |
H |
h H |
4326 |
2,40% |
I |
i I í ī̆ ī Ī |
11107 |
6,30% |
K |
k |
2 |
0,00% |
L |
l L |
9866 |
5,60% |
M |
m M |
3885 |
2,20% |
N |
n N |
18002 |
10,20% |
O |
o ō̆ ō œ œ̄ |
8572 |
4,90% |
P |
p P |
2188 |
1,20% |
Q |
q |
1 |
0,00% |
R |
r R |
11858 |
6,70% |
S |
s S |
10482 |
5,90% |
T |
t T |
7555 |
4,30% |
Þ |
þ Þ |
3200 |
1,80% |
U |
u ū̆ ū |
4313 |
2,40% |
V |
v |
3 |
0,00% |
W |
w W |
5466 |
3,10% |
X |
x |
213 |
0,10% |
Y |
y ȳ |
2943 |
1,70% |
Z |
z |
4 |
0,00% |
Summe |
176581 |
100,00% |
Ordnet man die Buchstaben nach ihren Häufigkeiten, so
entsteht folgende Reihung:
E |
e E é É ė ē̆ ē |
23503 |
13,30% |
A |
a A á ā̆ ā æ Æ ǣ̆ ǣ |
18322 |
10,40% |
N |
n N |
18002 |
10,20% |
R |
r R |
11858 |
6,70% |
I |
i I í ī̆ ī Ī |
11107 |
6,30% |
S |
s S |
10482 |
5,90% |
L |
l L |
9866 |
5,60% |
G |
g G |
8880 |
5,00% |
O |
o ō̆ ō œ œ̄ |
8572 |
4,90% |
T |
t T |
7555 |
4,30% |
C |
c C |
6908 |
3,90% |
D |
d D |
6699 |
3,80% |
W |
w W |
5466 |
3,10% |
F |
f F |
5290 |
3,00% |
H |
h H |
4326 |
2,40% |
U |
u ū̆ ū |
4313 |
2,40% |
M |
m M |
3885 |
2,20% |
Þ |
þ Þ |
3200 |
1,80% |
B |
b B |
2993 |
1,70% |
Y |
y ȳ |
2943 |
1,70% |
P |
p P |
2188 |
1,20% |
X |
x |
213 |
0,10% |
Z |
z |
4 |
0,00% |
V |
v |
3 |
0,00% |
K |
k |
2 |
0,00% |
Q |
q |
1 |
0,00% |