Köbler, Gerhard
Die Häufigkeit der zur Darstellung des Altenglischen verwendeten Buchstaben
Das Altenglische ist die zeitlich zwischen dem
Germanischen und dem Mittelenglischen liegende Sprachstufe des Englischen. Ihr
Beginn setzt vielleicht schon mit der auf den Rückzug der Römer (407) folgenden
Landnahme germanischer Stämme auf der britischen, wohl seit der Mitte des
ersten vorchristlichen Jahrtausends von Kelten besiedelten und seit 43 n. Chr.
von den Römern eroberten Insel im Jahre 449 (vielleicht schon 428) ein, mit der
eine räumliche Absonderung von den übrigen germanischen Stämmen einhergeht,
welche faktisch die Wahrscheinlichkeit gesonderter Sprachentwicklung
begünstigt. Aus dieser frühen Zeit sind aber keine altenglischen Texte
überliefert, so dass sich der Anfang der Überlieferung um etwa 700 als
Anfangszeitpunkt des Altenglischen anbietet. Im 11. Jahrhundert treten dann so
viele, vor allem durch die den skandinavischen Einfällen seit 787 folgende
normannische Eroberung Englands im Jahre 1066 (14. 10. 1066 Schlacht bei
Senlac/Hastings) bewirkte Veränderungen (vor allem Abschwächung der vollen
kurzen Endsilbenvokale zu e) ein, dass mit dem Ende dieses Jahrhunderts auch
die altenglische Sprachstufe endet und das Mittelenglische beginnt. Gegen Ende
des 12. Jahrhunderts werden Handschriften mit altenglischen Texten bereits
allgemein nicht mehr verstanden.
Das Altenglische stammt aus dem nur durch
Rekonstruktion erkennbaren Germanischen und ist somit eine germanistische
Sprache. Über das Germanische gehört es zugleich zum Indogermanischen oder
Indoeuropäischen, und zwar zur Gruppe der sogenannten Kentum-Sprachen (lat.
centum = hundert), zu welchen außer dem Germanischen das Griechische, das
Italische, das Keltische, das Hethitische und das Tocharische zählen und welche
im Gegensatz zu den sogenannten Satem-Sprachen stehen.
Innerhalb des Germanischen unterscheidet man
zwischen Ostgermanisch, Nordgermanisch und Westgermanisch. Das Altenglische
entwickelt sich zusammen mit dem Altfriesischen, dem Altniederdeutsche
(Altsächsischen, Altniederfränkischen) und dem Althochdeutschen aus dem Westgermanischen.
Von diesem unterscheiden sich Ost- und Nordgermanisch vor allem durch das
Fehlen der Verben tun, gehen, stehen und die Umbildung von gemeingermanisch uu
zu ggw gegenüber uw im Westgermanische. Innerhalb des Westgermanischen steht
das Altenglische dem Altfriesischen am nächsten und dem Altniederdeutschen
näher als dem Althochdeutschen.
Geographisch umfasst das Altenglische England
mit Ausnahme von Cornwall. Seine wichtigsten Schreiborte sind Winchester,
Canterbury, London, York und Lindisfarne.
Dialektal (diatopisch) gliedert sich das
Altenglische im wesentlichen nach den Siedlungsräumen der einzelnen nach
Britannien gewanderten und seit etwa 600 von Irland - über Iona und Lindisfarne
und York - wie Rom - über Kent - aus christianisierten germanischen Stämme,
wobei die sprachwissenschaftliche Bestimmung dieser Dialekte sowohl aus der
altenglischen als auch aus der mittelenglischen Überlieferung erfolgt. Danach
unterscheidet man Kentisch, Westsächsisch und Anglisch. Dabei entspricht das
nur bruchstückhaft überlieferte Kentische dem Siedlungsbereich der aus Jütland
gekommenen Jüten im Bereich der heutigen, Canterbury als Hauptort
einschließenden Grafschaft Kent und der Insel Wight. Das Westsächsische gehört
zum Siedlungsgebiet der insgesamt in Essex, Sussex und Wessex siedelnden
Sachsen südlich der Themse und westlich von Kent. Sein Hauptort ist Winchester.
Es ist der am reichsten überlieferte Dialekt, der von der zweiten Hälfte des
10. Jahrhunderts an die Normalform des Altenglischen bietet (Spätwestsächsisch).
Das im Endergebnis namengebende Anglische schließlich umfasst das nördlich der
Themse liegende Siedlungsgebiet der aus dem Gebiet zwischen Flensburg und
Schleswig gekommenen Angeln, das 867 von Skandinaviern (Dänen) erobert wurde
(Denalagu). Es gliedert sich in das Ostanglische, nordöstlich von London, das
recht unvollkommen überlieferte Mercische (zu mearc Mark, Grenze) zwischen Themse und Humber und
das nur burchstückhaft überlieferte Northumbrische nördlich des Humber.
Politisch lag dabei die Vorherrschaft zunächst in Northumbrien (Edwin, Oswald,
Oswin), dann in Mercien (Penda, Offa) und schließlich in Wessex (Egbert
802-839, Alfred 879-900).
Zeitlich (diachronisch) lässt sich das
Altenglische in das nicht überlieferte Uraltenglische, das von 700 bis etwa
(900 oder) 950 reichende Frühaltenglische, zu dem vor allem die von Alfred dem
Großen angefertigten oder angeregten westsächsischen Prosaübersetzungen
gehören, und das Spätaltenglische (900 bzw. 950-1100), in dem besonders die
Werke Aelfrics (um 1000) und Wulfstans verfasst sind, gliedern.
Sozial (diastratisch) erlaubt die Überlieferung
kaum eine Unterscheidung, da die Umgangssprache so gut wie nicht erhalten ist.
Das somit vor allem dialektisch wie zeitlich in
sich sehr differenzierte Altenglische bedarf für wissenschaftliche Zwecke einer
normalisierenden Standardisierung. Hierfür hat Henry Sweet in der Einleitung zu
seiner Ausgabe von König Alfreds altenglischer Übersetzung der lateinischen
Cura Pastoralis Gregors des Großen das Frühwestsächsische Alfreds des Großen
(Cura Pastoralis, Orosius, Parker-Handschrift der Sachsenchronik) zur Grundlage
gemacht. Ihm sind die wichtigsten Grammatike (Cosijn, Sievers, Wright, Girvan)
und das Wörterbuch Holthausens gefolgt, obgleich das Spätwestsächsiche Aelfrics
(um 1000) der alfredischen Sprache überlegen sein dürfte.
Die altenglischen poetischen Denkmäler mit ihren
insgesamt etwa 10000 Langzeilen sind vermutlich seit etwa 700 und im
erheblichem Umfang im anglischen Sprachgebiet entstanden, aber fast durchwegs
nur in vier westsächsischen Abschriften des 10. Jahrhunderts überliefert.
Die Beowulf-Handschrift des British Museum in
London enthält drei altenglische Prosatexte, den Beowulf (1. Hälfte 8. Jh.?),
und die fragmentarische Judith-Dichtung. Sie war wohl 1563 im Besitz von
Laurence Nowell, Dekan von Lichfield und danach Sir Robert Cottons (1571-1631),
in dessen Bibliothek sie 1731 durch Brand beschädigt wurde. Sie wurde 1815 von
G. J. Thorkelin, 1833 von J. M. Kemble und 1882 in Faksimile von J. Zupitza
veröffentlicht.
Die Caedmon-Handschrift der Bodleian Library in
Oxford enthält Genesis (1. Hälfte 8. Jh.), Exodus (1. Hälfte 8. Jh.), Daniel,
Christ und Satan. Sie gehörte einst dem Erzbischof James Usher, der sie
Franciscus Junius schenkte, der 1655 den Erstdruck besorgte und dann die
Handschrift der Universität Oxford überließ. Im Faksimile wurde sie 1927 von I.
Gollancz herausgegeben.
Die Exeter- Handschrift der Kathedrale zu Exeter
enthält vor allem Christ, Guthlac, Phönix, Juliana, Wanderer, Der Menschen
Gaben, Des Vaters Lehren, Seefahrer, Der Menschen Gemüt, Widsith, Der Menschen
Geschicke, Reimlied, Panther, Walfisch, Rebhuhn, Rede der Seele an den Leichnam
(I), Deors Klage, Klage der Frau, Das jüngste Gericht, Botschaft des Gemahls,
Ruine und Rätsel. Die Kathedrale von Exeter erhielt die Handschrift von
Leofric, Bischof von Devon und Cornwall († 1072). Die erste vollständige
Ausgabe erfolgte 1842 durch B. Thorpe, eine Ausgabe mit Übersetzung 1895 durch
I. Gollancz, eine Faksimileausgabe 1933 durch R. W. Chambers, M. Förster und R.
Flower.
Die Vercelli-Handschrift enthält Homilien,
Andreas, Schicksale der zwölf Apostel, Rede der Seele an den Leichnam (II), Der
Menschen Falschheit, Traumgesicht vom Kreuze, Elene, (Leben des Guthlac). Wie
sie in die Dombibliothek von Vercelli gelangte, ist unbekannt. Sie wurde 1836
von M. G. Maier unter B. Thorpes Leitung erstmals und 1894 von R. Wülker in
ihrem poetischen Teil und 1913 von M. Förster umfassend in Faksimile ediert.
Zu den poetischen Denkmälern kommen dann noch
zahlreiche prosaische Texte. Neben verschiedenen kleineren, teilweise auch in
Runen geschriebenen und seit etwa 700 überlieferten Texten sind hier vor allem
die altenglischen Urkunden, die altenglischen Gesetze, die im 8. Jahrhundert
einsetzenden mercischen Glossen, die Interlinearversion des Psalters und der
Evangelien und die Übersetzungen der Cura Pastoralis Gregors des Großen
(540-604), der Historia ecclesiastica Bedas (672-735), der De consolatione
philosophiae des Boethius (480-524), der Soliloquia Augustins (354-430), der
Disticha Catonis, der Metra Boethius' und der Dialoge Gregors des Großen durch
König Alfred zu nennen.
Hinzuweisen ist daneben auf die reiche
Namensüberlieferung sowie auf verschiedene Runeninschriften. Die Edition der
altenglischen Denkmäler ist weit verstreut erfolgt und noch nicht
abgeschlossen. Eine Zusammenfassung der ältesten - voralfredischen - Texte bietet Sweet, eine
Zusammenfassung der poetischen Werke Grein sowie Krapp und Dobbie, einen
Zusammenfassung der Urkunden Kemble, Thorpe und Robertson. Um Vereinigung
wenigstens in einer Reihe bemühen sich auch die Bände der Early English Text
Society.
Das führende altenglische Wörterbuch stammt von
Bosworth/Toller, ist aber trotz späterer Ergänzungen (Supplement, Additions,
Corrections) nicht vollständig. Das insofern bessere Wörterbuch Halls ist
allerdings trotz einer späteren Ergänzung ebenfalls nicht erschöpfend,
vernachlässigt lateinische Lemmata und verzeichnet die Quellen nur global. Sein
Wortschatz lässt sich auf mehr als 40000 Wörter schätzen. Holthausens
etymologisches Wörterbuch bietet deutsche Bedeutungsangaben, ist jedoch auf den
Grundwortschatz beschränkt. Greins Wörterbuch erfasst nur die poetischen
Denkmäler.
In den 25068 erfassten Ansätzen und Verweisen
des Grundwortschatzes sind 177465 Zeichen enthalten. Daraus errechnet sich eine
durchschnittliche Ansatzlänge von 7,0793 Zeichen.
Zur Darstellung des Altenglischen ist
grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen
verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des
Altenglischen angepasst werden muss.
Ausgangspunkt sind also die 24 Zeichen des
lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q [1x], r,
s, t, u, v, x, y, z). Hinzu kommen als altenglische Zusatzzeichen bzw.
Sonderzeichen þ und w.
Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.
Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.
Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 67 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:
Asc |
Hex |
Zeichen |
Häufigkeit |
97 |
61 |
a |
12736 |
65 |
41 |
A |
10 |
225 |
0 |
á |
2 |
257,774 |
101,0306 |
ā̆ |
1 |
257 |
101 |
ā |
1949 |
230 |
0 |
æ |
1561 |
198 |
00C6 |
Æ |
1 |
483,774 |
01E3,0306 |
ǣ̆ |
33 |
483 |
1000 |
ǣ |
2029 |
98 |
62 |
b |
2981 |
66 |
42 |
B |
12 |
99 |
63 |
c |
6900 |
67 |
43 |
C |
8 |
100 |
64 |
d |
6697 |
68 |
44 |
D |
2 |
101 |
65 |
e |
17277 |
69 |
45 |
E |
18 |
233 |
0 |
é |
2122 |
201 |
00C9 |
É |
2 |
279 |
117 |
ė |
3402 |
275,774 |
113,0306 |
ē̆ |
45 |
275 |
113 |
ē |
637 |
102 |
66 |
f |
5278 |
70 |
46 |
F |
12 |
103 |
67 |
g |
8872 |
71 |
47 |
G |
8 |
104 |
68 |
h |
4323 |
72 |
48 |
H |
3 |
105 |
69 |
i |
8405 |
73 |
49 |
I |
12 |
237 |
00ED |
í |
885 |
299,774 |
012B,0306 |
ī̆ |
34 |
299 |
012B |
ī |
1768 |
298 |
012A |
Ī |
3 |
107 |
006B |
k |
2 |
108 |
006C |
l |
9860 |
76 |
004C |
L |
6 |
109 |
006D |
m |
3881 |
77 |
004D |
M |
4 |
110 |
006E |
n |
17998 |
78 |
004E |
N |
4 |
111 |
006F |
o |
6749 |
333,774 |
014D,0306 |
ō̆ |
209 |
333 |
014D |
ō |
1033 |
339 |
153 |
œ |
30 |
339,772 |
153,0304 |
œ̄ |
551 |
112 |
70 |
p |
2184 |
80 |
50 |
P |
4 |
113 |
71 |
q |
1 |
114 |
72 |
r |
11852 |
82 |
52 |
R |
6 |
115 |
73 |
s |
10456 |
83 |
53 |
S |
26 |
116 |
74 |
t |
7552 |
84 |
54 |
T |
3 |
254 |
00FE |
þ |
3194 |
222 |
00DE |
Þ |
6 |
117 |
75 |
u |
3673 |
363,774 |
016B,0306 |
ū̆ |
11 |
363 |
016B |
ū |
629 |
118 |
76 |
v |
3 |
119 |
77 |
w |
5460 |
87 |
57 |
W |
6 |
120 |
78 |
x |
213 |
121 |
79 |
y |
2383 |
563 |
233 |
ȳ |
560 |
122 |
007A |
z |
4 |
|
|
|
|
Hieraus lassen sich folgende Häufigkeiten ermitteln: |
|||
Zeichen |
Varianten |
Häufigkeit |
Prozent |
A |
a A á ā̆ ā æ Æ ǣ̆ ǣ |
18322 |
10,40% |
B |
b B |
2993 |
1,70% |
C |
c C |
6908 |
3,90% |
D |
d D |
6699 |
3,80% |
E |
e E é É ė ē̆ ē |
23503 |
13,30% |
F |
f F |
5290 |
3,00% |
G |
g G |
8880 |
5,00% |
H |
h H |
4326 |
2,40% |
I |
i I í ī̆ ī Ī |
11107 |
6,30% |
K |
k |
2 |
0,00% |
L |
l L |
9866 |
5,60% |
M |
m M |
3885 |
2,20% |
N |
n N |
18002 |
10,20% |
O |
o ō̆ ō œ œ̄ |
8572 |
4,90% |
P |
p P |
2188 |
1,20% |
Q |
q |
1 |
0,00% |
R |
r R |
11858 |
6,70% |
S |
s S |
10482 |
5,90% |
T |
t T |
7555 |
4,30% |
Þ |
þ Þ |
3200 |
1,80% |
U |
u ū̆ ū |
4313 |
2,40% |
V |
v |
3 |
0,00% |
W |
w W |
5466 |
3,10% |
X |
x |
213 |
0,10% |
Y |
y ȳ |
2943 |
1,70% |
Z |
z |
4 |
0,00% |
Summe |
176581 |
100,00% |
Ordnet
man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:
E |
e E é É ė ē̆ ē |
23503 |
13,30% |
A |
a A á ā̆ ā æ Æ ǣ̆ ǣ |
18322 |
10,40% |
N |
n N |
18002 |
10,20% |
R |
r R |
11858 |
6,70% |
I |
i I í ī̆ ī Ī |
11107 |
6,30% |
S |
s S |
10482 |
5,90% |
L |
l L |
9866 |
5,60% |
G |
g G |
8880 |
5,00% |
O |
o ō̆ ō œ œ̄ |
8572 |
4,90% |
T |
t T |
7555 |
4,30% |
C |
c C |
6908 |
3,90% |
D |
d D |
6699 |
3,80% |
W |
w W |
5466 |
3,10% |
F |
f F |
5290 |
3,00% |
H |
h H |
4326 |
2,40% |
U |
u ū̆ ū |
4313 |
2,40% |
M |
m M |
3885 |
2,20% |
Þ |
þ Þ |
3200 |
1,80% |
B |
b B |
2993 |
1,70% |
Y |
y ȳ |
2943 |
1,70% |
P |
p P |
2188 |
1,20% |
X |
x |
213 |
0,10% |
Z |
z |
4 |
0,00% |
V |
v |
3 |
0,00% |
K |
k |
2 |
0,00% |
Q |
q |
1 |
0,00% |