an_zeichentab

Köbler, Gerhard

Die Häufigkeit der zur Darstellung des Altfriesischen verwendeten Buchstaben

Das Altfriesische ist neben dem Gotischen, Altnordischen, Altenglischen, Altniederdeutschen (Altsächsischen, Altniederfränkischen) und Althochdeutschen eine germanisch/germanistische Einzelsprache. Sie tritt nach Einzelwörtern vor allem des 9. Jahrhunderts im (11. bzw.) 13. Jahrhundert in schriftlicher Überlieferung hervor. Dabei betrifft die Aufzeichnung vor allem Rechtstexte. Seine Grenze zum Neufriesischen - bzw. dem von einigen Forschern darüber hinaus angenommenen (zeitlich gesehenen und für die Zeit zwischen 1550 und 1800 angesetzten) Mittelfriesischen - wird bei etwa 1550 gezogen (unübersehbare Überlieferungslücke).

Der dadurch überkommene Wortschatz des Altfriesischen ist schon mehrfach lexikalisch erfasst worden. Karl Freiherr von Richthofens Wörterbuch aus der Mitte des 19. Jahrhunderts verzeichnet dabei zwar auch die Belege der von ihm veröffentlichten Texte, ist aber sowohl quellenmäßig wie auch sprachwissenschaftlich nur auf dem Stande seiner Zeit und behandelt außerdem nicht jedes selbständige Wort als selbständigen Ansatz. Ferdinand Holthausens Wörterbuch des frühen 20. Jahrhundets verbessert diesen Stand durch die Aufnahme zahlreicher weiterer Wörter (ca. 1800) und durch philologische Korrekturen. Sein nach Wortstämmen geordnetes, durch zwei Nachträge ergänztes und gleichwohl möglicherweise nicht mehr als 60-75 Prozent des überlieferten Wortschatzes erfassendes Werk ist aber sehr unübersichtlich und in Einzelheiten überholt.

Aus diesem Grunde ist auf der Grundlage beider - durchaus nicht vollkommener und vollständiger Wörterbücher und - in Parallele zu einem indogermanisch-neuhochdeutschen Wörterbuch, einem germanisch-neuhochdeutschen Wörterbuch, einem gotisch-neuhochdeutschen Wörterbuch, einem altnordisch-neuhochdeutschen Wörterbuch, einem altenglisch-neuhochdeutschen Wörterbuch, einem altniederdeutschen-neuhochdeutschen Wörterbuch und einem althochdeutsch-neuhochdeutschen Wörterbuch auch ein altfriesisch-neuhochdeutsches Wörterbuch mit rund 7500 Stichwörtern und Verweisen in streng alphabetischer Reihenfolge erarbeitet worden. Dabei beginnt der einzelne Artikel mit dem Lemma in einer normalisierten Hauptform und eventuellen Nebenformen, die grundsätzlich auch als Verweise (verweisende Ansätze) auf die Hauptform aufgenommen sind. Es folgen die Angaben der (ungefähren) Anzahl (z. B. 1 für hapax legomena) der Belegstellen (und aus übergeordneten Erwägungen die Angabe der [altfriesischen] Sprache). Dem ist (grundsätzlich) eine grammatikalische Bestimmung des Wortes angefügt. Bei der anschließenden Ermittlung der Bedeutung im Neuhochdeutschen ist ein Mittelweg zwischen ganz besonderer Bedeutung im einzelnen, vermutlich öfter auch vom Zufall bestimmten Kontext und allgemeinerer, durch die überlieferten Kontexte nicht immer gesicherter etymologisch ausgerichteter Bedeutung eingeschlagen worden. Im Anschluss hieran wird eine englische Bedeutung angeführt. Darüber hinaus sind, soweit vorhanden, lateinische Übersetzungsgleichungen angefügt. Weiter werden Verweise von Grundwörtern auf Komposita und Hinweise auf nahestehende Wörter gegeben. Unter den Hinweisen finden sich auch verwandte Wörter anderer germanischer/germanistischer Sprachen (Gotisch, Altnordisch, Altenglisch, Altniederfränkisch, Altsächsisch, Althochdeutsch, Mittelniederdeutsch, Mittelniederländisch, Mittelhochdeutsch und Plattdeutsch/Neuniederdeutsch). Anschließend werden (die) Quellen des Lemmas durch summarische Siglen angegeben, wobei gelegentlich eine Jahreszahl für den ältesten Beleg angeführt wird. Im Anschluss hieran werden unter Interferenz fremdsprachliche Wörter genannt, die formal oder inhaltlich das nationalsprachliche Wort beeinflusst haben (könnten). Dem folgt (erstmals grundsätzlich) die Etymologie des Lemmas. Danach wird unter Literatur die lexikalische Fundstelle für das Stichwort offengelegt oder ein sonstiger weiterführender Hinweis geboten. Vereinzelt folgen dem geläufige Redewendungen oder Erklärungen von Besonderheiten eines Lemmas.

Erschlossenes Material ist durch * kenntlich gemacht, wobei für erschlossene Lemmata der Asterisk am Beginn steht, für nicht belegte, erschlossene Formen des Stichworts dagegen am Ende. Klammern und Fragezeichen deuten Unsicherheiten und Vorbehalte an. Als Bausteine etymologisch erkennbare Teile von Wörtern sind durch Bindestriche abgesondert.

Die Ordnung der Lemmata ist streng alphabetisch. Lange und kurze Vokale werden dabei grundsätzlich nicht geschieden, doch folgt bei Gleichheit im übrigen das Wort mit langem Vokal dem Wort mit kurzem Vokal nach. Th steht hinter t, j hinter i.

Wie für das Indogermanische, Germanische, Gotische, Altnordische, Altenglische, Altniederdeutsche und Althochdeutsche so ist auch für das Altfriesische (erstmals) ein neuhochdeutsch-altfriesisches Wörterbuch verfasst worden, welches das Altfriesische von der neuhochdeutschen Sprache her aufschließen soll, indem es eine Antwort etwa auf die Frage ermöglicht, wie das Altfriesische den Sachverhalt bezeichnet, den das Neuhochdeutsche etwa als „Abend“, „Kopf“, „Monat“, „Schulter“ oder „Wasser“ benennt. Dass auch hier noch manche Frage bleibt und Verbesserungen möglich sind, versteht sich von selbst. Möge wie hier auch insgesamt die germanistische Sprachforschung weiterführend eintreten und die Grundlage für das Altfriesische überhaupt und damit für ein altfriesisch-neuhochdeutsches wie ein neuhochdeutsch-altfriesisches Wörterbuch verbessern - wie dies etwa durch die nahezu vollständige Verzettelung des altfriesischen Wörterschatzes im Friesischen Institut in Groningen (Fries Institut, Westersingel 28-30, Groningen) vorbereitet bzw. geschehen ist.

In den 12496 erfassten Ansätzen und Verweisen des Grundwortschatzes sind 88758 Zeichen enthalten. Daraus errechnet sich eine durchschnittliche Ansatzlänge von 7,1029 Zeichen. Zur Darstellung des Altfriesischen ist grundsätzlich das Buchstabensystem (Alphabet) des klassischen Lateinischen verwendet, das aber in bestimmten Hinsichten auf Besonderheiten des Altfriesischen angepasst werden muss.

Ausgangspunkt sind also die 24 Zeichen des lateinischen Alphabets (a, b, c, d, e. f, g, h, i, k, l, m, n, o, p, q[1x], r, s, t, u, v, x, y, z). Hinzu kommen als altfriesische Sonderzeichen j und w. Hieraus ergibt sich eine Gesamtzeichenzahl von 26 Zeichen.

Die Häufigkeit ihrer Verwendung hat mich schon von Beginn meiner Beschäftigung mit dieser Sprache besonders interessiert. Ich habe aber in der Literatur hierzu bislang keine besonderen genauen Angaben vorgefunden. Deswegen habe ich sie mit Hilfe eines von Josef Schönegger freundlicherweise für mich entwickelten Sortierprogramms selbst ermittelt.

Dieses gelangt unter der in der elektronischen Datenverarbeitung selbverständlichen Vereinzelung aller 26 Buchstaben (z. B. a, b, c, d usw.) und 54 Buchstabenvarianten (z. B. a, á, à usw.) zu folgenden Erkenntnissen:

Asc	Hex	Zeichen	Häufigkeit
97	61	a	6578
65	41	A	3
257,774	101,0306	ā̆	5
257	101	ā	534
226	0	â	725
98	62	b	1896
66	42	B	4
99	63	c	1142
100	64	d	4595
101	65	e	10396
69	45	E	2
275,774	113,0306	ē̆	32
275	113	ē	1141
234	00EA	ê	1202
102	66	f	2307
70	46	F	5
103	67	g	2397
104	68	h	4135
105	69	i	6628
73	49	I	2
299,774	012B,0306	ī̆	5
299	012B	ī	953
238	00EE	î	30
106	006A	j	341
74	004A	J	1
107	006B	k	3292
75	004B	K	2
108	006C	l	4405
76	004C	L	2
109	006D	m	2081
77	004D	M	4
110	006E	n	6971
78	004E	N	2
111	006F	o	2613
333,774	014D,0306	ō̆	17
333	014D	ō	763
244	00F4	ô	17
112	70	p	1326
80	50	P	4
113	71	q	33
114	72	r	6421
82	52	R	5
115	73	s	4604
83	53	S	3
116	74	t	5393
117	75	u	1868
85	55	U	2
363	016B	ū	660
118	76	v	677
119	77	w	2099
87	57	W	4
120	78	x	80
121	79	y	2
122	007A	z	290

Hieraus lassen sich folgende Häufigkeiten ermitteln:
Zeichen	Varianten	Häufigkeit	Prozent
A	a A ā̆ ā â	7845	8,80%
B	b B	1900	2,10%
C	c	1142	1,30%
D	d	4595	5,20%
E	e E ē̆ ē ê	12773	14,40%
F	f F	2312	2,60%
G	g	2397	2,70%
H	h	4135	4,70%
I	i I ī̆ ī î	7618	8,60%
J	j J	342	0,40%
K	k K	3294	3,70%
L	l L	4407	5,00%
M	m M	2085	2,40%
N	n N	6973	7,90%
O	o ō̆ ō ô	3410	3,80%
P	p P	1330	1,50%
Q	q	33	0,00%
R	r R	6426	7,20%
S	s S	4607	5,20%
T	t	5393	6,10%
U	u U ū	2530	2,90%
V	v	677	0,80%
W	w W	2103	2,40%
X	x	80	0,10%
Y	y	2	0,00%
Z	z	290	0,30%
Summe		88699	100%

Ordnet man die Buchstaben nach ihren Häufigkeiten, so entsteht folgende Reihung:

E	e E ē̆ ē ê	12773	14,40%
A	a A ā̆ ā â	7845	8,80%
I	i I ī̆ ī î	7618	8,60%
N	n N	6973	7,90%
R	r R	6426	7,20%
T	t	5393	6,10%
S	s S	4607	5,20%
D	d	4595	5,20%
L	l L	4407	5,00%
H	h	4135	4,70%
O	o ō̆ ō ô	3410	3,80%
K	k K	3294	3,70%
U	u U ū	2530	2,90%
G	g	2397	2,70%
F	f F	2312	2,60%
W	w W	2103	2,40%
M	m M	2085	2,40%
B	b B	1900	2,10%
P	p P	1330	1,50%
C	c	1142	1,30%
V	v	677	0,80%
J	j J	342	0,40%
Z	z	290	0,30%
X	x	80	0,10%
Q	q	33	0,00%
Y	y	2	0,00%