2.1 Zu den Wortklassen
Lemmatiserung bedeutet die Rückführung der vorkommenden Wortformen auf ihre Stammform, die als Lemma z.B. im Wörterbuch erscheint. Diese Lemmata unterscheiden sich in systematischer und pragmatischer Hinsicht und werden üblicherweise in Wortarten (Wortklassen) unterschieden. Auf die Problematik solcher Klassifizierungen und ihre Diskussion kann an dieser Stelle nicht eingegangen werden und zwar nicht nur, weil eine solche Erörterung die Neigung zeigt, ins akademische Uferlose zu gehen, sondern auch, weil sie für die Praxis bei di-lemmata kaum Relevanz hat.
→ Primat der Praxis
Die folgende Einteilung der Wortklassen steht ganz unter dem Primat der Anwendung, das heißt, der Nachdruck liegt auf pragmatischer Hinsicht; nicht eine erschöpfende linguistische Beschreibung ist angestrebt, sondern eine Wortklassifizierung, die sich an mögliche Fragestellungen anlehnt. Ohne daß an dieser Stelle Fragen wie die nach Sinn und Bedeutung, Signifikant und Signifikat, Systematik und Pragmatik etc. auch nur annähernd diskutiert werden können (sie stünden auch nicht mehr in einem relevanten Zusammenhang zu di-lemmata), läßt sich doch, allgemein und mit wohl unbestreitbarer Berechtigung, sagen, daß der semantische Gehalt eines Textes hauptsächlich, wenn auch nicht ausschließlich, von den Hauptwortarten Substantiv, Adjektiv und Verb getragen wird. Untersuchungen zum Wortschatz oder Wortgebrauch eines Dichters werden sich daher überwiegend auf diese sog. Hauptwortarten stützen.
Sie unterscheiden sich von den anderen als Restklasse zusammengefaßten Wortarten neben ihrer wichtigen "semantischen" Funktion auch noch dadurch, daß es prinzipiell offene Klassen sind. Das bedeutet: es treten jederzeit neue Lexeme auf; andere veralten und gehen verloren. Wortarten wie Artikel, Pronomen, Konjunktionen (also Mitglieder der Restklasse) dagegen sind so gut wie geschlossene Klassen, das heißt, es werden kaum neue Lexeme gebildet; der Bestand ist konstant.
→ Hauptwortarten vs. Restklasse
Zwischen beiden, Hauptwortarten und Restklasse, gibt es noch einen gerade bei der Bearbeitung von großen Textmengen nicht unwesentlichen quantitativen Unterschied. Die Wortarten der Restklasse haben, wie gesagt, in der Regel einen konstanten und überschaubaren Bestand an Lexemen, während die Hauptwortarten genau zum Gegenteil tendieren, also unbegrenzt und, mehr oder weniger, inkonstant sind. Bei der Häufigkeit der Lexeme im Text, also ihrem realen Vorkommen, verhält es sich grosso modo umgekehrt.
Zwar spielt die Restklasse nicht die überragende (semantische) Rolle für literaturwissenschaftliche Fragen, doch wurde trotzdem hier der Versuch unternommen, auch diese Klasse in verschiedene Unterklassen zu unterteilen; allerdings nur bis zu einem gewissen Grad und mit einigen Ausnahmen. Alle eindeutig identifizierbaren Lexeme wurden ihrer Wortart zugeordnet; aber auf eine weitere Unterordnung, wie in Grammatiken üblich, wurde verzichtet. So werden zum Beispiel alle Pronomina zusammengefaßt, ohne daß auf eine differenzierende Gruppierung in die verschiedenen Pronomina-Arten abgestellt wird. Desgleichen wird keine weitere Unterscheidung in koordinierende und subordinierende Konjunktionen getroffen.
Ganz im Sinne der übergreifenden Intention des Projekts - also der sinnvollen Unterstützung einer Literaturanalyse - werden der Liste der Wortarten unter C die Eigennamen, Fremdwörter und die Zitate zugefügt. Es versteht sich von selbst, daß alle drei Kategorien nicht zu den Wortarten im terminologischen Sinne gehören, doch ein besonderer Ausweis dieser drei Gruppen erscheint aus dem genannten Grund sinnvoll.
Die Wortklassen:
A. Die Hauptwortarten: |
1. 2. 3. |
Substantiv Adjektiv Verb |
B. Die Restklasse: |
4. 5. 6. 7. 8. 9. 10. |
Adverb Artikel Pronomina Pronominaladverbien Fragewörter Präpositionen Konjunktionen |
C. |
11. 12. 13. |
Eigennamen Fremdwörter Zitate |
<< Wortlisten | Konkordanzen >> |