Tabelle 2.6. Testsuite: Verben: Annotationen auf Wortebene
Kategorie | Sub-Kategorie | Sub-Sub-Kategorie | mögl. Werte/Wertetyp |
---|---|---|---|
Allgemeines | Wortbildung | Art/Stamm | d= deutsche Wortbildung |
n= neoklassische Wortbildung | |||
k= Basis kurzes Allomorph (üblicherw. neokl.) | |||
l= Basis langes Allomorph (üblicherw. neokl.) | |||
f= Fremdwort | |||
opake Analyse bevorzugt | 0 / 1 | ||
Basis | 0 / text | ||
Derivation | Basis nicht V | Substantiv | 0 / text |
Adjektiv | 0 / text | ||
Partikelverb (s. Duden 1011) | Präposition | 0 / text (z.B. an, ab, auf, aus, mit, nach, zu) | |
Adverb | 0 / text (z.B. her, hin, herüber, hinauf, weg, empor) | ||
Adjektiv | 0 / text (z.B. fest, frei, hoch, wahr) | ||
Substantiv | 0 / text (z.B. preis, stand) | ||
Präfixverb (s. Duden 1049) | Präfix ohne homonyme Verbpartikel | 0 / text (z.B. be-, ent-, er-, ge-, miss-, ver-, zer-) | |
Präfix mit homonymer Verbpartikel | 0 / text (z.B. durch, über um, unter, wider) | ||
fremdspr. Präfix | 0 / text (z.B. de-, des-, dis-, in-, trans-, prä-) | ||
Flexion | Infinitiv | 0/1 | |
Zu-Infinitiv | 0/1 | ||
Partizip 1 | 0/1 | ||
Partizip 2 | 0/1 | ||
Um-/Ablautung | 0 / Folge aus vier Buchstaben (z.B. nehmen=ABCD, wachsen=AÄBA) A=Vokal ohne Um-/Ablaut, Ä=derselbe Vokal mit Umlaut, B,C,D=weitere Vokale (Ablaut). 1.Buchstabe=Infinitiv,2.=3.Pers Sg., 3.=Präteritum, 4.=Partizip 2 | ||
Komposition | 0/1 |
Folgende Richtlinien gelten für Einträge in diese Tabelle:
Die Kategorien, die in der obigen Tabelle verwendet werden, sind hauptsächlich auf Erläuterungen aus [bib.Duden-2009] zurückzuführen: In Abschnitt 1011 werden vier Arten Verpartikeln unterschieden:
Verbpartikeln mit homonymen Präpositionen wie an, ab, auf, auf, mit, nach, zu |
Verbpartikeln mit homonymen Adverbien wie her, hin, herüber, hinauf, weg, empor |
Verbpartikeln mit homonymen Adjektiven wie fest, frei hoch |
Verbpartikeln mit homonymen Substantiven wie preis, stand |
Weiterhin (in Abschnitt 1049) werden Präfixverben wie folgt kategorisiert:
Präfixe ohne homonyme Verbpartikeln, wie be-, ent- er-, ge- miss-, ver-, zer- |
Präfixe mit homynymen Verbpartikeln, wie durch-, über, um-, unter-, wider- |
Die Erläuterungen aus Abschnitt 1050 sind bei der Interpretation unserer Kategorien ebenfalls zu berücksichtigen.
Allgemeines -- Wortbildung
Der Eintrag f (Fremdwort) umfasst Lehnwörter (i.S.v. Fremdwörtern, die deutsch flektiert werden, z.B. checken); relevant für diesen Eintrag ist dabei, dass keine Stamm-Formative (Stämme, die nicht eigenständig vorkommen) in der Wortform vorkommen. Dagegen stellt n nur fest, dass entweder ein solcher gebundener Stamm auftritt oder eine fremde Basis (z.B. Distanz) - diese muß nicht lateinischen oder griechischen Ursprungs sein - sowie ein Suffix, das typischerweise bei neoklassischer Bildung verwendet wird (z.B. -ieren, siehe Seite 31 [bib.Fuhrhop-1998]). Sobald eines auch in anderen Bildungen vorkommendes Formativ erkannt wird, soll es als solches auch benannt werden (z.B. demokratisieren vom Stamm dem (wie endemisch) .
Der Einträge k und l stehen für kurze (üblicherweise) neoklassische Basen, zu denen es ein Allomorph im Deutschen gibt, welches länger (bzw. kürzer) ist. Beispiele hierzu sind anim- (k) und animat- (l) (siehe [bib.Luedeling-etal-2001]). Die jeweils andere Basis wird in Klammern hinter dem Eintrag angegeben.
Manche Präfigierungen sind im heutigen Deutsch opak, wie z.B. gehören (von gehorchen zu hören (lt. Duden Universalwörterbuch)). Unabhängig davon, dass gehören semantisch ambig ist (das gehört sich so, das gehört ihr, das gehört zur Ausrüstung, etc. ), verbindet ein Sprecher des heutigen Deutsch dieses Wort üblicherweise nicht mit der Semantik seiner Basis hören. Für solche Wortbildungen wird daher keine Präfigierung angenommen (und damit eine opake Analyse bevorzugt). Weiterhin werden die Wortformen als opak analysiert, deren Stamm ein sonst nicht verwendetes Formativ ist, z.B. radieren: das Formativ rad ist sonst im Deutschen nicht im Gebrauch.
In die Spalte Basis wird der angenommene Verb-Stamm bzw. Nomen-Stamm eingetragen. Da SMOR keine "Wortart F" (für "Formativ") kennt, wird, falls das Formativ nach Einschätzung der Annotatoren überwiegend Nomina bildet, dieses in der Spalte "Nomen" eingetragen, sonst in der Spalte "Verb".
Derivation
Basis nicht V
Falls es sich um eine Derivation handelt, bei der die Basis kein Verb ist, wird (mindestens) eine der beiden Spalten mit Substantiv gefüllt. Zum Beispiel wird für das Verb verdächtigt die beiden Basen Verdacht sowie das (daraus abgeleitete) Adjektiv verdächtig eingetragen.
Partikelverben
Im Falle von Partikelverben wird (basierend auf [bib.Duden-2009], Nr. 1011 ) die ursprüngliche Wortart (Präposition, Adverb, Adjektiv, Substantiv) der Partikel eingetragen.
Präfixverben
Präfix ohne homonyme (gleichlautende) Verbpartikel: Typische Präfixe, für die es keine homonyme Partikel gibt (s. [bib.Duden-2009], Nr. 1049), sind be-, ent-, zer-, etc.. Diese werden hier eingetragen, falls die Basis dazu im heutigen Deutsch noch nachvollziehbar ist. Opak analysiert werden Bildungen mit ge-: gefrieren, (wie auch geraten, gehören, gehorchen, gestehen, gefallen, gewähren, gebieten, gebrauchen, geloben, geleiten, gemahnen, gerinnen, getrauen, gedulden). Hier wird keine Produktivität mehr angenommen.
fremdsprachliches Präfix: Bei neoklassischer Präfigierung wird das Präfix nur dann in dieser Spalte aufgeführt, wenn die Wortform im Deutschen auch ohne das Präfix üblich ist. Ein Beispiel ist das Wort dechiffrieren, hier wird in die entsprechende Spalten (hier: V-Basis) chiffr- und (fremdes Präfix) de- eingetragen. Ein Gegenbeispiel stellt sublimieren dar: da limieren nicht gebräuchlich ist, wird in der Stamm-Spalte die das Präfix beinhaltende Basis eingetragen (sublim-). N.B. Ob eine solche Wortform in Gebrauch ist, entscheiden die Annotatoren grundsätzlich aufgrund ihres Sprachgefühls, bei Unsicherheiten wird eine Korpussuche (in SDeWaC, s. [bib.Faasz-et-al-2010] durchgeführt.
Flexion
Infinitiv: Das LabelInfinitiv umfasst die formidentischen anderen Flexionsformen (z.B. 1. Person Plural),
Zu-Infinitiv: Das Label Zu-Infinitiv wird immer dann gesetzt, wenn eine solche Form (z.B. anzuleiten vorliegt.
Partizip1: Wir sehen eine Partizip-1 Form (z.B. anleitend) vor, da sie zumindest theoretisch möglich ist. Bei einer unflektierten Partizip-1 Form, wird erwartet, dass sie auch als Adjektiv auftritt, diese Wortformen finden sich in der V+ADJ-Tabelle.
Partizip2: Da die meisten dieser Formen (z.B. angeleitet) im Satz prädikativ sowie adjektivisch verwendet werden können, wird erwartet, dass SMOR entsprechende ambige Resultate produziert. Die Analysen dieser Formen werden separat in der V+ADJ Tabelle aufgeführt.