Statistische Methoden in der Sprachverarbeitung
Wintersemester 2024/25
Dozent: Helmut Schmid



  Termine
    VorlesungMontag12:00 - 14:00 Uhr c.t. Hörsaal BU101
    ÜbungenMontag14:00 - 16:00 Uhr c.t. Raum U151
    RepetitoriumDienstag12:00 - 14:00 Uhr c.t. Raum C003 ab der 2. Vorlesungswoche
    TutoriumMontag9:00 - 10:30Zoom ab der 3. Vorlesungswoche


  Inhalt der Vorlesung

    Das Seminar bietet eine Einführung in wichtige Methoden und Modelle der statistischen maschinellen Sprachverarbeitung und ihre Anwendungen.
    Behandelt werden die Themen:
    • statistische Tests und Kollokationsextraktion
    • Markowmodelle und Sprachidentifizierer
    • Naive Bayes und Wortbedeutungsdesambiguierung
    • Hidden-Markov-Modelle und Wortartannotierung
    • Probabilistische kontextfreie Grammatiken und Parsebaum-Desambiguierung
    • Perzeptron-Algorithmus
    • Conditional Random Fields

  Übungsaufgaben
  Begleitmaterial zur Vorlesung
  Weiterführende Literatur
  • Chris Manning und Hinrich Schütze: Foundations of Statistical Natural Language Processing, MIT Press
  • Daniel Jurafsky and James Martin: Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Prentice Hall

  Prüfungstermine
    Übung:  27. Januar 2024, 12 Uhr c.t., im Hörsaal BU101
    Vorlesung:  3. Februar 2024, 12 Uhr c.t., im Hörsaal BU101

    Die Vorlesungsklausur wird eine mehrteilige Aufgabe mit 10 von 30 Punkten umfassen, die sich an diesem Beispiel orientiert.

    Wiederholungstermine

    Vorlesung:  Mitte März, im Hörsaal BU101
    Übung:  Mitte März, im Hörsaal BU101

Centrum für Informations- und Sprachverarbeitung (CIS)