Information Extraction - Lecture (WS 2019-2020)

Summary

Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.

Inhalte:

In der Vorlesung wird zunächst der Begriff der Informationsextraktion in Abgrenzung zum Information Retrieval definiert. Dazu gehört auch, die Teilgebiete und Aufgaben der Informationsextraktion (IE) vorzustellen. Dabei wird konkret auf die einzelnen Probleme der IE eingegangen, bevor Ansätze und Verfahren zur Lösung dieser behandelt werden. Die Veranstaltungsteilnehmer werden lernen, wie die Architektur eines generischen IE-Systems aussieht, welche Komponenten es enthält, und auf welchen Ressourcen es aufbaut.

Lernziele:

Ziel ist es, die Probleme bei der automatischen Informationsextraktion aus Dokumenten zu verstehen und die notwendigen Komponenten und Ressourcen kennenzulernen.

Here is a link to the Seminar

Instructor

Alexander Fraser

Email Address: SubstituteMyLastName@cis.uni-muenchen.de

CIS, LMU Munich


Tutor: Tobias Eder

Email Address: tobias.eder@in.tum.de


Schedule


Room BU101, Wednesdays, 16 to 18 (c.t.)


If this web page does not seem to be up to date, use the refresh button in your browser.

Date Topic Reading (BEFORE THE NEXT MEETING!) Lecture slides
October 16th Introduction to Information Extraction Read Sarawagi: Introduction (pages 1 to 21) pptx pdf
October 23rd History/Related Fields, Sources, Regular Classes Read Sarawagi: Rule-based (Chapter 2) pptx pdf
October 30th Introduction to Evaluation, Rule-based NER pptx pdf
November 6th More evaluation, IE Tasks, Annotation, Intro Classification-based NER Read Sarawagi: Statistical Methods (Chapter 3) pptx pdf
November 13th Decision Trees pptx pdf
November 27th Linear Models Read Sarawagi: Statistical Methods (Chapter 3), this time with the math pptx pdf
December 4th Neural Networks and Word Embeddings
(see also the slides at the very end of the PDF)
    pdf
December 11th Neural Networks for NER, Viktor Hangya     pdf
December 18th Sentiment Analysis, Dario Stojanovski pptx pdf
January 8th Relation Extraction, Matthias Huck Read Sarawagi: Relationship Extraction     pdf
January 15th Event Extraction and Multimodal Extraction pptx pdf
January 22nd Open IE, Matthias Huck     pdf
January 29th REVIEW
February 5th NO CLASS (by student request the Klausur was moved to the 12th!)
February 12th Klausur (LOCATION Hauptgebäude D 209, bring blank paper!)


Literature:

Sunita Sarawagi. Information Extraction. Foundations and Trends in Databases, 1(3):261–377, 2008. Table of Contents