Information Extraction - Lecture (WS 2018-2019)

Summary

Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.

Inhalte:

In der Vorlesung wird zunächst der Begriff der Informationsextraktion in Abgrenzung zum Information Retrieval definiert. Dazu gehört auch, die Teilgebiete und Aufgaben der Informationsextraktion (IE) vorzustellen. Dabei wird konkret auf die einzelnen Probleme der IE eingegangen, bevor Ansätze und Verfahren zur Lösung dieser behandelt werden. Die Veranstaltungsteilnehmer werden lernen, wie die Architektur eines generischen IE-Systems aussieht, welche Komponenten es enthält, und auf welchen Ressourcen es aufbaut.

Lernziele:

Ziel ist es, die Probleme bei der automatischen Informationsextraktion aus Dokumenten zu verstehen und die notwendigen Komponenten und Ressourcen kennenzulernen.

Here is a link to the Seminar

Instructor

Alexander Fraser

Email Address: SubstituteMyLastName@cis.uni-muenchen.de

CIS, LMU Munich

Tutor: Tobias Eder

Email Address: tobias.eder@in.tum.de

Schedule

Room L155, Wednesdays, 16 to 18 (c.t.)

If this web page does not seem to be up to date, use the refresh button in your browser.

Date Topic Reading (BEFORE THE NEXT MEETING!) Lecture slides

October 17th Introduction to Information Extraction Read Sarawagi: Introduction (pages 1 to 21) pptx pdf

October 24th History/Related Fields, Sources, Regular Classes Read Sarawagi: Rule-based (Chapter 2) pptx pdf

November 7th Introduction to Evaluation, Rule-based NER pptx pdf

November 14th More evaluation, IE Tasks, Annotation, Intro Classification-based NER Read Sarawagi: Statistical Methods (Chapter 3) pptx pdf

November 21st Decision Trees pptx pdf

November 28th Linear Models pptx pdf
December 5th Relation Extraction, Matthias Huck Read Sarawagi: Relationship Extraction pdf

December 12th Neural Networks and Word Embeddings pdf

December 19th Neural Networks for NER, Viktor Hangya pdf

January 9th Sentiment Analysis, Dario Stojanovski pptx pdf

January 16th Event Extraction and Multimodal Extraction pptx pdf

January 23rd Open IE, Matthias Huck pdf

January 30th REVIEW

February 6th NO CLASS (by student request the Klausur was moved to the 13th!)

February 13th Klausur (15:00 c.t., one hour earlier than usual, in BU101 at the Ooettingerstr, bring blank paper!)
April 24th Nachholklausur moved to 24.04 at 17:00 c.t. (NOT 11:00 c.t.!) due to an error in the LSF listing
(ROOM BU101, bring blank paper)

Literature:

Sunita Sarawagi. Information Extraction. Foundations and Trends in Databases, 1(3):261–377, 2008. Table of Contents

Date	Topic	Reading (BEFORE THE NEXT MEETING!)	Lecture slides
October 17th	Introduction to Information Extraction	Read Sarawagi: Introduction (pages 1 to 21)	pptx pdf
October 24th	History/Related Fields, Sources, Regular Classes	Read Sarawagi: Rule-based (Chapter 2)	pptx pdf
November 7th	Introduction to Evaluation, Rule-based NER		pptx pdf
November 14th	More evaluation, IE Tasks, Annotation, Intro Classification-based NER	Read Sarawagi: Statistical Methods (Chapter 3)	pptx pdf
November 21st	Decision Trees		pptx pdf
November 28th	Linear Models		pptx pdf
December 5th	Relation Extraction, Matthias Huck	Read Sarawagi: Relationship Extraction	pdf
December 12th	Neural Networks and Word Embeddings		pdf
December 19th	Neural Networks for NER, Viktor Hangya		pdf
January 9th	Sentiment Analysis, Dario Stojanovski		pptx pdf
January 16th	Event Extraction and Multimodal Extraction		pptx pdf
January 23rd	Open IE, Matthias Huck		pdf
January 30th	REVIEW
February 6th	NO CLASS (by student request the Klausur was moved to the 13th!)
February 13th	Klausur (15:00 c.t., one hour earlier than usual, in BU101 at the Ooettingerstr, bring blank paper!)
April 24th	Nachholklausur moved to 24.04 at 17:00 c.t. (NOT 11:00 c.t.!) due to an error in the LSF listing (ROOM BU101, bring blank paper)