Information Extraction - Seminar (WS 2020-2021)

Summary

Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.

Inhalte:

Das Seminar behandelt Ansätze, Verfahren und Werkzeuge der Informationsextraktion und legt einen besonderen Fokus auf die Erkennung von Eigennamen und von domänen- bzw. fachspezifischer Information. Auch sollen Fragestellungen der Evaluation derartiger Verfahren diskutiert werden.

Lernziele:

Die Teilnehmer sollen lernen, wie sie Ressourcen für IE Systeme bewerten können. Außerdem sollen sie befähigt werden, dass sie bei der Entwicklung, beim Einsatz und bei der Bewertung von IE-Systemen mitwirken können.

Here is a link to the Lecture

Instructor

Alexander Fraser

Email Address: SubstituteMyLastName@cis.uni-muenchen.de

CIS, LMU Munich



Schedule

There are *two separate seminars*. You EITHER go on Wednesdays, OR you go on Thursdays, NOT BOTH!

Wed: 10:00 c.t., ZOOM ONLINE

Thurs: 10:00 c.t., ZOOM ONLINE


Zoom links will be sent via LSF


For a LaTeX template for the Hausarbeit, click here.


If this web page does not seem to be up to date, use the refresh button in your browser.
Date Topic Materials
November 4th and November 5th Introduction, Information on Participants
November 11th and November 12th Referat Topics Alexander Fraser
Viktor Hangya
Jindrich Libovicky
Denis Peskov
Alexandra Chronopoulou
November 18th and November 19th Cancelled (Vorlesung on November 18th is not cancelled!)
November 25th and November 26th Exercise: CMU Seminars (Annotation and Manual Rules) IE_1_example1.txt IE_1_example2.txt IE_1_annotate.txt
IE_exercise1.tar.xz IE_exercise1_README.txt


Aktuelles


WEDNESDAY Referatsthemen (name: topic)


Date Topic Language Materials Hausarbeit Received
09.12.20 Philip Burg, Alexandra Schötz, Cornelius Schierlinger: NER Twitter (AF) DE yes / yes / yes
16.12.20 Igor Kareev, Maximilian Thilo Geiling, Gege Ruan: Org Wikipedia (DP) EN yes / yes / yes
23.12.20 Daniel Heider, Daniel Jakobi, Marc-Anthony Bauer: Depression Online (JL) EN yes / yes / yes
13.01.21 Philip Baader, Kevin Müller-Kunz: Rumor Verification (VH) EN yes / yes
20.01.21 Jana Kreißig, Silvia Cardani, Mariko Wiese: Coreference (AC) EN yes / yes / yes
27.01.21 Paul Dobbers, Anne-Marie Lutgen, Karl Christmann: Disaster Events (AF) DE yes / yes / yes
03.02.21 Irine Dmitrieva, Ricarda Meinhardt, Burak Berberoglu: Open QA (AC) EN yes / yes / yes
03.02.21 (SECOND TOPIC ON 03.02!) Vedran Dusanic, Halyna Tonkoshkura, Valeriya Herrlein: Open IE (AF) DE yes / yes / yes
10.02.21 No class (topic moved to extra hour on 03.02 due to exam conflict)




THURSDAY Referatsthemen (name: topic)


Date Topic Language Materials Hausarbeit Received
03.12.20 Frank Pöhlmann, Fiona Gawlina: History of IE (AF) EN yes / yes
10.12.20 Seda Aydin, Eva Tsigkana, Andrasch Meszaros: NER Twitter (AF) DE yes / yes / yes
17.12.20 Galyna Gerasymchuk, Olha Okhrei, Joshua Neudorf: Org Wikipedia (DP) DE yes / yes / yes
14.01.21 Claudia Kolano, Paul Schulze, Henrike Schuster: Depression Online (JL) EN yes / yes / yes
21.01.21 Olga Gedzyk, Shushanik Aprikyan, Martin Wagner: Offensive Language (AC) EN yes / yes / yes
28.01.21 Jana Grimm, Bingyu Xiong, Pegi Ktona: Abs. Text Summ (JL) EN yes / yes / yes
04.02.21 Bizhan Zahidi, Kamilla Rustamova, Patrick Helcl: Training Data Weak Sup (AF) DE yes / yes / yes
11.02.21 Hania Lask, Cornelia Jost: Parallel Extraction (VH) EN yes / yes