Bei der Informationsextraktion (IE) geht es um die automatische Extraktion von Information aus Volltexten. Die Anwendungen erstrecken sich von der Unterstützung von Internet-Suchmaschinen bis hin zum automatischen Aufbau von Fachdatenbanken. Die Methoden reichen von der Analyse natürlicher Sprache über automatische Termerkennung bis zu automatischen Lernverfahren, wobei symbolische, statistische und hybride Methoden zum Einsatz kommen. Komplexe Informationsstrukturen können mit sogenannten Templates (Informationsmustern) repräsentiert werden. In der Veranstaltung werden verschiedene Anwendungen und Methoden für diverse Anwendungsdomänen betrachtet.
Inhalte:
Das Seminar behandelt Ansätze, Verfahren und Werkzeuge der Informationsextraktion und legt einen besonderen Fokus auf die Erkennung von Eigennamen und von domänen- bzw. fachspezifischer Information. Auch sollen Fragestellungen der Evaluation derartiger Verfahren diskutiert werden.
Lernziele:
Die Teilnehmer sollen lernen, wie sie Ressourcen für IE Systeme bewerten können. Außerdem sollen sie befähigt werden, dass sie bei der Entwicklung, beim Einsatz und bei der Bewertung von IE-Systemen mitwirken können.
Here is a link to the Lecture
Email Address: SubstituteMyLastName@cis.uni-muenchen.de
There are *two separate seminars*. You EITHER go on Wednesdays, OR you go on Thursdays, NOT BOTH!
Wed: 10:00 c.t., ZOOM ONLINE
Thurs: 10:00 c.t., ZOOM ONLINE
Zoom links will be sent via LSF
For a LaTeX template for the Hausarbeit, click here.
If this web page does not seem to be up to date, use the refresh button in your browser.
Date | Topic | Materials |
November 4th and November 5th | Introduction, Information on Participants | |
November 11th and November 12th | Referat Topics |
Alexander Fraser Viktor Hangya Jindrich Libovicky Denis Peskov Alexandra Chronopoulou |
November 18th and November 19th | Cancelled (Vorlesung on November 18th is not cancelled!) | |
November 25th and November 26th | Exercise: CMU Seminars (Annotation and Manual Rules) | IE_1_example1.txt IE_1_example2.txt IE_1_annotate.txt IE_exercise1.tar.xz IE_exercise1_README.txt |
WEDNESDAY Referatsthemen (name: topic)
Date | Topic | Language | Materials | Hausarbeit Received |
09.12.20 | Philip Burg, Alexandra Schötz, Cornelius Schierlinger: NER Twitter (AF) | DE | yes / yes / yes | |
16.12.20 | Igor Kareev, Maximilian Thilo Geiling, Gege Ruan: Org Wikipedia (DP) | EN | yes / yes / yes | |
23.12.20 | Daniel Heider, Daniel Jakobi, Marc-Anthony Bauer: Depression Online (JL) | EN | yes / yes / yes | |
13.01.21 | Philip Baader, Kevin Müller-Kunz: Rumor Verification (VH) | EN | yes / yes | |
20.01.21 | Jana Kreißig, Silvia Cardani, Mariko Wiese: Coreference (AC) | EN | yes / yes / yes | |
27.01.21 | Paul Dobbers, Anne-Marie Lutgen, Karl Christmann: Disaster Events (AF) | DE | yes / yes / yes | |
03.02.21 | Irine Dmitrieva, Ricarda Meinhardt, Burak Berberoglu: Open QA (AC) | EN | yes / yes / yes | |
03.02.21 (SECOND TOPIC ON 03.02!) | Vedran Dusanic, Halyna Tonkoshkura, Valeriya Herrlein: Open IE (AF) | DE | yes / yes / yes | |
10.02.21 | No class (topic moved to extra hour on 03.02 due to exam conflict) |
THURSDAY Referatsthemen (name: topic)
Date | Topic | Language | Materials | Hausarbeit Received |
03.12.20 | Frank Pöhlmann, Fiona Gawlina: History of IE (AF) | EN | yes / yes | |
10.12.20 | Seda Aydin, Eva Tsigkana, Andrasch Meszaros: NER Twitter (AF) | DE | yes / yes / yes | |
17.12.20 | Galyna Gerasymchuk, Olha Okhrei, Joshua Neudorf: Org Wikipedia (DP) | DE | yes / yes / yes | |
14.01.21 | Claudia Kolano, Paul Schulze, Henrike Schuster: Depression Online (JL) | EN | yes / yes / yes | |
21.01.21 | Olga Gedzyk, Shushanik Aprikyan, Martin Wagner: Offensive Language (AC) | EN | yes / yes / yes | |
28.01.21 | Jana Grimm, Bingyu Xiong, Pegi Ktona: Abs. Text Summ (JL) | EN | yes / yes / yes | |
04.02.21 | Bizhan Zahidi, Kamilla Rustamova, Patrick Helcl: Training Data Weak Sup (AF) | DE | yes / yes / yes | |
11.02.21 | Hania Lask, Cornelia Jost: Parallel Extraction (VH) | EN | yes / yes |