Adaptive Informationsaufbereitung aus heterogenen Quellen
Herausforderungen und Werkzeuge
1) Prof. Dr. Iryna Gurevych und Christian Meyer
(TU Darmstadt, Ubiquitous Knowledge Processing (UKP) Lab)
Intensive Recherche ist zentral für sämtliche journalistischen Tätigkeiten und unterliegt sehr engen Zeitvorgaben. Zugleich explodiert die relevante Informationsmenge und die Quellen werden immer komplexer, sind hochgradig heterogen und weisen unterschiedliche Informationsqualität auf.
Im Rahmen dieses Workshops stellen wir das von den Universitäten Darmstadt und Heidelberg sowie dem Heidelberger Institut für Theoretische Studien (HITS) gegründete Graduiertenkolleg AIPHES vor und diskutieren wesentliche Herausforderungen und Werkzeuge aus Sicht des Journalismus und der informatikorientierten Forschung zu sprach- und wissensverarbeitenden Systemen.
Das gemeinsame Anwendungsszenario des Graduiertenkollegs ist es, relevantes Wissen aus heterogenen Textquellen automatisch zu extrahieren und zu einem informativen und stilistisch homogenen Dossier aufzubereiten, das als Recherchehilfsmittel oder Schreibvorlage für Online-Redaktionen genutzt werden kann.
2) Kurt Jansson und Maximilian Schäfer (Dokumentation DER SPIEGEL, Hamburg)
Das Zu-Tage-Fördern von strukturierten Daten aus diversen Formaten und Quellen gehört beim SPIEGEL seit einigen Jahren zum Alltag. Die Szenarien sind vielfältig: Uns erreichen kiloschwere Aktenordner aus einer Behörde, ein Redakteur erhält von einem Informanten einen USB-Stick mit unklarem Inhalt oder wir benötigen Informationen, die über tausende Webseiten verstreut sind.
Mittlerweile verfügen wir über einen erprobten Werkzeugkasten, mit dem wir Daten auch aus widerspenstigen Formaten extrahieren und analysieren können. Während des Workshops geben wir einen Einblick in unsere Arbeitsweise.