Plenarprotokolle als öffentliche Sprachressource der Demokratie: Klassifikation von Plenardebatten im PolMine-Plenarprotokollkorpus
Kurationsprojekt der F-AG 7 , Prof. Dr. Andreas Blätte / Prof. Dr. Gary S. Schaal
Im deutschsprachigen Raum fehlen frei verfügbare, annotierte Korpora politischer Texte. Dadurch wird die Entwicklung der Digital Humanities-Forschung insgesamt gehemmt, es ergeben sich auch Barrieren für Nachwuchswissenschaftler, in den Bereich der eHumanities einzusteigen. Eine mögliche Lösung bieten Plenarprotokolle als öffentliches Archiv des politischen Zeitgeschehens einer Demokratie.
Plenarprotokolle des Bundestags, der Landtage oder auch des Europaparlaments dokumentieren über große Zeiträume das gesamte Spektrum politischer Aktivität. Dies ist zugleich, ohne eine thematische Klassifikation von Debatten, ein Nachteil: Plenarprotokolle decken, wenn nicht Subkorpora nach inhaltlichen Kriterien gebildet werden können, das politische Geschehen für viele Auswertungszwecke zu breit und zu undifferenziert ab. Für eine Vielzahl politikwissenschaftlicher Fragestellungen ist es relevant, dass themen- bzw. politikfeldspezifische Subkorpora gebildet werden können. Dafür ist eine Annotation von Debatten und deren Klassifikation erforderlich.
Im Mittelpunkt des vorgeschlagenen Projekts steht die Klassifikation von Plenardebatten des Deutschen Bundestags. Auf der Basis eines bereits mit einer Grundannotation als XML aufbereiteten Korpus von Plenarprotokollen (PolMine-Plenarprotokollkorpus, vgl. http://polmine.sowi.uni-due.de) wird ein Sample von Plenardebatten (d.h. die protokollierten Aussprachen zu einem qua Tagesordnung definierten Debattengegenstand im Parlament) nach einer politikwissenschaftlich einschlägigen Taxonomie manuell klassifiziert. Geplant ist die Nutzung des einschlägigen Codierschemas des Comparative Agendas Project (www.comparativeagendas.info). Mit Hilfe dieser Testdaten kann eine vollständige Klassifikation von Plenardebatten vorgenommen werden. Das PolMine-Korpus ist bereits in das Deutsche Referenzkorpus (DeReKo) aufgenommen worden und steht über das Institut für Deutsche Sprache (IDS) zur Verfügung. Es wird im Zuge des Projekts vom IMS Stuttgart als Ressource für einen sozial- bzw. politikwissenschaftlichen Nutzerkreis gehostet.
Letzte Änderung: 13. November 2017