29 lutego 2024 r. odbył się w Sejmie RP zorganizowany przez Instytut Podstaw Informatyki PAN warsztat naukowy „Analiza danych parlamentarnych”, który stanowił podsumowanie zorganizowanego na jesieni ubiegłego roku konkursu na analizę stenogramów Sejmu i Senatu. Celem konkursu, adresowanego do studentów, doktorantów i młodych naukowców, było stworzenie oryginalnego opracowania ciekawego problemu badawczego z dowolnej dyscypliny nauki.
Korpus Dyskursu Parlamentarnego i korpus ParlaMint
Wydarzenie rozpoczęło wystąpienie prof. Macieja Ogrodniczuka z Instytutu Podstaw Informatyki PAN, który zaprezentował dwa wykorzystywane w konkursie zbiory danych parlamentarnych. Najważniejszym z nich jest polskojęzyczny Korpus Dyskursu Parlamentarnego (KDP), liczący ponad 800 mln słów zestaw stenogramów z posiedzeń plenarnych, sprawozdań z posiedzeń komisji oraz interpelacji, zapytań i odpowiedzi od roku 1919 aż do dnia dzisiejszego. Jego współczesną część (od roku 2015) zawiera natomiast wielojęzyczny korpus ParlaMint, gromadzący podobne dane z parlamentów prawie wszystkich krajów europejskich, a takżeich tłumaczenia na język angielski.
Dane wykorzystywane w konkursie są dostępne bezpłatnie dla wszystkich. Co ważne – żeby z nich korzystać, nie trzeba umieć programować. Zarówno KDP, jak i ParlaMint zostały udostępnione w sieci w prostych w obsłudze interfejsach.
Nagrodzone projekty
Kolejną część warsztatu stanowiła prezentacja zwycięskich prac konkursowych:
O zmianach w polszczyźnie parlamentarnej
Kolejnym punktem programu był wykład prof. Marka Łazińskiego, językoznawcy z UW i członka Rady Języka Polskiego, dotyczący. „zmian w polszczyźnie ostatnich stu lat w zwierciadle debat parlamentarnych” na różnych poziomach analizy języka – w fonetyce, fleksji, słowotwórstwie, składni i słownictwie.
Zakończenie warsztatu
Na zakończenie spotkania odbył się panel dyskusyjny z udziałem części kapituły konkursowej – prof. Magdaleny Derwojedowej z Uniwersytetu Warszawskiego, prof. Krzysztofa Kasianiuka z Collegium Civitas, prof. Adama Pawłowskiego z Uniwersytetu Wrocławskiego oraz prof. Marka Łazińskiego. Poruszono w nim kwestię rodzajów danych i metadanych opisujących wypowiedzi parlamentarzystów, odpowiedniego przygotowania danych do użycia w badaniach, udostępniania zasobów oraz roli badaczy w przybliżaniu prac parlamentu obywatelom. Warsztat zakończył się uroczystym wręczeniem dyplomów nagrodzonym w konkursie. Organizatorem warsztatu był Instytut Podstaw Informatyki PAN w ramach konsorcjum CLARIN-PL.
W serwisie PAN stosujemy pliki cookies w celu gromadzenia danych statystycznych oraz prawidłowego funkcjonowania serwisu. Pliki te mogą być umieszczane na Twoim urządzeniu do odczytu stron. Więcej informacji o celu używania i zmianie ustawień ciasteczek znajdziesz w naszej polityce prywatności.