EnglishPolski

Advanced search | Query syntax

Acknowledgements

The IPI PAN Corpus and various accompanying tools were developed mainly within two national projects led by Adam Przepiórkowski and carried out at ICS PAS: The IPI PAN Corpus of Polish KBN grant (7T11C04320; April 2001 -- March 2004) and the Automatic extraction of linguistic knowledge from a large corpus of Polish national Ministry of Education and Science grant (3T11C00328; March 2005 -- September 2007). The following employees of ICS PAS (most of them members of the Linguistic Engineering Group) took active part in the development of the IPI PAN Corpus: Łukasz Dębowski, Elżbieta Hajnicz, Adam Przepiórkowski, Marcin Woliński. Many people from outside of ICS PAS also participated in the creation of the Corpus and various tools associated with it. Rafał L. Górski's group at the Institute of Polish Language PAS was responsible for the acquisition of texts and licences. Piotr Bański, Artur Gniadzik, Jakub Jurkiewicz, Radosław Moszczyński, Paweł Savov, Jakub Sikora and Katarzyna Sokołowska helped with the conversion of texts into the XML format; particular thanks are due here to Radosław Moszczyński. Michał Michalski wrote a program for the automatic periodical acquisition and conversion of texts from the Internet. Monika Czerepowicka, Dorota Lewandowska, Hanna Maliszewska, Marta Nazarczuk-Błońska, Marta Piasecka, Beata Wójtowicz and Ewa Wolska took part in the manual disambiguation of the training corpus, whereas Zygmunt Saloni provided valuable advice in the process. Tomasz Szymko created an automatic sentencer for dividing texts into sentences. The 1st release of the IPI PAN Corpus (June 2004) was morphosyntactically annotated with a statistical tagger created by Łukasz Dębowski, while the 2nd release (March 2006) was annotated with a decision tree and rule-based tagger created by Maciej Piasecki and Grzegorz Godlewski; both taggers were based on the Morfeusz morphological analyser. Zygmunt Krynicki developed the first versions of Poliqarp, a corpus management and search tool, currently further developed by Daniel Janus; Janusz S. Bień, Aleksander Buczyński, Magdalena Derwojedowa, Rafał L. Górski, Tomasz Obrębski and Beata Trawiński were among those who helped us test and debug various versions of Poliqarp. As any other corpus, the IPI PAN Corpus contains various errors; Piotr Andrzejczak provided valuable help in improving the metadata information, Anna Stepowany relentlessly squashed many conversion bugs, while Aleksander Buczyński took a very active role in the final stages of preparing the 2nd release of the IPI PAN Corpus.

The availability of various linguistic resources greatly facilitated the development of the Corpus. Zygmunt Saloni and Marcin Woliński made available their morphological analyser Morfeusz. Janusz S. Bień provided an early enriched version of the corpus of the Frequency dictionary of contemporary Polish. Włodzimierz Gruszczyński made available his inflectional patterns of Polish lexemes, which speeded up the development of the morphological analyser. Last but not least, Janowi Hajič provided DAUJC, a tool for the manual disambiguation of morphosyntactic interpretations.

We thank the following people and publishing houses for providing texts and for their help in getting in touch with copyright holders: Jarosław Abramow-Newerly, Marek Adamiec, Józef Augustyn SJ, Piotr Augustyniak, Bogdan Bartnikowski, Grażyna Berke, Agnieszka Biedrzycka, Andrzej Bień, Piotr Biliński, Wojciech Blajer, Eugeniusz Bobula, Aleksander Bohm, Bogusław Bożek, Kazimierz Brakoniecki, Katarzyna Brückman de Renstrom, Józef Brynkus, Stefan Chłopicki, Władysław Chłopicki, Wacław Chrząszcz, Anna Chudzik, Helena Ciborowska, Stanisław Cieniawa, Aleksandra Cieślikowa, Krzysztof Czarnota, Maria Dąbrowska, Stanisław Dubiel, Helena Duć-Fajfer, Małgorzata Duda, Henryk Dziadosz SJ, Elżbieta Dziwisz, Teresa Eminowicz-Jaśkowska, Marzanna Fijałkowska-Pyzowska, Jacek Filek, Jerzy Franczak, Jacek Głębski, Janusz Głowacki, Henryk Górecki, Włodzimierz Gruszczyński, Jacek Grzybowski, Elżbieta Hajnicz, Alicja Helman, Mariusz Holzer, Agnieszka Indyka-Piasecka, Zbigniew Jakubiec, Michał Jałowiecki, Daniel Janus, Tomasz Jaroszewski, Wit Jaworski, Stanisław Jonas, Sylwester Józefiak, Tomasz Jurasz, Janusz Jutrzenka Trzebiatowski, Jacek Kardaszewski, Andrzej Kastory, Ewa Kawalec, Zdzisław J. Kijas OFMConv , Radosław Klimek, Piotr Kłodkowski, Piotr Köhler, Krystyna Kofta, Felicja Konarska, Paweł Kosiński SJ, Barbara Kosmowska, Hanna Kowalewska, Waldemar Kozaczyński, Katarzyna Kozanecka, Jan Kozłowski, Bohdan Kozarzewski, Małgorzata Krakowiak, Antoni Kroh, Anna Krupska-Śliwiak, Krzysztof Książyński, Marian Kucała, Andrzej Kucharczyk, Marta Kudelska, Miłowit Kuniński, Anna Kupść, Witold Kupść, Kazimierz Kutz, Krzysztof Lenartowicz, Andrzej Lenda, Antoni Libera, Tadeusz Loska, Bronisław Łagowski, Teresa Łozowicka-Stupnicka, Tadeusz Dionizy Łukaszuk OSPPE, Piotr Majewicz, ks. Mieczysław Maliński, Witold Mańczak, Wojciech Markert, Roman Mazurkiewicz, Roland Meyer, Halina Mieczkowska, Stanisław Miklaszewski, Adam Mikrut, Włodzimierz Mizerski, Zofia Mossakowska, Radosław Moszczyński, Monika Motas-Piotrowska, Dorota Mycielska, Krzysztof Nazar, Helena Noskowicz-Bieroniowa, Krzysztof Obłój, Joanna Okoniowa, Joanna Olczak-Ronkier, Teresa Zofia Orłoś, Wiktor Osiatyński, Małgorzata Pamuła, Wacław Passowicz, Anna Pawlak, Marek Pawlicki, Krzysztof Pawłowski, Adam Peszko, Maciej Piasecki, Zdzisława Piątek, Jerzy Piech, Marian Pilot, Andrzej Piotrowski, Krystyna Pisarkowa, Andrzej Pisowicz, Bartłomiej Pokrzywka, Maciej Przepiera, Danuta Przepiórkowska, Teresa Przybyłowska-Lichwa, Piotr Pysiak, Jan Rajman, Alicja Rakowska, Zygmunt Rola, Andrzej Romanowski, Maria Rostworowska, Kazimierz Rup, Krzysztof Rutkowski, Mirosław Rzyczniak, Cezary Sękalski, Olga Sicińska, Aleksander Sieroń, Dariusz Skórczewski, Bożena Snella-Mrozik, Wiktoria Sobczyk, Stanisław A. Sroka, Leszek Starkel, Andrzej Stokłosa, Andrzej Szczeklik, Danuta Szcześniewska, Stanisław Szczur, Andrzej Szeptycki, Józef Szocki, Marek Szołtysek, Jerzy S. Szumski, Irena Szymańska, Wiesław Paweł Szymański, Bogdan Świecimski, Agata Świerzowska, Jan Jakub (Kuba) Tatarkiewicz, Krzysztof Tatarkiewicz, Tomasz Tołłoczko, Zdzisława Tołłoczko, Krzysztof Urbański, Jadwiga Waniakowa, Monika Warneńska, Bogna Wernichowska, Krystyna Weyssenhoff-Brożkowa, Zdzisław Wietrzak SJ, Witt Wilczyński, Krzysztof Wilkosz, Jerzy Wołkow, Iwona Anna Wójcik, s. Małgorzata Maria Wójcik, Jerzy Wrona, Witold Zalewski, Tadeusz Zimecki, Aleksandra Żabicka, Wojciech Żmudziński, wydawnictwo Abrys, Ajaks, Alfa-medica press, Czytelnik, Emilia, Instytut Ochrony Przyrody PAN, Księgarnia Akademicka, Ludowa Spółdzielnia Wydawnicza, Media Rodzina, Rebis, Rosner i Wspólnicy, słowo/obraz terytoria, Societas Vistulana, Instytut Filologii Polskiej Uniwersytetu Gdańskiego, Uczelniane Wydawnictwa Naukowo-Dydaktyczne AGH, Universitas, Wspólnota kulturowa Borussia, Wydawnictwo Akademii Pedagogicznej w Krakowie, Wydawnictwo IJP PAN, Wydawnictwo Jagiellonia SA, Wydawnictwo Oddziału PAN w Krakowie, Wydawnictwo Papieskiej Akademii Teologicznej w Krakowie, Wydawnictwo W.A.B., Wydawnictwo WAM, Znak, Zysk i Sp.

We would also like to thank the Institute of Polish Language PAS for hosting a mirror server of http://korpus.pl/.