Publikacje
Końcowa publikacja projektu, opisująca ostateczną wersję tagsetu oraz język zapytań programu Poliqarp:
- Adam Przepiórkowski. (2004). Korpus IPI PAN. Wersja wstępna / The IPI PAN Corpus: Preliminary version. IPI PAN, Warszawa.
- Rozdział 4 tej publikacji został przetłumaczony na język ukraiński! (Autor Tłumaczenia: Oresta Tymczyszyn.)
Inne publikacje dotyczące Korpusu IPI PAN i programu Poliqarp (w kolejności alfabetycznej):
- Łukasz Dębowski. (2003). A reconfigurable stochastic tagger for languages with complex tag structure. W: The Proceedings of the Workshop on Morphological Processing of Slavic Languages, EACL 2003.
- Łukasz Dębowski. (2004). Trigram morphosyntactic tagger for Polish. W: Intelligent Information Processing and Web Mining. Proceedings of the International IIS:IIPWM'04 Conference held in Zakopane, Poland, May 17-20, 2004, s. 409-413. Springer Verlag.
- Daniel Janus i Adam Przepiórkowski. (2006). POLIQARP 1.0: Some technical aspects of a linguistic search engine for large corpora. Złożone do materiałów konferencyjnych PALC 2005 (wersja przed korektami redaktorskimi).
- Adam Przepiórkowski. (2003). Składniowe uwarunkowania znakowania morfosyntaktycznego w korpusie IPI PAN. Polonica XXII-XXIII, s. 57-76, trzeci artykuł w serii czterech artykułów o Korpusie IPI PAN w Polonikach. (Wersja z 25 marca 2003)
- Adam Przepiórkowski. (2005). The IPI PAN Corpus in Numbers. W: Proceedings of the 2nd Language & Technology Conference, Poznań, Poland 2005. Skrócona wersja następującego artykułu.
- Adam Przepiórkowski. (2005). The Potential of the IPI PAN Corpus. To appear in: PSiCL.
- Adam Przepiórkowski, Zygmunt Krynicki, Łukasz Dębowski, Marcin Woliński, Daniel Janus i Piotr Bański. (2004). A Search Tool for Corpora with Positional Tagsets and Ambiguities. W: The Proceedings of the Fourth International Conference on Language Resources and Evaluation, LREC 2004, s. 1235--1238.
- Adam Przepiórkowski i Marcin Woliński. (2003). A Flexemic Tagset for Polish. W: The Proceedings of the Workshop on Morphological Processing of Slavic Languages, EACL 2003.
- Adam Przepiórkowski i Marcin Woliński. (2003). The Unbearable Lightness of Tagging: A Case Study in Morphosyntactic Tagging of Polish. W: The Proceedings of the 4th International Workshop on Linguistically Interpreted Corpora (LINC-03), EACL 2003.
- Marcin Woliński. (2003). System znaczników morfosyntaktycznych w korpusie IPI PAN. Polonica XXII-XXIII, s. 39-55, drugi artykuł w serii czterech artykułów o Korpusie IPI PAN w Polonikach. (Wersja z 18 marca 2002).
Wcześniejsze publikacje (przestarzałe):
- Piotr Bański. (2003). Anotacja zewnętrzna: wpływ architektury korpusu IPI PAN na efektywność jego tworzenia oraz wykorzystania. Polonica XXII-XXIII, s. 77-91, czwarty artykuł w serii czterech artykułów o Korpusie IPI PAN w Polonikach. (Wersja z 25 grudnia 2003).
- Piotr Bański. (2001). The proposed annotation scheme for the IPI PAN corpus. Prace IPI PAN 936, grudzień 2001.
- Łukasz Dębowski. (2001). Tagowanie i dezambiguacja morfosyntaktyczna. Przegląd metod i oprogramowania. (Tagging and morphosyntactic disambiguation. A review of methods and software.) Prace IPI PAN 934, listopad 2001. (Wersja poprawiona z 13 grudnia 2001.)
- Elżbieta Hajnicz i Anna Kupść. (2001). Przegląd analizatorów morfologicznych dla języka polskiego. Prace IPI PAN 937, grudzień 2001.
- Adam Przepiórkowski, Piotr Bański, Łukasz Dębowski, Elżbieta Hajnicz i Marcin Woliński. (2003). Konstrukcja korpusu IPI PAN. Polonica XXII-XXIII, s. 33-38, pierwszy artykuł w serii czterech artykułów o Korpusie IPI PAN w Polonikach. (Wersja z 25 marca 2003).
- Marcin Woliński i Adam Przepiórkowski. (2001). Projekt anotacji morfosyntaktycznej korpusu języka polskiego. Prace IPI PAN 938, grudzień 2001.
Niektóre publikacje cytujące Korpus IPI PAN i/lub system Poliqarp:
- Janusz S. Bień. (2006). Aparat pojęciowy wybranych systemów przetwarzania tekstów polskich. Biuletyn PTJ LXII, s. 19-30.
- Monika Czerepowicka. (2005). Opis lingwistyczny wyrażeń niestandardowych składniowo typu na lewo, do dziś, po trochu, na zawsze we współczesnym języku polskim. Rozprawa doktorska, Uniwersytet Warmińsko-Mazurski w Olsztynie.
- Jakub Fast i Adam Przepiórkowski. (2005). Automatic Extraction of Polish Verb Subcategorization: An Evaluation of Common Statistics. W: Zygmunt Vetulani (red.), Proceedings of the 2nd Language & Technology Conference, s. 191-195, Poznań.
- Anna Feldman, Jirka Hana i Chris Brew. (2006). Experiments in cross-language morphological annotation transfer. W: Alexander Gelbukh (red.), Proceedings of Computational Linguistics and Intelligent Text Processing, CICLing, Lecture Notes in Computer Science, Springer-Verlag.
- Bartłomiej Gaweł. (2004). Zastosowanie metod programowania genetycznego do oznaczania wyrazów w polskim tekście. Praca magisterska, Politechnika Wrocławska.
- Małgorzata Gębka-Wolak. (2004). Uwagi o konstrukacjach typu żeby+bezokolicznik. W: Andrzej Moroz i Marek Wiśniewski (red.), Studia z gramatyki i semantyki języka polskiego, Wydawnictwo Uniwersytetu Mikołaja Kopernika, Toruń.
- Marcin Gołębski. (2007). Indukcja reguł gramatyki języka polskiego. Rozprawa doktorska, Politechnika Warszawska.
- Iwona Łuczków. (2007). Polskie PRZY i ZA oraz rosyjskie ПРИ i ЗА jako wykładniki wyrażania równoczesności zdarzeń. Maszynopis, UMK, Toruń.
- Ивона Лучкув. (2007). Интернет как источник языкового материала для синтаксических исследований (на примере таксисных конструкций в русском и польском языках). Maszynopis, Ołomuniec.
- Paweł P. Mazur. (2005). Text segmentation in Polish. W: Proceedings of the Fifth International Conference on Intelligent Systems Design and Applications (ISDA 2005), 8-10 September 2005, Wrocław, Poland. IEEE Computer Society.
- Imke Mendoza. (2004). Nominaldetermination im Polnischen: Die primären Ausdrucksmittel. Praca habilitacyjna, Ludwig-Maximilians-Universität München.
- Roland Meyer. (2005). VP-Fronting in Czech and Polish -- A Case Study in Corpus-Oriented Grammar Research. W: S. Dipper, M. Götze i M. Stede (red.), Interdisciplinary Studies on Information Structure (ISIS), 2, s. 87-116, Universitätsverlag Potsdam.
- Radosław Moszczyński. (2006). Formal approaches to multiword lexemes. Praca magisterska, Uniwersytet Warszawski.
- Tomasz Obrębski. (2006). Searching Text Corpora with grep. W: Mieczysław A. Kłopotek, Sławomir T. Wierzchoń i Krzysztof Trojanowski (red.), Intelligent Information Processing and Web Mining: Proceedings of the International IIS: IIPWM´06 Conference held in Ustroń, Poland, June 19-22, 2006. Advances in Soft Computing, Springer.
- Maciej Piasecki. (2006). Hand-written and Automatically Extracted Rules for Polish Tagger. W: Proceedings of TSD 2006.
- Maciej Piasecki i Grzegorz Godlewski. (2006). Reductionistic, Tree and Rule Based Tagger for Polish. W: Mieczysław A. Kłopotek, Sławomir T. Wierzchoń i Krzysztof Trojanowski (red.), Intelligent Information Processing and Web Mining: Proceedings of the International IIS: IIPWM´06 Conference held in Ustroń, Poland, June 19-22, 2006. Advances in Soft Computing, Springer.
- Maciej Piasecki i Grzegorz Godlewski. (2006). Effective Architecture of the Polish Tagger. W: Proceedings of TSD 2006.
- Tadeusz Piotrowski. (2004). Komputerowe korpusy tekstowe polszczyzny. Materiały Zjazdu polonistów, Kraków.
- Adam Przepiórkowski. (2006). Frekwencja liter w polskich tekstach. Odpowiedź na zapytanie do poradni językowej PWN. ;-)
- Adam Przepiórkowski i Jakub Fast. (2005). Baseline Experiments in the Extraction of Polish Valence Frames. W: Mieczysław A. Kłopotek, Sławomir T. Wierzchoń i Krzysztof Trojanowski (red.), Intelligent Information Processing and Web Mining: Proceedings of the International IIS: IIPWM´05 Conference held in Gdansk, Poland, June 13-16, 2005, s. 511-520. Advances in Soft Computing, Springer.
- Zygmunt Saloni, Włodzimierz Gruszczyński, Marcin Woliński i Robert Wołosz. (2007). Słownik gramatyczny języka polskiego. Wiedza Powszechna, Warszawa.
- Szymon Słodowicz. (2005). The continuum of Polish propositional arguments. W: SAVS-Arbeitsberichte. Heft 4. Seminar für Allgemeine und Vergleichende Sprachwissenschaft. Kiel.
- Szymon Słodowicz. (2006). Inherent and structural control in Polish. W: Proceedings of the Sixth European Conference on Formal Description of Slavic Languages (FDSL-6).
- Jadwiga Stawnicka. (2007). Aspekt -- iteratywność -- określniki kwantyfikacyjne (na materiale form czasu przeszłego w języku polskim). Wydawnictwo Uniwersytetu Śląskiego, Katowice.
- Anna Stepowany. (2006). Wskaźniki frazeologiczne w funkcji dopowiedzeń potwierdzających we współczesnej polszczyźnie. Praca magisterska, Uniwersyt Śląski.
- Marek Świdziński. (2006). Lingwistyka korpusowa w Polsce -- źródła, stan, perspektywy. W: LingVaria 1/2006.
- Beata Trawiński. (2006). A Quantitative Approach to Preposition-Pronoun Contraction in Polish. W: Boban Arsenijević, Timothy Baldwin i Beata Trawiński (red.), Proceedings of the Third ACL-SIGSEM Workshop on Prepositions held at the EACL 2006 in Trento, Italy, 3 April 2006, s. 17-22.
- Beata Trawiński. (2006). Towards a Systematic Treatment of Polish Third Person Personal Pronouns. W: Proceedings of the Sixth European Conference on Formal Description of Slavic Languages (FDSL-6).
- Andrzej Wawrzyńczyk. (2006). Korpusy językowe. Tekstowe zasoby Internetu jako korpus. Wprowadzenie. Wydawnictwo TAKT, Warszawa.
- Dawid Weiss. (2005). Stempelator: A Hybrid Stemmer for the Polish Language. Raport techniczny RA-002/05, Instytut Informatyki, Politechnika Poznańska.
- Dawid Weiss. (2005). A Survey of Freely Available Polish Stemmers and Evaluation of Their Applicability in Information Retrieval. W: Zygmunt Vetulani (red.), Proceedings of the 2nd Language & Technology Conference, s. 216-221, Poznań.
- Mateusz Wiącek. (2006). Automatisches Part-of-Speech Tagging mit besonderer Berücksichtigung der Einsatzmöglichkeiten in einem TTS-System fürs Polnische. Studienarbeit, IMS, Stuttgart.
- Katarzyna Zarzycka. (2006). Выражение предшествования действий в русском и польском языках. Сложноподчиненные предложения с временной придаточной частью (Wyrażanie uprzedniości zdarzeń w języku rosyjskim i polskim. Zdania podrzędne czasowe). Praca magisterska, Instytut Filologii Słowiańskiej, Uniwersytet Wrocławski.
- Piotr Żmigrodzki, Agnieszka. Bielska-Brodziak, Zygmunt Tobor. (2007). Opis semantyczny leksemów w słowniku ogólnym i jego doniosłość prawna, artykuł wygłoszony na LXV Zjeździe PTJ, Katowice 2007.

