Szukam polonisty

Czy jest tu może polonista, który pracował na korpusie języka polskiego?

Komentarz

  • @Hope z korpusu języka polskiego czasem korzystam do zbierania danych (jestem językoznawcą). A jakiej pomocy potrzebujesz?
  • edytowano wrzesień 2015
    @AgaMaria to z nieba mi spadałaś! Męczę artykuł z przekładu i potrzebuję znaleźć jaką frekwencyjność ma np. słowo jednakowoż, aliści. Mąż używał do takich badań korpusu angielskiego, ale z polskim nie miałam nigdy do czynienia. Znalazłam kilka linków do korpusu polskiego w internecie, ale albo są zepsute albo źle szukam lub (co najbardziej prawdopodobne) nie potrafią na tym pracować. Masz może link do tego, którego Ty używasz i dostałabym krótki instruktarz? Czy to nie takie proste?
  • Przepraszam może wkleiłam za dużo. Spróbuj wpisać do google'a NKJP a potem wybierz z menu PELCRA demonstracyjny o wolnym dostępie.
    Ale frekwencji nie badałam...
    Ja po prostu przy moich badaniach składniowych patrzę, które konstrukcje są potwierdzane, a których korpus nie notuje i wtedy piszę "korpus takich struktur nie notuje"
  • @AgaMaria bardzo dziękuję za pomoc, przeszukam ten korpus, do którego wkleiłaś link, do tego nie udało mi się wcześniej dotrzeć :)
  • Nie ma sprawy. Cieszę się, jeśli się przyda. Zmykam do pracy...
  • Bardzo ciekawą pozycją jest "Słownik frekwencyjny polszczyzny współczesnej".
  • @Joanna i Bronisław
    Czy ten słownik to to co wyskakuje pod tym adresem: http://korpus.pl/index.php?page=download
    bo czego nie spróbuję tam wybrać to mi nie działa - wyskakuje błąd.
  • Nie wiem, czy to to, ale jakąś godzinę temu strona z korpusem przestała działać...może mają przerwę techniczną?
  • Mają przerwę na drugie śniadanie.

    Wygląda, że kontynuacja tego słownika jest tutaj pod podanym przez Hope linkiem. Mnie chodziło o ten słownik wydany w tzw. realu w 1990 r. (to taka rzeczywistość, która podobno istnieje poza światem internetowym):

    "frek.bin.tar.bz2 — kolejna wersja korpusu Słownika frekwencyjnego polszczyzny współczesnej (Kurcz, Lewicki, Sambor, Szafran i Woronczak, 1990, Instytut Języka Polskiego PAN, Kraków). Korpus ten został stworzony w latach 60. ubiegłego stulecia i zawiera pół miliona słów — po 100 tys. słów z:"
  • Zajrzałam do wersji papierowej i jestem pod ogromnym podziwem mozolnej pracy ludzi, którym chciało się tworzyć korpus na piechotę w 1990. Praca jest bardzo przejrzysta i miło się z nią współpracuje, tylko... wolno.
    No i jednak chyba innych wyrazów się używało częściej 25 lat temu.
    Największą zaletą wydania książkowego jest to, że nie ma przerwy na drugie śniadanie, ani błędów serwera ;)
    Bardzo dziękuję za pomoc!
  • @Hope daj dane bibliograficzne tego wydania papierowego proszę
  • A, i zawsze możesz zrobić porównanie polszczyzna w 1990 i teraz
  • @AgaMaria według tego co Joanna i Bronisław napisali znalazłam: Słownik frekwencyjny polszczyzny współczesnej / [aut.] Ida Kurcz [i in.] : Polska Akademia Nauk. Instytut Języka Polskiego. Tomy 1,2,3, Kraków : PAN. IJP, 1990.

    Hmmm... ciekawe to co piszesz, no! Rzeczywiście fajnie to można wykorzystać :)
  • Wydali w 1990, to zbierali pewnie przez całe lata 80. te zwłaszcza w dobie przedkomputerowej.
  • W powyższym cytacie z linkowanego tekstu jest przecież podane, że zbierano od lat 60. W obu tomach podano, że słownik opracowano na podstawie serii: Słownictwo współczesnego języka polskiego. Listy frekwencyjne, tom I, 1974, tom II 1974, tom III 1975, tom IV 1976, tom V 1977 oraz materiału z tomu Haliny Zgółkowej "Słownictwo współczesnej polszczyzny mówionej. Lista frekwencyjna i rangowa". W "Przedmowie" autorzy zaś piszą: "Rozpoczęcie prac nad słownikiem frekwencyjnym datuje się na rok 1967. Wtedy właśnie stenograf śp. Władysław Masłowski zwrócił się do Jadwigi Sambor i Jerzego Woronczaka z prośbą o przeprowadzenie analizy frekwencji słownictwa w próbie polskich tekstów o długości 100 000 słów". Muszę natomiast pogratulować odnalezienia 3 tomu. To prawdziwa "avis rara". Dotąd byłem przekonany, że istnieją dwa tomy (numeracja stron jest ciągła). W Bibliotece Narodowej w Warszawie też o nim nie słyszeli.
  • A w ogóle ta dyskusja przypomniała mi Ś. + P. prof. Jadwigę Sambor. Znaliście? Pamiętacie?

    https://pl.wikipedia.org/wiki/Jadwiga_Sambor

    A "Słownik frekwencyjny" wspomniano nawet w jednym z nekrologów.
  • Panią Profesor Jadwigę Sambor znałam osobiście. Raz nawet zabrała głos w ramach dyskusji po moim skromnym referacie...
    Bardzo pozytywna Osoba.
  • Zagalopowałam się, rzeczywiście są dwa tomy :) Przejrzałam jeden, ale w opacu wyszły mi 3 pozycje i nie zauważyłam, że druga i trzecia to to samo ^:)^

    Przyznam, że chyba nie spotkałam się z nazwiskiem Pani Sambor wcześniej. Na swoje usprawiedliwienie mam tylko to, że jestem na początku drogi naukowej, a moją specjalnością jest j. rosyjski. Z chęcią zapoznam się z życiorysem tej Pani :)
  • Czytam to i łezka mi się trochę kręci w oku... Po urodzeniu drugiej córki włąśnie podjęłam decyzję, że przerywam doktorat z językoznawstwa...@AgaMaria, a Ty jak to robiłaś? Miałaś dzieci i dawałaś radę?
  • @Jutka dzieci nie mam. To forum mnie przygarnęło. :x :D
    Doktorat jako panna samotna, przeżywająca niewypełniające się powołanie z wieloma rozterkami
    Habilitację już spokojniej przy mężu za to po perypetiach zdrowotnych.

    A z czego miałaś pisać?
    Może wrócisz?
  • @AgaMaria ja znów się zwrócę z pytaniem, podczas wyszukiwania wyrazów lepiej używać opcji korpus zrównoważony czy cały? Jaka jest między nimi różnica?
  • @Hope mnie się wydaje, że korpus zrównoważony daje takie bardziej uładzone zdania. Jeśli zależy Ci na większej frekwencji i większej "autentyczności" zdań, to wzięłabym cały.
    Ale tam są też jakieś urwane, trochę niegramatyczne zdania na przykład z netu...

    Napiszę Ci, że jakoś tak nie badałam tego korpusu. Bo zwykle szukam po prostu potwierdzenia danych struktur gramatycznych...
  • Rozumiem, mi bardziej chodzi o pełne wypowiedzi, więc dziękuję za podpowiedź :)
Aby napisać komentarz, musisz się zalogować lub zarejestrować.