@AgaMaria to z nieba mi spadałaś! Męczę artykuł z przekładu i potrzebuję znaleźć jaką frekwencyjność ma np. słowo jednakowoż, aliści. Mąż używał do takich badań korpusu angielskiego, ale z polskim nie miałam nigdy do czynienia. Znalazłam kilka linków do korpusu polskiego w internecie, ale albo są zepsute albo źle szukam lub (co najbardziej prawdopodobne) nie potrafią na tym pracować. Masz może link do tego, którego Ty używasz i dostałabym krótki instruktarz? Czy to nie takie proste?
Przepraszam może wkleiłam za dużo. Spróbuj wpisać do google'a NKJP a potem wybierz z menu PELCRA demonstracyjny o wolnym dostępie. Ale frekwencji nie badałam... Ja po prostu przy moich badaniach składniowych patrzę, które konstrukcje są potwierdzane, a których korpus nie notuje i wtedy piszę "korpus takich struktur nie notuje"
Wygląda, że kontynuacja tego słownika jest tutaj pod podanym przez Hope linkiem. Mnie chodziło o ten słownik wydany w tzw. realu w 1990 r. (to taka rzeczywistość, która podobno istnieje poza światem internetowym):
"frek.bin.tar.bz2 — kolejna wersja korpusu Słownika frekwencyjnego polszczyzny współczesnej (Kurcz, Lewicki, Sambor, Szafran i Woronczak, 1990, Instytut Języka Polskiego PAN, Kraków). Korpus ten został stworzony w latach 60. ubiegłego stulecia i zawiera pół miliona słów — po 100 tys. słów z:"
Zajrzałam do wersji papierowej i jestem pod ogromnym podziwem mozolnej pracy ludzi, którym chciało się tworzyć korpus na piechotę w 1990. Praca jest bardzo przejrzysta i miło się z nią współpracuje, tylko... wolno. No i jednak chyba innych wyrazów się używało częściej 25 lat temu. Największą zaletą wydania książkowego jest to, że nie ma przerwy na drugie śniadanie, ani błędów serwera Bardzo dziękuję za pomoc!
@AgaMaria według tego co Joanna i Bronisław napisali znalazłam: Słownik frekwencyjny polszczyzny współczesnej / [aut.] Ida Kurcz [i in.] : Polska Akademia Nauk. Instytut Języka Polskiego. Tomy 1,2,3, Kraków : PAN. IJP, 1990.
Hmmm... ciekawe to co piszesz, no! Rzeczywiście fajnie to można wykorzystać
W powyższym cytacie z linkowanego tekstu jest przecież podane, że zbierano od lat 60. W obu tomach podano, że słownik opracowano na podstawie serii: Słownictwo współczesnego języka polskiego. Listy frekwencyjne, tom I, 1974, tom II 1974, tom III 1975, tom IV 1976, tom V 1977 oraz materiału z tomu Haliny Zgółkowej "Słownictwo współczesnej polszczyzny mówionej. Lista frekwencyjna i rangowa". W "Przedmowie" autorzy zaś piszą: "Rozpoczęcie prac nad słownikiem frekwencyjnym datuje się na rok 1967. Wtedy właśnie stenograf śp. Władysław Masłowski zwrócił się do Jadwigi Sambor i Jerzego Woronczaka z prośbą o przeprowadzenie analizy frekwencji słownictwa w próbie polskich tekstów o długości 100 000 słów". Muszę natomiast pogratulować odnalezienia 3 tomu. To prawdziwa "avis rara". Dotąd byłem przekonany, że istnieją dwa tomy (numeracja stron jest ciągła). W Bibliotece Narodowej w Warszawie też o nim nie słyszeli.
Zagalopowałam się, rzeczywiście są dwa tomy Przejrzałam jeden, ale w opacu wyszły mi 3 pozycje i nie zauważyłam, że druga i trzecia to to samo ^:)^
Przyznam, że chyba nie spotkałam się z nazwiskiem Pani Sambor wcześniej. Na swoje usprawiedliwienie mam tylko to, że jestem na początku drogi naukowej, a moją specjalnością jest j. rosyjski. Z chęcią zapoznam się z życiorysem tej Pani
Czytam to i łezka mi się trochę kręci w oku... Po urodzeniu drugiej córki włąśnie podjęłam decyzję, że przerywam doktorat z językoznawstwa...@AgaMaria, a Ty jak to robiłaś? Miałaś dzieci i dawałaś radę?
@Jutka dzieci nie mam. To forum mnie przygarnęło. :x Doktorat jako panna samotna, przeżywająca niewypełniające się powołanie z wieloma rozterkami Habilitację już spokojniej przy mężu za to po perypetiach zdrowotnych.
@Hope mnie się wydaje, że korpus zrównoważony daje takie bardziej uładzone zdania. Jeśli zależy Ci na większej frekwencji i większej "autentyczności" zdań, to wzięłabym cały. Ale tam są też jakieś urwane, trochę niegramatyczne zdania na przykład z netu...
Napiszę Ci, że jakoś tak nie badałam tego korpusu. Bo zwykle szukam po prostu potwierdzenia danych struktur gramatycznych...
Komentarz
http://www.nkjp.uni.lodz.pl/index_adv.jsp?query=uczłowiecza&Submit= SZUKAJ &span=0&preserve_order=true&perpage=100&sort=srodek&second_sort=srodek&groupBy=---&groupByLimit=1&m_style=---&m_channel=---&m_date_from=RRRR&m_date_to=RRRR&m_nkjpSubcorpus=balanced&m_title_mono=&m_title_mono_NOT=&m_paragraphKWs_MUST=&m_paragraphKWs_MUST_NOT=&m_text_title=&dummystring=ąĄćĆęĘłŁńŃóÓśŚźŹżŻ
Ale frekwencji nie badałam...
Ja po prostu przy moich badaniach składniowych patrzę, które konstrukcje są potwierdzane, a których korpus nie notuje i wtedy piszę "korpus takich struktur nie notuje"
Czy ten słownik to to co wyskakuje pod tym adresem: http://korpus.pl/index.php?page=download
bo czego nie spróbuję tam wybrać to mi nie działa - wyskakuje błąd.
Wygląda, że kontynuacja tego słownika jest tutaj pod podanym przez Hope linkiem. Mnie chodziło o ten słownik wydany w tzw. realu w 1990 r. (to taka rzeczywistość, która podobno istnieje poza światem internetowym):
"frek.bin.tar.bz2 — kolejna wersja korpusu Słownika frekwencyjnego polszczyzny współczesnej (Kurcz, Lewicki, Sambor, Szafran i Woronczak, 1990, Instytut Języka Polskiego PAN, Kraków). Korpus ten został stworzony w latach 60. ubiegłego stulecia i zawiera pół miliona słów — po 100 tys. słów z:"
No i jednak chyba innych wyrazów się używało częściej 25 lat temu.
Największą zaletą wydania książkowego jest to, że nie ma przerwy na drugie śniadanie, ani błędów serwera
Bardzo dziękuję za pomoc!
Hmmm... ciekawe to co piszesz, no! Rzeczywiście fajnie to można wykorzystać
https://pl.wikipedia.org/wiki/Jadwiga_Sambor
A "Słownik frekwencyjny" wspomniano nawet w jednym z nekrologów.
Bardzo pozytywna Osoba.
Przyznam, że chyba nie spotkałam się z nazwiskiem Pani Sambor wcześniej. Na swoje usprawiedliwienie mam tylko to, że jestem na początku drogi naukowej, a moją specjalnością jest j. rosyjski. Z chęcią zapoznam się z życiorysem tej Pani
Doktorat jako panna samotna, przeżywająca niewypełniające się powołanie z wieloma rozterkami
Habilitację już spokojniej przy mężu za to po perypetiach zdrowotnych.
A z czego miałaś pisać?
Może wrócisz?
Ale tam są też jakieś urwane, trochę niegramatyczne zdania na przykład z netu...
Napiszę Ci, że jakoś tak nie badałam tego korpusu. Bo zwykle szukam po prostu potwierdzenia danych struktur gramatycznych...