Hapax legomenon

Z Encyklopedie lingvistiky
Přejít na: navigace, hledání

Hapax legomenon můžeme jednoduše definovat jako slovo, které se v rámci konkrétního textu či korpusu textů vyskytuje pouze jedenkrát.

Obsah

Obecná charakteristika

Pojem hapax legomenon označuje slovo, resp. slovní tvar, který se vyskytuje v textu (v mluveném či psaném projevu) pouze jedenkrát. Hapax legomena se – vzhledem k nedostatečným dokladům o jejich původu – zpravidla nevyskytují ve slovnících (Lotko 2005, 44). Nejčastější výskyt hapax legomenon je spojen zejména s malokorpusovými jazyky, jejich výskyt je však doložitelný i u ostatních jazyků (Karlík 2002). V jazyce se kromě slovního spojení hapax legomenon můžeme setkat ještě s pojmy jako dis legomenon, tris legomenon a tetrakis legomenon. Tato označení (dis, tris, tetrakis) odpovídají četnosti výskytu daného slova v textu, tato násobná označení nejsou však tolik užívána.
Výskyt hapax legomen ovlivňují následující faktory: délka textu, tematická bohatost textu, publikum, pro které je text určen, a časové období, v němž byl text vytvořen. Jako příklady hapax legomen uvádí Encyklopedický slovník češtiny např. výrazy: (ze staroslověnštiny) povslún, posvázanie; (ze slovníků Klaretovy družiny') posvěcen/posviecan, požlát; (z Rukopisu královédvorského) pietný, jarohlavý, dlúhopustý (2002, 163).

Historie pojmu

Původ slova hapax legomenon je transliterací řeckého ἅπαξ λεγόμενον, což je možné přeložit jako „řečený pouze jednou“. Výskyt hapax legomenon ve starší literatuře je obtížněji zjistitelný, jelikož máme k dispozici jen omezený počet dochovaných textů; je tedy pravděpodobné, že některá slova nacházející se ve starší literatuře považujeme za hapaxy nenáležitě, z důvodu nedostatečné evidence. Dodnes existuje např. spousta nerozluštěných hebrejských slov. Vysoký výskyt hapax legomenon je spojen s Biblí, ve Starém zákoně je přibližně 400 slov považováno za přímá vyjádření hapax legomen (The Jewish Encyclopedia, 226).

Hapax legomenon a autorství

Znalost hapax legomenon by bylo možné využít při určování autorství psaných děl, jelikož výskyt hapaxů bývá spjat s určitým dílem či částí autorské tvorby. Konkrétním příkladem může být dramatická tvorba Williama Shakespeara obsahující v celé své šíři přibližně stejné procentuální zastoupení hapax legomen.

Hapax legomenon a frekvence výskytu

Hapax legomena nejsou jen jakousi statistickou náhodou, přestože mohou být snadno určována pomocí matematických pravidel jazyka. Tak fenomén hapax legomenon existuje ruku v ruce se Zipfovým zákonem, který říká, že relativní pořadí slova v textu a jeho frekvence je konstantní.
Čili platí r*f = c (slovo s největší četností se vyskytuje v textu dvakrát častěji než druhé nejčastější slovo, třikrát častěji než třetí, čtyřikrát častěji než čtvrté. Řada by takto pokračovala donekonečna). V závislosti na tvaru křivky, která je Zipfovým zákonem popisována, zjistíme, že značná část slov v korpusu se vyskytuje právě pouze jednou, jedná se tedy o hapax legomena. Ačkoli výskyt konkrétního hapaxu v určitém textu nelze očekávat příliš často, možnost výskytu blíže neurčeného hapax legomena je poměrně vysoká.
Frekvence hapax legomen souvisí s typem jazyka; jazyky syntetické obsahují vyšší počet hapax legomen než jazyky analytické. To je dáno skutečností, že analytické jazyky tvoří méně slovních forem, je u nich tedy větší šance, že dojde k opakování jednotlivých tvarů (Popescu et al. 2009, 99).
.

Hapax legomenon a bohatost slovní zásoby

Bohatství textu je charakterizováno všemi slovními tvary kromě pomocných sloves. V praxi lze hapax legomen užít právě k měření bohatosti slovní zásoby. Ovšem v případě, že slovní tvary nejsou lemmatizovány, charakterizují spíše bohatost forem v určitém jazyce. Jinými slovy, užití hapax legomen má své opodstatnění spíše při určování syntetičnosti či analytičnosti konkrétního jazyka. V homogenních textech střední délky tak hapaxy fungují spíše jako indikátory pozice daného jazyka na škále syntetických–analytických jazyků (Popescu 2009, 99).

Hapax legomenon a strojové zpracování jazyka

Výskyt hapax legomen v textu značně komplikuje možnosti automatického zpracování přirozeného jazyka a ztěžuje strojům možnost porozumět textu.
„Hapax legomenon společně s dalšími vzácnými jazykovými jevy tvoří zajímavý problém pro aplikace tvořené na základě korpusů: kvůli nízké frekvenci jejich výskytu neposkytují dostatečná data pro aplikace, jako je srovnávání jazyků nebo strojový překlad.“ („Hapax legomenon and other so called rare events present an interesting problem for corpus based applications: due to their low frequency, they fail to provide enough statistical data for applications like word alignment or statistical machine translation.“) (Shrader 2006)

Hapax legomenon vs. nonce word

Výraz „nonce word“ lze přeložit jako „záměrné slovo“. Zatímco hapax legomenon vypovídá o určitém textu, nikoli o původu slova nebo o jeho četnosti užívání v řeči, nonce word je utvořeno speciálně pro určitou příležitost či situaci. Oba pojmy tak stojí ve vzájemném napětí. Přesto v některých výkladech mohou oba termíny splývat; např. v díle Encyklopedia jazykovědy chápe Jozef Mistrik (1993, 165) hapax legomenon podobně jako nonce word, tedy jako výraz, který „slouží například k ozvláštnění jazykových prostředků v uměleckém díle“. Tuto tendenci k synonymnímu užívání obou pojmů lze pozorovat především v uměleckých a publicistických textech.

Bibliografie

  • Bachmannová, Jarmila et al. 2002. Encyklopedický slovník češtiny. Praha: Nakladatelství Lidové noviny.
  • Lotko, Edward. 2005. Slovník lingvistických termínů pro filology. Olomouc: Univerzita Palackého v Olomouci.
  • Mistrik, Jozef. 1993. Encyklopedia jazykovědy. Bratislava: Obzor.
  • Popescu, Ioan-Iovitz a Gabriel Altmann. 2006. „Some Aspects of Word Frequencies.“ Glottometrics 13.
  • Popescu, Ioan-Iovitz a Gabriel Altmann. 2008. „Zipf´s Mean and Language Typology.“ Glottometrics 16.
  • Popescu, Ioan-Iovitz, Ján Mačutek a Gabriel Altmann. 2009. „Aspects of Word Frequencies.“ In Studies of Quantitative Linguistics 3. Lüdenscheid: RAM-Verlag.
  • Schrader, Bettina. 2006. „How Does Morphological Complexity Translate? A Cross-linguistic Case Study for Word Alignment.“ Předneseno na Tübingen International Conference on Linguistic Evidence.
  • The Jewish Encyklopedia, Vol. 6. 1904. New York and London: Funk and Wagnalls Company.


Autorka hesla


Ivana Varjassyová (2014)


Garanti hesla


Radek Čech a Petra Martinková


Jak citovat heslo „Hapax legomenon“


Varjassyová, Ivana. 2014. „Hapax legomenon.“ Encyklopedie lingvistiky, ed. Kateřina Prokopová. Olomouc: Univerzita Palackého v Olomouci. http://oltk.upol.cz/encyklopedie/index.php5/Hapax_legomenon

Osobní nástroje
Jmenné prostory
Varianty
Akce
Navigace
Nástroje