InterCorp a Universal Dependencies: nové možnosti výzkumu – část 1

Cílem workshopu je představit paralelní korpus InterCorp nové možnosti lingvistického výzkumu, které nabídne jeho připravovaná verze 16ud. Workshop se uskuteční v rámci teoreticko-metodologického semináře Ústavu českého jazyka a teorie komunikace FF UK a povedou ho dr. Olga Nádvorníková (Ústav románských studií FF UK) a dr. Alexandr Rosen (Ústav Českého národního korpusu). Jako host vystoupí také dr. Martin Stluka (Ústav Českého národního korpusu).

Workshop bude rozdělen do dvou částí:

V první části stručně představíme celý korpus, který v současné době obsahuje 62 jazyků (včetně češtiny), a vysvětlíme základní principy anotace a vyhledávání pomocí jednotného schématu Universal Dependencies (UD).

Ve druhé části se budeme věnovat možnostem využití takové anotace v pokročilejších dotazech a při generování statistik. Zaměříme se také na míry syntaktické komplexity a lexikální diverzity, nově uváděné v nejnovější verzi u jednotlivých vět a textů. Ukážeme si, jak je lze využít např. v kontrastivním nebo translatologickém výzkumu, ale i ve výzkumu vnitrojazykové variability textových typů (registrů) nebo ve výuce L1/L2.

Součástí workshopu bude také krátká prezentace projektu HiČKoK (Historie češtiny v korpusovém kontinuu), který počítá s jednotnou lingvistickou anotací češtiny napříč všemi obdobími v rámci schématu UD.

Účastníci mohou prostřednictvím formuláře předem zaslat dotazy a témata, která je zajímají, a v průběhu workshopu si vyhledávání v korpusu budou moci zkoušet rovnou na svých zařízeních. Účast bude možná i on-line, zájemce prosíme o registraci a vyplnění dotazníku.

Pozvánka na workshop.

Podrobnosti události

Začátek události
20. 3. 2024 15:50 - 17:25
Místo konání
FF UK, nám. Jana Palacha 1/2, místnost P104 (aula)
Webové stránky
shorturl.at/lmDY6
Organizátor
doc. Mgr. Radek Šimík, Ph.D.
Typ události
Workshop
Přílohy
pozvanka_ICUD