Vyučující
|
-
Červa Petr, doc. Ing. Ph.D.
|
Obsah předmětu
|
Stručná anotace předmětu: Předmět je úvodem do problematiky počítačové lingvistiky respektive obecněji do problematiky efektivního zpracování textů na počítači. Kromě moderních skriptovacích programovacích jazyků (např. Perl) se studenti seznámí se základními metodami formálního popisu přirozené jazyka, technikami jeho statistického zpracování, značkování a syntaktické analýzy, a také praktickými aspekty souvisejícími s používáním regulárních výrazů pro vyhledávání a zpracování textů. Získané kompetence: Studenti budou mít možnost uplatnit získané praktické a i teoretické znalosti v celé řadě aplikací, kde je nutné zpracovávat na počítači přirozený (psaný) jazyk například pomocí regulárních výrazů nebo jazykových modelů, provádět jeho značkování či syntaktickou analýzu a efektivně nakládat s textem (např. pomocí skriptovacího jazyka Perl). Témata přednášek: Základy Perlu jako typického představitele jazyka vhodného pro počítačové zpracování textů. Praktické aspekty regulárních výrazů a jejich použití pro práci s textem v nejrozšířenějších programech a programovacích jazycích. Počítačová lingvistika, vymezení oboru, definice základních pojmů a základních úloh. Připomenutí základních pojmů z teorie pravděpodobnosti a statistiky. Základní metody statistického modelování přirozeného jazyka a jejich využití např. v oblasti počítačového zpracování řeči. Vysvětlení základních pojmů z oblasti lingvistiky a popis základních metod formálního popisu přirozeného jazyka (gramatiky). Princip metod automatického značkování textu (tagging) a jeho syntaktické analýzy (parsing). Základní principy systémů pro strojový překlad jazyků. Náplň cvičení: Cvičení budou navazovat na jednotlivé přednášky a jejich obsahem bude praktické ověřování a testování přednesených metod na konkrétních úlohách pomocí jazyka Perl. V rámci cvičení tak bude prováděno například: vyhledávání v textech pomocí regulárních výrazů, práce s asociativními poli (hash funkce), měření vzájemné podobnosti dvou textů (např. pro účely odhalování plagiátorství), tvorba slovních tříd a jazykových modelů pro účely rozpoznávání mluvené řeči a jazyka daného textu apod.
|
Studijní aktivity a metody výuky
|
Monologický výklad (přednáška, prezentace, vysvětlování)
- Účast na výuce
- 40 hodin za semestr
|
Výstupy z učení
|
Předmět je úvodem do problematiky počítačové lingvistiky respektive obecněji do problematiky efektivního zpracování textů na počítači. Kromě skriptovacích programovacích jazyků (např. Perl) se studenti seznámí se základními metodami formálního popisu přirozené jazyka, technikami jeho statistického zpracování, značkování a syntaktické analýzy, a také praktickými aspekty souvisejícími s používáním regulárních výrazů pro vyhledávání a zpracování textů.
Teoretické poznatky a praktické dovednosti z požadované oblasti
|
Předpoklady
|
Nejsou žádné podmínky registrace
|
Hodnoticí metody a kritéria
|
Kombinovaná zkouška, Písemná zkouška
|
Doporučená literatura
|
-
Hobson Lane, Cole Howard, Hannes Hapke. Natural Language Processing in Action. 2019. ISBN 9781617294631.
-
Satrapa P. Perl pro zelenáče, Neokortex..
|