Předmět: Úvod do počítačové lingvistiky

» Seznam fakult » FM » ITE
Název předmětu Úvod do počítačové lingvistiky
Kód předmětu ITE/PLI
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Magisterský
Rok studia nespecifikován
Semestr Letní
Počet ECTS kreditů 5
Vyučovací jazyk Čeština
Statut předmětu Povinný, Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Červa Petr, doc. Ing. Ph.D.
Obsah předmětu
Stručná anotace předmětu: Předmět je úvodem do problematiky počítačové lingvistiky respektive obecněji do problematiky efektivního zpracování textů na počítači. Kromě moderních skriptovacích programovacích jazyků (např. Perl) se studenti seznámí se základními metodami formálního popisu přirozené jazyka, technikami jeho statistického zpracování, značkování a syntaktické analýzy, a také praktickými aspekty souvisejícími s používáním regulárních výrazů pro vyhledávání a zpracování textů. Získané kompetence: Studenti budou mít možnost uplatnit získané praktické a i teoretické znalosti v celé řadě aplikací, kde je nutné zpracovávat na počítači přirozený (psaný) jazyk například pomocí regulárních výrazů nebo jazykových modelů, provádět jeho značkování či syntaktickou analýzu a efektivně nakládat s textem (např. pomocí skriptovacího jazyka Perl). Témata přednášek: Základy Perlu jako typického představitele jazyka vhodného pro počítačové zpracování textů. Praktické aspekty regulárních výrazů a jejich použití pro práci s textem v nejrozšířenějších programech a programovacích jazycích. Počítačová lingvistika, vymezení oboru, definice základních pojmů a základních úloh. Připomenutí základních pojmů z teorie pravděpodobnosti a statistiky. Základní metody statistického modelování přirozeného jazyka a jejich využití např. v oblasti počítačového zpracování řeči. Vysvětlení základních pojmů z oblasti lingvistiky a popis základních metod formálního popisu přirozeného jazyka (gramatiky). Princip metod automatického značkování textu (tagging) a jeho syntaktické analýzy (parsing). Základní principy systémů pro strojový překlad jazyků. Náplň cvičení: Cvičení budou navazovat na jednotlivé přednášky a jejich obsahem bude praktické ověřování a testování přednesených metod na konkrétních úlohách pomocí jazyka Perl. V rámci cvičení tak bude prováděno například: vyhledávání v textech pomocí regulárních výrazů, práce s asociativními poli (hash funkce), měření vzájemné podobnosti dvou textů (např. pro účely odhalování plagiátorství), tvorba slovních tříd a jazykových modelů pro účely rozpoznávání mluvené řeči a jazyka daného textu apod.

Studijní aktivity a metody výuky
Monologický výklad (přednáška, prezentace, vysvětlování)
  • Účast na výuce - 40 hodin za semestr
Výstupy z učení
Předmět je úvodem do problematiky počítačové lingvistiky respektive obecněji do problematiky efektivního zpracování textů na počítači. Kromě skriptovacích programovacích jazyků (např. Perl) se studenti seznámí se základními metodami formálního popisu přirozené jazyka, technikami jeho statistického zpracování, značkování a syntaktické analýzy, a také praktickými aspekty souvisejícími s používáním regulárních výrazů pro vyhledávání a zpracování textů.
Teoretické poznatky a praktické dovednosti z požadované oblasti
Předpoklady
Nejsou žádné podmínky registrace

Hodnoticí metody a kritéria
Kombinovaná zkouška, Písemná zkouška

Doporučená literatura
  • Hobson Lane, Cole Howard, Hannes Hapke. Natural Language Processing in Action. 2019. ISBN 9781617294631.
  • Satrapa P. Perl pro zelenáče, Neokortex..


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Fakulta mechatroniky, informatiky a mezioborových studií Studijní plán (Verze): Informační technologie (2013) Kategorie: Informatické obory 2 Doporučený ročník:2, Doporučený semestr: Letní