Vyučující
|
-
Červa Petr, doc. Ing. Ph.D.
-
Šafařík Radek, Ing.
-
Žďánský Jindřich, Ing. Ph.D.
-
Kynych František, Ing.
|
Obsah předmětu
|
Témata přednášek: 1. Úvod do problematiky, vizualizace dat 2. Analýza a vytěžování textu 3. Vektorový model, TF transformace 4. Systémy vytěžování textu 5. Pravděpodobnostní a statistické vytěžovací modely 6. Zpětná vazba pro vytěžování textu, vyhledávání na webu 7. Hodnocení dokumentů, doporučovací systémy 8. Analýza přirozeného jazyka 9. Syntagmatické vztahy 10. Analýza tématu 11. Shlukování a kategorizace textu 12. Analýza sentimentu 13. Vytěžování kontextu 14. Vyhledávání vzorů Cvičení: Navazují na jednotlivé přednášky, náplní je implementace jednotlivých probíraných algoritmů.
|
Studijní aktivity a metody výuky
|
Monologický výklad (přednáška, prezentace, vysvětlování), Samostatná práce studentů (studium textů, literatury, problémové úkoly,výzkum, pisemná práce)
|
Výstupy z učení
|
Cílem výuky je seznámit studenty se základními metodami pro zpracování, vytěžování a analýzu dat, které se využívají v celé řadě různých praktických aplikací. Jde například o úlohu hodnocení dokumentu, klasifikaci textu podle tématu, analýzu sentimentu atd.
Studenti získají teoretické i praktické znalosti využitelné při řešení všech úloh, kde je třeba vizualizovat, analyzovat a vytěžovat různá (zejména textová) data.
|
Předpoklady
|
Předpokládají se základní znalosti v oblasti strojové učení a schopnost algoritmizace úloh.
|
Hodnoticí metody a kritéria
|
Kombinovaná zkouška
|
Doporučená literatura
|
-
BERKA, Petr. Dobývání znalostí z databází. 2003. ISBN 80-200-1062-.
|