Předmět: Data mining

» Seznam fakult » EF » KIN
Název předmětu Data mining
Kód předmětu KIN/DMI
Organizační forma výuky Přednáška + Seminář
Úroveň předmětu Magisterský
Rok studia nespecifikován
Semestr Letní
Počet ECTS kreditů 5
Vyučovací jazyk Čeština
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Podaras Athanasios, Ing. Ph.D.
  • Lamr Marián, Ing. Ph.D.
Obsah předmětu
1. Proces získávání znalostí - historie, vymezení cílů, přehled metodologií. 2. Dělení dataminingových úloh, představení typických úloh. 3. Příprava dat, porozumění datům, popis datové množiny, příprava datové matice, výběr dat a jejich čištění, konstrukce a slučování datových zdrojů, typová homogenita, formátování dat. 4. Asociační algoritmy - hledání asociačních pravidel, model Apriori, Carma, statistiky implikací, predikční model. 5. Odhalování podvodů - fraud úlohy, kreditní riziko, behaviorální skórování pro hodnocení rizikovosti splácených úvěrů. 6. Klasifikační algoritmy jako nástroje predikce vycházející z historických dat. Rozhodovací stromy, algoritmy C&RT, C5.0, CHAID, QUEST. Převod stromu na pravidla, prořezávání stromů. 7. Diskriminační analýza - klasifikace případů do tříd, skórování. 8. Segmentační algoritmy - odhalení neobvyklých struktur v datech nasazením algoritmů seskupování K-Means, DBSCAN, Anomaly. 9. Základy využití neuronových sítí pro zpracování kategorizovaných i číselných proměnných, použití v případech, kdy klasické lineární metody neposkytují očekávané výsledky. 10. Analýza a predikce časových řad pomocí modelů DM, příprava dat, doplnění chybějících hodnot, diference, sezónní diference, klouzavé průměry a mediány, vyhlazování časových řad. 11. Modelování a evaluace řešení, zavádění DM řešení do praxe, zařazení skórovacích procesů do rozhodovacího firemního workflow. 12. Web Mining 13. Text Mining. 14. Nové trendy v Data Miningu. 1. Základy práce S IBM SPSS Modeler, importy dat, porozumění datům. 2. Příprava datové matice, manipulace s daty, datový audit. 3. Open-source dataminingové nástroje. 4. Asociačních pravidla pro analýzu nákupního koše. 5. Detekce podvodných žádostí - fraud. 6. Prevence praní špinavých peněz. 7. Klasifikační úlohy. 8. Segmentace zákazníků. 9. Skórování kreditního rizika, evaluace v dataminingových úlohách. 10. Predikce chování zákazníků. 11. Obhajoby semestrálních prací

Studijní aktivity a metody výuky
Přednáška, Cvičení
Výstupy z učení
Cílem předmětu je seznámit studenty s moderními dataminingovými nástroji a s typickými dataminingovými úlohami, prezentovány jsou vybrané algoritmy využívané v nástrojích pro získávání znalostí na základě dat. Na seminářích jsou představeny vybrané softwarové nástroje pro analýzu dat a vyhledávání skrytých informací, znalostí a vzorů chování v datech různého typu. Použity jsou rozsáhlé soubory různorodých reálných dat, úlohy jsou řešeny v prostředí IBM SPSS Modeler a dalších open source dataminingových nástrojích.

Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
Ústní zkouška, Písemná zkouška

Zápočet: Aktivní účast na cvičeních, zpracování a obhajoba semestrálního projektu. Zkouška: písemná a ústní část
Doporučená literatura
  • HAN, Jiawei. a Micheline. KAMBER, 2012. Data mining: concepts and techniques. 3rd ed.. Burlington, MA: Elsevier., 2012. ISBN 9780123814791.
  • HOFMANN, Markus a Ralf. KLINKENBERG. RapidMiner: Data Mining Use Cases and Business Analytics Applications.. Florida: Taylor & Francis Group., 2013. ISBN 9781482205497.
  • PETR, Pavel. Metody Data Miningu.. Pardubice: Univerzita Pardubice, 2014. ISBN 9788073958732.
  • SHMUELI, Galit, Peter C. BRUCE, Mia L. STEPHENS a Nitin R. PATEL. Data mining for business analytics: concepts, techniques, and applications in JMP Pro. 1.. Canada: WILEY, 2016. ISBN 978-1-118-87743-2.
  • WENDLER, Tilo a Sören GRÖTTRUP. Data mining with SPSS modeler: theory, exercises and solutions. 1. Switzerland: Springer, 2016. ISBN 978-3-319-28707-2.
  • WITTEN, I. H. a Frank EIBE. Data mining: practical machine learning tools and techniques:Fourth Edition. Cambrige, 2017. ISBN 9780128042915.


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr