| 
        Vyučující
     | 
    
        
            
                - 
                    Tyl Pavel, Ing.
                
 
            
                - 
                    Lamr Marián, Ing. Ph.D.
                
 
            
         
     | 
    | 
        Obsah předmětu
     | 
    
        Přednášky: 1.Data a jejich zpracování  typy dat, shromažďování dat, databáze a datové sklady. Importy a exporty dat 2.Proces dobývání znalostí z rozsáhlých datových struktur  historie, vymezení cílů, přehled metodologií 3.Dělení dataminingových úloh, představení typických úloh4 4.Příprava dat, porozumění datům, popis datové množiny, příprava datové matice, výběr dat a jejich čištění, konstrukce a slučování datových zdrojů, typová homogenita, formátování dat 5.Klasifikační algoritmy jako nástroje predikce vycházející z historických dat. Rozhodovací stromy, algoritmy C&RT, C5.0, CHAID&QUEST. Převod stromu na pravidla, prořezávání stromů 6.Diskriminační analýza  klasifikace případů do tříd, skórování. 7.Segmentační algoritmy  odhalení neobvyklých struktur v datech nasazením algoritmů seskupování K-Means, Two Step, Anomaly. 8.Asociační algoritmy  hledání asociačních pravidel, model Apriori, Carma, statistiky implikací, predikční model 9.- 10. Základy neuronových sítí pro zpracování kategorizovaných i číselných proměnných, použití v případech, kdy klasické lineární metody neposkytují očekávané výsledky 10. 14.  Modelování a evaluace řešení, zavádění DM řešení do praxe, zařazení skórovacích procesů do rozhodovacího firemního workflow. Analýza aktuálního stavu podpory rozhodování moderními počítačovými prostředky a jejich budoucnost  Cvičení:  1.2. Zpracování a vizualizace dat v SPSS Modeleru a další jeho ovládací prvky, případně srovnání s jiným Open source SW 3.9. Příprava modelů pro případové studie, jejich analýza a interpretace výsledků  na vzorové studie bude navazovat jejich modifikace v několika samostatných zadáních. Aplikace DM algoritmů bude diskutována a studovaná na úlohách typu:  doporučení léčebné metody na základě biomedicínckých dat,  klasifikace v biologických a fyzikálních datech,  monitorování zkušebního provozu a predikce selhání stroje - přístroje 9.12. Samostatná individuální práce 13.14. Obhajoby individuálních prací 
         
         
     | 
    | 
        Studijní aktivity a metody výuky
     | 
    
        
        Monologický výklad (přednáška, prezentace, vysvětlování), Samostatná práce studentů (studium textů, literatury, problémové úkoly,výzkum, pisemná práce), Demonstrace dovedností studentů
        
            
                    
                
                    
                    - Domácí příprava na výuku
                        - 56 hodin za semestr
                    
 
                
                    
                    - Semestrální práce
                        - 20 hodin za semestr
                    
 
                
             
        
        
     | 
    
    
        
        
            | 
                Výstupy z učení
             | 
        
        
            
                
                Student se naučí řešit podporu složitých rozhodovacích úloh v především v medicíně, ale i např. v ekonomice. Pomocí moderních metod a softwarových nástrojů pro data mining se seznámí s procesem vyhledávání informací a znalostí v rozsáhlých souborech reálných dat numerického i nenumerického charakteru.
                 
                Schopnost komplexního náhledu na problematiku projektování dataminingových úloh, schopnost pracovat s moderními modelovacími SW typu IBM SPSS Modeler, schopnost týmové spolupráce na rozsáhlých projektech.
                 
                
             | 
        
        
            | 
                Předpoklady
             | 
        
        
            
                
                
                Základní znalost statistiky
                
                
                    
                        
                    
                    
                
                
  
             | 
        
        
            | 
                Hodnoticí metody a kritéria
             | 
        
        
            
                
                    
                        Kombinovaná zkouška
                        
                        
                         
                        
                    
                    
                
                 Vypracování zadané semestrální práce, aktivní účast na cvičení, zápočet, souhrnná zkouška.
                 
             | 
        
    
    | 
        Doporučená literatura
     | 
    
        
            
                
                - 
                    Berka Petr. Dobývání znalostí z databazí. Praha, 2006. 
                
 
            
                
                - 
                    Hendl J. Přehled statistických metod zpracování dat. Praha, 2006. 
                
 
            
                
                - 
                    Kotler Philip. Marketing management. Praha, 2005. 
                
 
            
                
                - 
                    Olivia Parr Rud. Datamining. Praha, 2006. 
                
 
            
         
         
         
     |