Tato práce je stručný úvod do aplikovaného strojového učení, včetně aplikace na reálná data. Nejprve zadefinujeme základní pojmy strojového učení. Následně popíšeme obecnou klasifikační úlohu, vybrané klasifikační algoritmy, a metriky. V praktické části vyzkoušíme jeden z pracovních postupů používaných při aplikaci strojového učení na konkrétní úlohu, včetně podrobného popisu příslušné datové sady. Na závěr uvedeme empirické srovnání použitých algoritmů.
Anotace v angličtině
This work briefly introduces applied machine learning, including application to actual data. First, we define the basic concepts of machine learning. We then describe a general classification task, selected classification algorithms, and metrics. In the practical part, we will test one of the workflows that apply machine learning to a specific task, including a detailed description of the corresponding dataset. Finally, we conclude with an empirical comparison of the algorithms used.
Klíčová slova
strojové učení; empirické srovnání; klasifikace; ML workflow
Klíčová slova v angličtině
machine learning; empirical comparison; classification; ML workflow
Rozsah průvodní práce
51 s.
Jazyk
AN
Anotace
Tato práce je stručný úvod do aplikovaného strojového učení, včetně aplikace na reálná data. Nejprve zadefinujeme základní pojmy strojového učení. Následně popíšeme obecnou klasifikační úlohu, vybrané klasifikační algoritmy, a metriky. V praktické části vyzkoušíme jeden z pracovních postupů používaných při aplikaci strojového učení na konkrétní úlohu, včetně podrobného popisu příslušné datové sady. Na závěr uvedeme empirické srovnání použitých algoritmů.
Anotace v angličtině
This work briefly introduces applied machine learning, including application to actual data. First, we define the basic concepts of machine learning. We then describe a general classification task, selected classification algorithms, and metrics. In the practical part, we will test one of the workflows that apply machine learning to a specific task, including a detailed description of the corresponding dataset. Finally, we conclude with an empirical comparison of the algorithms used.
Klíčová slova
strojové učení; empirické srovnání; klasifikace; ML workflow
Klíčová slova v angličtině
machine learning; empirical comparison; classification; ML workflow
Zásady pro vypracování
Student nastuduje a popíše základní metody strojového učení s učitelem (supervised machine learning methods), zaměří se zejména na metody používané pro klasifikaci jako např. logistická regrese, support vector machines, rozhodovací stromy, náhodné lesy, k-means, k-nearest neighbors a umělé neuronové sítě. Vybrané metody budou porovnány pomocí různých metrik jednak na vhodně zvolených simulovaných datech příp. i na datech reálných. Výpočty budou provedeny pomocí Python a R knihoven.
Zásady pro vypracování
Student nastuduje a popíše základní metody strojového učení s učitelem (supervised machine learning methods), zaměří se zejména na metody používané pro klasifikaci jako např. logistická regrese, support vector machines, rozhodovací stromy, náhodné lesy, k-means, k-nearest neighbors a umělé neuronové sítě. Vybrané metody budou porovnány pomocí různých metrik jednak na vhodně zvolených simulovaných datech příp. i na datech reálných. Výpočty budou provedeny pomocí Python a R knihoven.
Seznam doporučené literatury
SHALEV-SHWARTZ, Shai and Shai BEN-DAVID. Understanding Machine Learning: From Theory to Algorithms [online]. Cambridge: Cambridge University Press, 2014. Retrieved z: doi:10.1017/CBO9781107298019
BURGER, Scott. Introduction to Machine Learning with R. O'Reilly Media, 2018. ISBN 9781491976449.
GIUDICI, Paolo a Silvia FIGINI. Applied Data Mining for Business and Industry. 2nd Edition. Wiley, 2009. ISBN 978-0-470-74582-3.
SHALEV-SHWARTZ, Shai and Shai BEN-DAVID. Understanding Machine Learning: From Theory to Algorithms [online]. Cambridge: Cambridge University Press, 2014. Retrieved z: doi:10.1017/CBO9781107298019
BURGER, Scott. Introduction to Machine Learning with R. O'Reilly Media, 2018. ISBN 9781491976449.
GIUDICI, Paolo a Silvia FIGINI. Applied Data Mining for Business and Industry. 2nd Edition. Wiley, 2009. ISBN 978-0-470-74582-3.