Vyučující
|
-
Matějů Lukáš, Ing. Ph.D.
-
Červa Petr, doc. Ing. Ph.D.
|
Obsah předmětu
|
Témata přednášek: 1. Úvod do problematiky, příklady 2. Offline vs online zpracování dat 3. Distribuované výpočetní systémy, jejich vlastnosti a součásti 4. Offline zpracování dat a MapReduce 5. Platforma Hadoop 6. Platforma Hadoop II 7. Apache Spark 8. Apache Spark II 9. Apache Spark SQL 10. Online zpracování dat 11. Apache Spark Streaming 12. Apache Flink 13. Apache Kafka 14. Apache Kafka Cvičení: Navazují na jednotlivé přednášky, náplní je práce s jednotlivými probíranými technologiemi.
|
Studijní aktivity a metody výuky
|
Monologický výklad (přednáška, prezentace, vysvětlování), Samostatná práce studentů (studium textů, literatury, problémové úkoly,výzkum, pisemná práce)
|
Výstupy z učení
|
Předmět přirozeně navazuje na kurz Databáze pro BigData a seznamuje studenty s existujícími softwarovými technologiemi pro zpracování velkých objemů dat. Pozornost je věnována jak principům (např. MapReduce) a nástrojům pro dávkovému zpracování dat v offline režimu (např. Hadoop), tak i technologiím pro zpracování datových proudů v reálném čase (Spark).
Studenti získají znalost softwarových technologií a postupů, které jim umožní zpracovávat velké objemy dat v různých režimech. Předmět dále poskytuje teoretický základ nutný pro navazující kurz zaměřený na cloudové technologie.
|
Předpoklady
|
Základní znalost programování a schopnost algoritmizace úloh.
|
Hodnoticí metody a kritéria
|
Kombinovaná zkouška
|
Doporučená literatura
|
-
White T. Hadoop: The Definitive Guide. 2018. ISBN 978-1449311520.
|