Kód | Zakončení | Kredity | Rozsah | Jazyk výuky |
---|---|---|---|---|
F7PMIBD | Z,ZK | 4 | 2P+2C | česky |
Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data). Předmět se zaměří na metody extrakce, analýzy a výběr infrastruktury pro zpracování perzistentních dat, ale i dat, která jsou průběžně vytvářena a stále se mění (stream), např. data ze sociálních sítí. V rámci předmětu bude prezentováno užití tradičních metod umělé inteligence a strojového učení pro problematiku analýzy rozsáhlých dat.
Forma ověření studijních výsledků: Podmínky zápočtu jsou absolvování čtyř testů se ziskem alespoň 50 % bodů. Testy prověří praktické znalosti při analýze a rozpoznávání vícerozměrných dat. Zkouška má písemnou část, která se skládá z převážně teoretických otázek s následním ústním dozkoušení v rozsahu odpřednášené a odcvičené látky.
Požadavky na studenty: Povinná účast na cvičeních (max. 2 absence).
Osnova přednášek:
1.Základní pojmy a vlastnosti dat v oblasti velkých dat.
2.Technologie pro uchovávání velkých dat, NoSQL databáze
3.Datové modely, výběrová kritéria
4.Struktura a standardizace dat
5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)
6.Metody strojového učení, vhodné pro analýzu velkých dat
7.Vybrané metody strojového učení I
8.Vybrané metody strojového učení II
9.Metody pro analýzu kontinuálních dat
10.Hledání souvislostí ve volně propojených datech
11.Případové studie I
12.Případové studie II
13.Případové studie III
14.Závěrečné shrnutí
Cvičení probíhají v počítačové učebně, studenti mohou rovněž používat vlastní počítače.
1.Základní pojmy a vlastnosti dat v oblasti velkých dat.
2.Technologie pro uchovávání velkých dat, NoSQL databáze
3.Datové modely, výběrová kritéria
4.Struktura a standardizace dat
5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)
6.Metody strojového učení, vhodné pro analýzu velkých dat
7.Vybrané metody strojového učení I
8.Vybrané metody strojového učení II
9.Metody pro analýzu kontinuálních dat
10.Hledání souvislostí ve volně propojených datech
11.Případové studie I
12.Případové studie II
13.Případové studie III
14.Závěrečné shrnutí
Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data).
Povinná literatura:
[1] HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. Praha: Grada, 2015. Profesionál. ISBN 978-80-247-5466-6.
Doporučená literatura:
[2] INMON, William H. Data architecture: a primer for the data scientist. Waltham, MA: Elsevier, 2014. ISBN 9780128020449.
Harmonogram předmětu je k dispozici na: https://harm.fbmi.cvut.cz/B231/F7PMIBD/lec
Všechny studijní materiály jsou pro zapsané studenty k dispozici v systému Moodle: https://moodle-vyuka.cvut.cz/course/view.php?id=10569