Jste zde

F7PMIBD - Big data

Kód Zakončení Kredity Rozsah Jazyk výuky
F7PMIBD Z,ZK 4 2P+2C česky
Garant předmětu:
Lenka Lhotská
Přednášející:
Lenka Lhotská
Cvičící:
Bohuslav Dvorský, Lenka Lhotská
Předmět zajišťuje:
katedra biomedicínské informatiky
Anotace:

Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data). Předmět se zaměří na metody extrakce, analýzy a výběr infrastruktury pro zpracování perzistentních dat, ale i dat, která jsou průběžně vytvářena a stále se mění (stream), např. data ze sociálních sítí. V rámci předmětu bude prezentováno užití tradičních metod umělé inteligence a strojového učení pro problematiku analýzy rozsáhlých dat.

Požadavky:

Forma ověření studijních výsledků: Podmínky zápočtu jsou absolvování čtyř testů se ziskem alespoň 50 % bodů. Testy prověří praktické znalosti při analýze a rozpoznávání vícerozměrných dat. Zkouška má písemnou část, která se skládá z převážně teoretických otázek s následním ústním dozkoušení v rozsahu odpřednášené a odcvičené látky.

Požadavky na studenty: Povinná účast na cvičeních (max. 2 absence).

Osnova přednášek:

Osnova přednášek:

1.Základní pojmy a vlastnosti dat v oblasti velkých dat.

2.Technologie pro uchovávání velkých dat, NoSQL databáze

3.Datové modely, výběrová kritéria

4.Struktura a standardizace dat

5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)

6.Metody strojového učení, vhodné pro analýzu velkých dat

7.Vybrané metody strojového učení I

8.Vybrané metody strojového učení II

9.Metody pro analýzu kontinuálních dat

10.Hledání souvislostí ve volně propojených datech

11.Případové studie I

12.Případové studie II

13.Případové studie III

14.Závěrečné shrnutí

Osnova cvičení:

Cvičení probíhají v počítačové učebně, studenti mohou rovněž používat vlastní počítače.

1.Základní pojmy a vlastnosti dat v oblasti velkých dat.

2.Technologie pro uchovávání velkých dat, NoSQL databáze

3.Datové modely, výběrová kritéria

4.Struktura a standardizace dat

5.Specifika dat v medicíně, málo dat vs velké množství příznaků, okrajová data (outliers)

6.Metody strojového učení, vhodné pro analýzu velkých dat

7.Vybrané metody strojového učení I

8.Vybrané metody strojového učení II

9.Metody pro analýzu kontinuálních dat

10.Hledání souvislostí ve volně propojených datech

11.Případové studie I

12.Případové studie II

13.Případové studie III

14.Závěrečné shrnutí

Cíle studia:

Cílem předmětu je seznámit studenty s novými trendy a technologiemi pro uchovávání, správu a zpracování velmi rozsáhlých dat (big data).

Studijní materiály:

Povinná literatura:

[1] HOLUBOVÁ, Irena, Jiří KOSEK, Karel MINAŘÍK a David NOVÁK. Big Data a NoSQL databáze. Praha: Grada, 2015. Profesionál. ISBN 978-80-247-5466-6.

Doporučená literatura:

[2] INMON, William H. Data architecture: a primer for the data scientist. Waltham, MA: Elsevier, 2014. ISBN 9780128020449.

Poznámka:
Předmět je součástí následujících studijních plánů:
Materiály ke stažení:

Ostatní - odkaz: 

Harmonogram předmětu je k dispozici na: https://harm.fbmi.cvut.cz/B231/F7PMIBD/lec

Dodatečné studijní materiály pro KFS - odkaz: 

Všechny studijní materiály jsou pro zapsané studenty k dispozici v systému Moodle: https://moodle-vyuka.cvut.cz/course/view.php?id=10569