SylabUZ
Course name | Big Data Technology |
Course ID | 11.3-WI-GeoTSP-TBD- 22 |
Faculty | Faculty of Civil Engineering, Architecture and Environmental Engineering |
Field of study | Geoinformatics and satellite technology |
Education profile | academic |
Level of studies | First-cycle studies leading to Engineer's degree |
Beginning semester | winter term 2022/2023 |
Semester | 6 |
ECTS credits to win | 3 |
Course type | obligatory |
Teaching language | polish |
Author of syllabus |
|
The class form | Hours per semester (full-time) | Hours per week (full-time) | Hours per semester (part-time) | Hours per week (part-time) | Form of assignment |
Lecture | 15 | 1 | 9 | 0,6 | Credit with grade |
Laboratory | 15 | 1 | 9 | 0,6 | Credit with grade |
Nauczenie studentów doboru odpowiednich technik analizy danych w zależności od skali rozpatrywanego problemu oraz rodzaju przeprowadzanej analizy.
Nauczenie studentów pracy z wykorzystaniem nowoczesnych platform do składowania i przetwarzania danych.
Zapoznanie studentów z wybranymi technikami analizowania dużych zbiorów danych, głównie tekstowych.
Struktury i bazy danych
Elementy sztucznej inteligencji
Big Data: wprowadzenie do zagadnienia przetwarzania wielkich ilości danych.
Nierelacyjne bazy danych: Przypomnienie podstawowych zagadnień związanych z relacyjnymi bazami danych. Zalety i wady tych baz danych. Podstawowe problemy związane z wykorzystaniem relacyjnych baz danych do składowania i przetwarzania coraz większych ilości danych coraz bardziej rozproszonych. Skalowanie poziome oraz pionowe baz danych. Nowa koncepcja baz nie opartych o tradycyjny model relacyjny. Teoria CAP oraz BASE. Agregacyjne modele danych. Bazy danych typu klucz-wartość, kolumnowe, dokumentowe, grafowe. Replikacja baz danych. Sharding w bazach danych. Współdzielenie zasobów w bazach danych. Architektura przetwarzania Map-Reduce. Przedstawienie kilku wybranych systemów baz danych nierelacyjnych (np. MongoDB, Cassandra, Redis, Neo4J, Oracle NoSQL Database).
Wybrane systemy informatyczne: Analityka biznesowa na dużą skalę: nowoczesne rozwiązania wykorzystywane do przesyłania, składowania oraz przetwarzania dużych zbiorów danych. Podstawy przetwarzania danych z wykorzystaniem sieci splotowych (CNN, Convolutional Neural Networks). Biblioteka Keras oraz Tensorflow. Praca w środowiskach chmurowych Google Colaboratory oraz Kaggle.
Wykład konwencjonalny, ćwiczenia laboratoryjne, praca w zespole
Outcome description | Outcome symbols | Methods of verification | The class form |
Wykład - warunkiem zaliczenia jest uzyskanie pozytywnej oceny z testu końcowego
Laboratorium - warunkiem zaliczenia jest uzyskanie ocen pozytywnych z wszystkich ćwiczeń laboratoryjnych oraz przeprowadzanych sprawdzianów
Składowe oceny końcowej = wykład: 50% + laboratorium: 50%
Modified by dr hab. inż. Artur Gramacki, prof. UZ (last modification: 07-05-2022 01:03)