SylabUZ

Generate PDF for this page

Big Data Technology - course description

General information
Course name Big Data Technology
Course ID 11.3-WI-GeoTSP-TBD- 22
Faculty Faculty of Civil Engineering, Architecture and Environmental Engineering
Field of study Geoinformatics and satellite technology
Education profile academic
Level of studies First-cycle studies leading to Engineer's degree
Beginning semester winter term 2022/2023
Course information
Semester 6
ECTS credits to win 3
Course type obligatory
Teaching language polish
Author of syllabus
  • dr hab. inż. Artur Gramacki, prof. UZ
Classes forms
The class form Hours per semester (full-time) Hours per week (full-time) Hours per semester (part-time) Hours per week (part-time) Form of assignment
Lecture 15 1 9 0,6 Credit with grade
Laboratory 15 1 9 0,6 Credit with grade

Aim of the course

Nauczenie studentów doboru odpowiednich technik analizy danych w zależności od skali rozpatrywanego problemu oraz rodzaju przeprowadzanej analizy.

Nauczenie studentów pracy z wykorzystaniem nowoczesnych platform do składowania i przetwarzania danych.

Zapoznanie studentów z wybranymi technikami analizowania dużych zbiorów danych, głównie tekstowych.

Prerequisites

Struktury i bazy danych

Elementy sztucznej inteligencji

Scope

Big Data: wprowadzenie do zagadnienia przetwarzania wielkich ilości danych.

Nierelacyjne bazy danych: Przypomnienie podstawowych zagadnień związanych z relacyjnymi bazami danych. Zalety i wady tych baz danych. Podstawowe problemy związane z wykorzystaniem relacyjnych baz danych do składowania i przetwarzania coraz większych ilości danych coraz bardziej rozproszonych. Skalowanie poziome oraz pionowe baz danych. Nowa koncepcja baz nie opartych o tradycyjny model relacyjny. Teoria CAP oraz BASE. Agregacyjne modele danych. Bazy danych typu klucz-wartość, kolumnowe, dokumentowe, grafowe. Replikacja baz danych. Sharding w bazach danych. Współdzielenie zasobów w bazach danych. Architektura przetwarzania Map-Reduce. Przedstawienie kilku wybranych systemów baz danych nierelacyjnych (np. MongoDB, Cassandra, Redis, Neo4J, Oracle NoSQL Database).

Wybrane systemy informatyczne: Analityka biznesowa na dużą skalę: nowoczesne rozwiązania wykorzystywane do przesyłania, składowania oraz przetwarzania dużych zbiorów danych. Podstawy przetwarzania danych z wykorzystaniem sieci splotowych (CNN, Convolutional Neural Networks). Biblioteka Keras oraz Tensorflow. Praca w środowiskach chmurowych Google Colaboratory oraz Kaggle.

Teaching methods

Wykład konwencjonalny, ćwiczenia laboratoryjne, praca w zespole

Learning outcomes and methods of theirs verification

Outcome description Outcome symbols Methods of verification The class form

Assignment conditions

Wykład - warunkiem zaliczenia jest uzyskanie pozytywnej oceny z testu końcowego

Laboratorium - warunkiem zaliczenia jest uzyskanie ocen pozytywnych z wszystkich ćwiczeń laboratoryjnych oraz przeprowadzanych sprawdzianów

Składowe oceny końcowej = wykład: 50% + laboratorium: 50%

Recommended reading

  1. Sadalage P. J., Fowler M.: NoSQL. Kompendium wiedzy, 2014
  2. Francois Chollet: Deep Learning. Praca z językiem Python i biblioteką Keras, Helion, 2019
  3.  

 

Further reading

Notes


Modified by dr hab. inż. Artur Gramacki, prof. UZ (last modification: 07-05-2022 01:03)