SylabUZ

Generate PDF for this page

Big data technologies - course description

General information
Course name Big data technologies
Course ID 11.3-WE-BEP-TBD
Faculty Faculty of Computer Science, Electrical Engineering and Automatics
Field of study E-business
Education profile practical
Level of studies First-cycle studies leading to Engineer's degree
Beginning semester winter term 2021/2022
Course information
Semester 3
ECTS credits to win 5
Course type obligatory
Teaching language polish
Author of syllabus
Classes forms
The class form Hours per semester (full-time) Hours per week (full-time) Hours per semester (part-time) Hours per week (part-time) Form of assignment
Lecture 30 2 18 1,2 Credit with grade
Project 30 2 18 1,2 Credit with grade

Aim of the course

Nauczenie studentów doboru odpowiednich technik analizy danych w zależności od skali rozpatrywanego problemu oraz rodzaju przeprowadzanej analizy.

Nauczenie studentów pracy z wykorzystaniem nowoczesnych platform do składowania i przetwarzania danych.

Zapoznanie studentów z wybranymi technikami analizowania dużych zbiorów danych, głównie tekstowych.

Prerequisites

Bazy danych.

Znajomość podstaw statystyki.

Scope

Big Data: wprowadzenie do zagadnienia przetwarzania wielkich ilości danych.

Nierelacyjne bazy danych: Przypomnienie podstawowych zagadnień związanych z relacyjnymi bazami danych. Zalety i wady tych baz danych. Podstawowe problemy związane z wykorzystaniem relacyjnych baz danych do składowania i przetwarzania coraz większych ilości danych coraz bardziej rozproszonych. Skalowanie poziome oraz pionowe baz danych. Nowa koncepcja baz nie opartych o tradycyjny model relacyjny. Teoria CAP oraz BASE. Agregacyjne modele danych. Bazy danych typu klucz-wartość, kolumnowe, dokumentowe, grafowe. Replikacja baz danych. Współdzielenie zasobów w bazach danych. Metodologia Map-Reduce. Przedstawienie kilku wybranych systemów baz danych nierelacyjnych (np. MongoDB, Cassandra, Redis, Neo4J, Oracle NoSQL Database).

Wybrane systemy informatyczne: Analityka biznesowa na dużą skalę: nowoczesne rozwiązania wykorzystywane do przesyłania, składowania oraz przetwarzania dużych zbiorów danych. Architektura nowoczesnych systemów do składowania i przetwarzania Big Data na przykładzie platformy Elasticsearch. Analityka danych tekstowych w czasie rzeczywistym z wykorzystaniem platformy ElasticSearch. Podstawy przetwarzania danych z wykorzystaniem sieci splotowych (CNN, Convolutional Neural Networks). Biblioteka Keras oraz Tensorflow. Praca w środowisku chmurowym Google Colaboratory.

Teaching methods

Wykład konwencjonalny, zadanie projektowe.

Learning outcomes and methods of theirs verification

Outcome description Outcome symbols Methods of verification The class form

Assignment conditions

Wykład - warunkiem zaliczenia jest uzyskanie pozytywnej oceny z testu końcowego

Projekt - warunkiem zaliczenia jest uzyskanie oceny pozytywnej w wykonanego projektu

Składowe oceny końcowej = wykład: 50% + projekt: 50%

Recommended reading

  1. Larose D.T.: Metody i modele eksploracji danych, PWN, Warszawa, 2008
  2. Markov Z., Larose D.T.: Eksploracja zasobów internetowych, PWN, Warszawa, 2009
  3. Sadalage P. J., Fowler M.: NoSQL. Kompendium wiedzy, 2014
  4. Gormley C., Tong Z.: Elasticsearch: The Definitive Guide, 2015
  5. Francois Chollet: Deep Learning. Praca z językiem Python i biblioteką Keras, Helion, 2019
  6. Dokumentacja systemu R

Further reading

Notes


Modified by dr hab. inż. Artur Gramacki, prof. UZ (last modification: 03-05-2021 22:34)