SylabUZ

Generate PDF for this page

Data Warehouse and Data Mining - course description

General information
Course name Data Warehouse and Data Mining
Course ID 11.3-WI-INFP-WHDiBW
Faculty Faculty of Computer Science, Electrical Engineering and Automatics
Field of study Computer Science
Education profile academic
Level of studies First-cycle studies leading to Engineer's degree
Beginning semester winter term 2022/2023
Course information
Semester 6
ECTS credits to win 5
Course type optional
Teaching language polish
Author of syllabus
  • dr hab. inż. Wiesław Miczulski, prof. UZ
Classes forms
The class form Hours per semester (full-time) Hours per week (full-time) Hours per semester (part-time) Hours per week (part-time) Form of assignment
Lecture 15 1 9 0,6 Credit with grade
Laboratory 30 2 18 1,2 Credit with grade
Project 15 1 9 0,6 Credit with grade

Aim of the course

  1. Zapoznanie studenta z zasadami działania i możliwościami współczesnych systemów hurtowni danych oraz systemów eksploracji danych.
  2. Ukształtowanie umiejętności w zakresie wstępnego przygotowywania danych oraz zasilania w dane systemów hurtowni danych i systemów eksploracji danych.
  3. Ukształtowanie umiejętności w zakresie efektywnego dostępu do danych w kontekście hurtowni danych i systemów eksploracji danych.
  4. Ukształtowanie umiejętności w zakresie przeprowadzania typowych zadań eksploracyjnych na posiadanych danych.

Prerequisites

Bazy danych, Algorytmy i struktury danych.

Scope

Hurtownie danych (ang. data warehouse). Architektura hurtowni danych (star, snow flake). Zasilanie hurtowni danych (procesy ETL) oraz odświeżanie hurtowni danych. Modelowanie (struktury danych typu ROLAP, MOLAP). Wsparcie dla hurtowni ze strony języka SQL - funkcje analityczne. Indeksowanie oraz optymalizacja zapytań. Indeksy kolumnowe, perspektywy zmaterializowane. 

Eksploracja danych (ang. data mining). Omówienie podstawowych zagadnień związanych z dziedziną eksploracji danych. Związek eksploracja danych z hurtowniami danych oraz bazami o charakterze transakcyjnym. Wstępne przetwarzanie danych (czyszczenie, integracja, transformacja, redukcja liczności i wymiarowości, określanie ważności atrybutów). Budowanie modeli do celów szacowania (estymacji) i przewidywania (predykcji). Regresja. Klasyfikacja danych. Grupowanie danych. Reguły asocjacyjne (analiza koszyka sklepowego, zbiory częste). Odkrywanie wzorców sekwencji. Ważność atrybutów. Wykrywanie anomalii. Wydobywanie z danych cech istotnych. Eksploracja danych potokowych i szeregów czasowych. Eksploracja struktur grafowych oraz sieci Web. Eksploracja tekstu. Wybrane środowiska informatyczne związane z tworzeniem i obsługą hurtowni danych oraz systemów eksploracji danych.

Teaching methods

wykład: wykład konwencjonalny

laboratorium: ćwiczenia laboratoryjne

projekt: praca w grupach, metoda projektu

Learning outcomes and methods of theirs verification

Outcome description Outcome symbols Methods of verification The class form

Assignment conditions

Wykład - warunkiem zaliczenia jest uzyskanie pozytywnych ocen z kolokwiów pisemnych lub ustnych przeprowadzonych co najmniej raz w semestrze.  

Laboratorium - warunkiem zaliczenia jest uzyskanie pozytywnych ocen ze wszystkich ćwiczeń realizowanych w semestrze. 

Projekt - warunkiem zaliczenia jest uzyskanie pozytywnych ocen ze wszystkich projektów realizowanych w semestrze.

Składowe oceny końcowej = wykład: 30% + laboratorium: 30% +  projekt: 40%

Recommended reading

  1. Larose D.: Metody I modele eksploracji danych, Wydawnictwo Naukowe PWN, Warszawa, 2007
  2. Larose D., Markov Z.: Eksploracja zasobów internetowych, Analiza struktury, zawartości i użytkowania sieci WWW, Wydawnictwo Naukowe PWN, Warszawa, 2010
  3. Hand D., Mannila H., Smyth P.: Principles of Data Mining. Massachusetts Institute of Technology, 2001.
  4. Jarke M., Lenzerini M., Vassiliou Y., Vassiliadis P.: Fundamentals of Data Warehouses. Springer-Verlag, Berlin, 2002.
  5. Rutkowski L.: Computational Intelligence. Methods and Techniques. Springer-Verlag, Berlin, 2008.

Further reading

  1. Cichosz P.: Systemy uczące się, WNT, 2000. 
  2. Beynon-Davies P.: Systemy baz danych, Wydawnictwa Naukowo-Techniczne, 2005. 
  3. Todman Ch.: Projektowanie hurtowni danych. Zarządzanie kontaktami z klientami (CRM), Wydawnictwa Naukowo-Techniczne, 2005.
  4. Data Mining: Concepts and Techniques, J. Han, M. Kamber, Morgan Kaufman, 2000.
  5. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations, I. H. Witten, E. Frank, Morgan Kaufman, 2000.

Notes


Modified by dr hab. inż. Wiesław Miczulski, prof. UZ (last modification: 10-04-2022 11:49)