SylabUZ

Generate PDF for this page

Practical Applications of Data Mining Systems - course description

General information
Course name Practical Applications of Data Mining Systems
Course ID 11.3-WK-IDD-SEDP-S18
Faculty Faculty of Mathematics, Computer Science and Econometrics
Field of study Data Engineering
Education profile academic
Level of studies Second-cycle studies leading to MS degree
Beginning semester summer term 2022/2023
Course information
Semester 3
ECTS credits to win 3
Available in specialities Data Exploration Systems
Course type optional
Teaching language polish
Author of syllabus
  • mgr inż. Andrzej Majczak
Classes forms
The class form Hours per semester (full-time) Hours per week (full-time) Hours per semester (part-time) Hours per week (part-time) Form of assignment
Lecture 15 1 - - Credit with grade
Laboratory 30 2 - - Credit with grade

Aim of the course

Nabycie umiejętności modelowania wymagane do zrozumienia i przechowywanie dużych danych dużych zbiorów danych. 

Wykorzystanie umiejętności do podejmowania decyzji, takich jak: wykrywanie raka, wykrywanie oszustw, segmentacja klientów i przewidywanie przestojów maszyn.

Poznanie procesu eksploracji danych i techniki modelowania za pomocą jednego programu IBM SPSS Modeler.

Tworzenie modeli na podstawie wyselekcjonowanych danych, testowanie modeli z danymi historycznym, użycie danych  bieżących.

Prerequisites

Podstawowa znajomość statystyki.

Scope

. Wprowadzenie do eksploracji danych

  1. Metodologia CRISP-DM
  2. Wprowadzenie do SPSS Modeler - predykcyjny warsztat do eksploracji danych
  3. Interfejs SPSS Modeler

2. Proces wyszukiwania danych

  1. Zrozumienie biznesu
  2. Zrozumienie danych
  3. Przygotowywanie danych

3. Techniki modelowania

  1. Wprowadzenie do technik modelowania
  1. Analiza klastra (nauka bez nadzoru)
  2. Klasyfikacja i przewidywanie (nadzorowane uczenie się)
  3. Klasyfikacja - szkolenie i testowanie
  4. Pobieranie próbek w klasyfikacji
  5. Predictive Modeling Algorithms w SPSS Modeler
  6. Automatyczny wybór algorytmów

4. Ocena modelu

  1. Dane do oceny wydajności
  2. Dokładność jako narzędzie oceny wydajności
  3. Pokonywanie ograniczeń dokładności
  4. ROC Curves

5. Wdrożenie na IBM Bluemix

  1. Ocena nowych danych
  2. Wdrożenie modelu predykcyjnego
  3. Czym jest IBM Bluemix?
  4. Modelowanie predykcyjne: wdrożenie w chmurze
  5. Usługi współpracy i wdrażania SPSS

Teaching methods

Wykład konwencjonalny, wykład problemowy. Ćwiczenia laboratoryjne. Dyskusja.

Learning outcomes and methods of theirs verification

Outcome description Outcome symbols Methods of verification The class form

Assignment conditions

Ocena z laboratorium wystawiana będzie na podstawie wyników z kolokwium i/lub projektów (80%) oraz aktywności na zajęciach (20%).

Recommended reading

1. Axel Buecker, Theresa Morelli, Colin Shearer, IBM SPSS predictive analytics: Optimizing decisions at the point of impact, An IBM Redguide publication 2010.

Further reading

Notes


Modified by dr Alina Szelecka (last modification: 19-05-2022 21:49)