SylabUZ
Course name | Data mining |
Course ID | 04.2-WE-BEP-ED |
Faculty | Faculty of Computer Science, Electrical Engineering and Automatics |
Field of study | E-business |
Education profile | practical |
Level of studies | First-cycle studies leading to Engineer's degree |
Beginning semester | winter term 2021/2022 |
Semester | 2 |
ECTS credits to win | 3 |
Course type | obligatory |
Teaching language | polish |
Author of syllabus |
|
The class form | Hours per semester (full-time) | Hours per week (full-time) | Hours per semester (part-time) | Hours per week (part-time) | Form of assignment |
Lecture | 15 | 1 | 9 | 0,6 | Credit with grade |
Laboratory | 30 | 2 | 18 | 1,2 | Credit with grade |
Prezentacja oprogramowania wykorzystywanego do eksploracji danych. Zapoznanie słuchaczy z metodami wstępnego przetwarzania danych. Prezentacja metod klasyfikacji danych. Miary oceny klasyfikacji. Prezentacja metod odkrywania asocjacji. Prezentacja metod klasteryzacji danych. Wykształcenie praktycznych umiejętności obsługi wybranych systemów eksploracji danych. Wykształcenie umiejętności w zakresie stosowania metod eksploracji danych w e-biznesie (segmentacji klientów, strategii cross-sellingu, wykrywaniu nadużyć).
Przegląd i charakterystyka oprogramowania wykorzystywanego do eksploracji danych. Zapoznanie z oprogramowaniem do eksploracji danych. Struktury danych wykorzystywane w eksploracji danych. Typy i skale zmiennych w zadaniach eksploracji danych.
Przygotowanie danych do eksploracji. Profilowanie danych. Czyszczenie danych. Próbkowanie danych. Transformacja zmiennych. Selekcja zmiennych.
Klasyfikacji danych. Klasyfikacja danych za pomocą drzew klasyfikacyjnych, sieci neuronowych, regresji logistycznej. Miary oceny klasyfikacji. Ćwiczenia praktyczne z wykorzystania poznanych metod klasyfikacji danych.
Odkrywanie wzorców asocjacji. Miary opisujące statystyczną ważności i siłę reguł asocjacji. Problem analizy koszyka zakupów. Złożoność obliczeniowa problemu odkrywania reguł asocjacji. Omówienie algorytmu Apriori. Ćwiczenia praktyczne z wykorzystaniem poznanych metod odkrywania reguł asocjacjii.
Definicja zagadnienia klasteryzacji danych. Metody grupowania hierarchicznego. Metody grupowania iteracyjno-optymalizacyjnego. Miary odległości stosowane w klasteryzacji. Wyznaczanie charakterystyk klastrów. Metody szacowania liczby klastrów. Ćwiczenia praktyczne z wykorzystania poznanych metod klasteryzacji danych.
Wykład - wykład konwencjonalny z wykorzystaniem wideoprojektora.
Laboratorium - ćwiczenia praktyczne w laboratorium komputerowym.
Outcome description | Outcome symbols | Methods of verification | The class form |
Wykład - warunkiem zaliczenia jest uzyskanie pozytywnych oceny z testu z pytaniami zamkniętymi i otwartymi na koniec semestru oraz z pracy pisemnej. Ocena końcowa jest średnią arytmetyczną z dwóch uzyskanych ocen.
Laboratorium - warunkiem zaliczenia jest uzyskanie pozytywnych ocen ze sprawozdań do wszystkich ćwiczeń laboratoryjnych.
Składowe oceny końcowej = wykład: 50% + laboratorium: 50%
Modified by dr hab. inż. Marek Kowal, prof. UZ (last modification: 04-05-2021 14:56)