SylabUZ
Nazwa przedmiotu | Eksploracja danych |
Kod przedmiotu | 04.2-WE-BEP-ED |
Wydział | Wydział Informatyki, Elektrotechniki i Automatyki |
Kierunek | Biznes elektroniczny |
Profil | praktyczny |
Rodzaj studiów | pierwszego stopnia z tyt. inżyniera |
Semestr rozpoczęcia | semestr zimowy 2018/2019 |
Semestr | 2 |
Liczba punktów ECTS do zdobycia | 4 |
Typ przedmiotu | obowiązkowy |
Język nauczania | polski |
Sylabus opracował |
|
Forma zajęć | Liczba godzin w semestrze (stacjonarne) | Liczba godzin w tygodniu (stacjonarne) | Liczba godzin w semestrze (niestacjonarne) | Liczba godzin w tygodniu (niestacjonarne) | Forma zaliczenia |
Wykład | 15 | 1 | 9 | 0,6 | Zaliczenie na ocenę |
Laboratorium | 30 | 2 | 18 | 1,2 | Zaliczenie na ocenę |
Prezentacja oprogramowania wykorzystywanego do eksploracji danych. Zapoznanie słuchaczy z metodami czyszczenia danych. Prezentacja metod klasyfikacji danych. Prezentacja metod odkrywania asocjacji i sekwencji. Prezentacja metod klasteryzacji danych. Wykształcenie praktycznych umiejętności obsługi wybranych systemów eksploracji danych. Wykształcenie umiejętności w zakresie stosowania metod eksploracji danych w e-biznesie (segmentacji klientów, ocenie ryzyka kredytowego, strategii cross-sellingu, wykrywaniu nadużyć).
Przegląd i charakterystyka oprogramowania wykorzystywanego do eksploracji danych. Zapoznanie z oprogramowaniem do eksploracji danych (SAS). Struktury danych wykorzystywane w eksploracji danych. Typy i role zmiennych w zadaniach eksploracji danych.
Przygotowanie danych do eksploracji. Profilowanie danych. Czyszczenie danych. Próbkowanie danych. Transformacja zmiennych.
Klasyfikacji danych. Klasyfikacja danych za pomocą drzew klasyfikacyjnych, algorytmu k najbliższych sąsiadów, naiwnego klasyfikatora Bayesa, sieci neuronowych, regresji logistycznej. Miary jakości klasyfikacji. Ćwiczenia praktyczne z wykorzystania poznanych metod klasyfikacji danych.
Odkrywanie wzorców asocjacji i sekwencji. Miary opisujące statystyczną ważności i siłę reguł asocjacji i wzorców sekwencji. Problem analizy koszyka zakupów. Złożoność obliczeniowa problemu odkrywania reguł asocjacji. Omówienie algorytmu Apriori i algorytmu Generalized Sequential Pattern. Ćwiczenia praktyczne z wykorzystaniem poznanych metod odkrywania asocjacjii sekwencji.
Definicja zagadnienia klasteryzacji danych. Metody grupowania hierarchicznego. Metody grupowania iteracyjno-optymalizacyjnego. Miary odległości stosowane w klasteryzacji. Wyznaczanie charakterystyk klastrów. Metody szacowania liczby klastrów. Ćwiczenia praktyczne z wykorzystania poznanych metod klasteryzacji danych.
Wykład - wykład konwencjonalny z wykorzystaniem wideoprojektora.
Laboratorium - ćwiczenia praktyczne w laboratorium komputerowym.
Opis efektu | Symbole efektów | Metody weryfikacji | Forma zajęć |
Wykład - warunkiem zaliczenia jest uzyskanie pozytywnych ocen z testów przeprowadzonych, co najmniej raz w semestrze.
Laboratorium - warunkiem zaliczenia jest uzyskanie pozytywnych ocen ze wszystkich ćwiczeń laboratoryjnych oraz kolokwiów i sprawdzianów przewidzianych w ramach laboratorium.
Składowe oceny końcowej = wykład: 50% + laboratorium: 50%
Zmodyfikowane przez dr hab. inż. Marek Kowal, prof. UZ (ostatnia modyfikacja: 24-04-2018 11:55)