Eksploracja danych - opis przedmiotu

Informacje ogólne

Nazwa przedmiotu	Eksploracja danych
Kod przedmiotu	04.2-WE-BEP-ED
Wydział	Wydział Informatyki, Elektrotechniki i Automatyki
Kierunek	Biznes elektroniczny
Profil	praktyczny
Rodzaj studiów	pierwszego stopnia z tyt. inżyniera
Semestr rozpoczęcia	semestr zimowy 2017/2018

Informacje o przedmiocie

Semestr	2
Liczba punktów ECTS do zdobycia	4
Typ przedmiotu	obowiązkowy
Język nauczania	polski
Sylabus opracował	dr hab. inż. Marek Kowal, prof. UZ

Formy zajęć

Forma zajęć	Liczba godzin w semestrze (stacjonarne)	Liczba godzin w tygodniu (stacjonarne)	Liczba godzin w semestrze (niestacjonarne)	Liczba godzin w tygodniu (niestacjonarne)	Forma zaliczenia
Wykład	15	1	9	0,6	Zaliczenie na ocenę
Laboratorium	30	2	18	1,2	Zaliczenie na ocenę

Cel przedmiotu

Prezentacja oprogramowania wykorzystywanego do eksploracji danych. Zapoznanie słuchaczy z metodami czyszczenia danych. Prezentacja metod odkrywania asocjacji i sekwencji. Prezentacja metod klasteryzacji danych. Prezentacja metod klasyfikacji danych. Wykształcenie praktycznych umiejętności obsługi wybranych systemów eksploracji danych. Wykształcenie umiejętności w zakresie stosowania metod eksploracji danych w e-biznesie (segmentacji klientów, ocenie ryzyka kredytowego, strategii cross-sellingu, wykrywaniu nadużyć, ukierunkowanej reklamie).

Wymagania wstępne

Zakres tematyczny

Przegląd i charakterystyka oprogramowania wykorzystywanego do eksploracji danych. Metody dostępu do baz danych z poziomu oprogramowani do eksploracji danych. Charakterystyka typowych danych biznesowych podlegających eksploracji. Problem eksploracji dużych wolumenów danych. Przykłady komercyjnych technologii eksploracji danych (Microsoft, SAS, IBM)

Przygotowanie danych do eksploracji. Uzupełnianie danych brakujących. Próbkowanie danych. Transformacja zmiennych.

Definicja zagadnienia klasyfikacji danych. Przygotowanie danych treningowych i testowych. Miary jakości klasyfikacji. Klasyfikacja danych za pomocą drzew klasyfikacyjnych, algorytmu k najbliższych sąsiadów, naiwnego klasyfikatora Bayesa, sieci neuronowych, regresja logistyczna. Ćwiczenia praktyczne z wykorzystania poznanych metod klasyfikacji danych.

Definicja problemu odkrywania wzorców asocjacji. Rodzaje reguł asocjacyjnych. Miary opisujące statystyczną ważności i siłę reguł asocjacji. Problem analizy koszyka zakupów. Złożoność obliczeniowa problemu odkrywania reguł asocjacji. Omówienie algorytmu Apriori i algorytmu Frequent Pattern Growth. Ćwiczenia praktyczne z wykorzystania poznanych metod odkrywania asocjacji.

Definicja problemu odkrywania wzorców sekwencji. Rodzaje reguł sekwencji. Miary opisujące statystyczną ważności i siłę wzorców sekwencji. Złożoność obliczeniowa problemu odkrywania wzorców sekwencji. Omówienie algorytmów: Generalized Sequential Pattern, Prefix Span oraz klasteryzacji sekwencji. Ćwiczenia praktyczne z wykorzystania poznanych metod odkrywania wzorców sekwencji.

Definicja zagadnienia klasteryzacji danych. Metody grupowania hierarchicznego. Metody grupowania iteracyjno-optymalizacyjnego. Miary odległości stosowane w klasteryzacji. Wyznaczanie charakterystyk klastrów. Metody szacowania liczby klastrów. Ćwiczenia praktyczne z wykorzystania poznanych metod klasteryzacji danych.

Zastosowanie metod eksploracji danych: w segmentacji klientów, ocenie ryzyka kredytowego, ukierunkowanej reklamie, strategii cross-sellingu i up-sellingu, wykrywaniu nadużyć.

Metody kształcenia

Wykład - wykład konwencjonalny z wykorzystaniem wideoprojektora.
Laboratorium - ćwiczenia praktyczne w laboratorium komputerowym.

Efekty uczenia się i metody weryfikacji osiągania efektów uczenia się

Opis efektu	Symbole efektów	Metody weryfikacji	Forma zajęć

Warunki zaliczenia

Wykład - warunkiem zaliczenia jest uzyskanie pozytywnych ocen z testów przeprowadzonych, co najmniej raz w semestrze.

Laboratorium - warunkiem zaliczenia jest uzyskanie pozytywnych ocen ze wszystkich ćwiczeń laboratoryjnych oraz kolokwiów i sprawdzianów przewidzianych w ramach laboratorium.

Składowe oceny końcowej = wykład: 50% + laboratorium: 50%

Literatura podstawowa

Morzy T.: Eksploracja danych. Metody i algorytmy., Warszawa, PWN, 2013.
Hand, D., Mannila, H., Smyth, P., Eksploracja danych, Warszawa, WNT, 2005.
Larose, D. T., Odkrywanie wiedzy z danych, Warszawa, PWN, 2006.
Larose, D. T., Metody i modele eksploracji danych, Warszawa, PWN, 2008.
Kwiatkowska, A. M., Systemy wspomagania decyzji: jak korzystać z wiedzy i informacji w praktyce, Warszawa, PWN, 2007.

Literatura uzupełniająca

Aggarwal C.C.: Data Mining, Springer, 2015.
Alexander M., Decker J., Wehbe B.: Zaawansowane wykorzystanie Excela. Analizy Business Intelligence, Helion, 2015.
Stąpor, K., Automatyczna klasyfikacja obiektów, EXIT, 2005.
Han, J., Kamber, M., Data Mining: Concepts and Techniques, Morgan Kaufmann, 2011.

Uwagi

Zmodyfikowane przez dr hab. inż. Marek Kowal, prof. UZ (ostatnia modyfikacja: 28-04-2017 08:33)