SylabUZ
Nazwa przedmiotu | Big Data i analityka biznesowa |
Kod przedmiotu | 11.3-WI-INFD-BDiAB |
Wydział | Wydział Informatyki, Elektrotechniki i Automatyki |
Kierunek | Informatyka / Przemysłowe Systemy Informatyczne |
Profil | ogólnoakademicki |
Rodzaj studiów | drugiego stopnia z tyt. magistra inżyniera |
Semestr rozpoczęcia | semestr letni 2016/2017 |
Semestr | 1 |
Liczba punktów ECTS do zdobycia | 6 |
Typ przedmiotu | obowiązkowy |
Język nauczania | polski |
Sylabus opracował |
|
Forma zajęć | Liczba godzin w semestrze (stacjonarne) | Liczba godzin w tygodniu (stacjonarne) | Liczba godzin w semestrze (niestacjonarne) | Liczba godzin w tygodniu (niestacjonarne) | Forma zaliczenia |
Wykład | 30 | 2 | 18 | 1,2 | Zaliczenie na ocenę |
Laboratorium | 30 | 2 | 18 | 1,2 | Zaliczenie na ocenę |
Zapoznanie studentów z pojęciem analityki biznesowej oraz jej zastosowaniem do analizy dużych zbiorów danych zawartych w mediach społecznościowych, systemach ERP oraz nowoczesnych aplikacjach e-biznesowych.
Nauczenie studentów doboru odpowiednich technik analizy danych w zależności od skali rozpatrywanego problemu oraz rodzaju przeprowadzanej analizy (w czasie rzeczywistym, w trybie batch, przetwarzanie strumieni danych).
Nauczenie studentów pracy z wykorzystaniem nowoczesnych platform analitycznych takich jak: Elastic Search, Apache Hadoop, Apache Spark, Apache Storm oraz SAS
Bazy danych,
Znajomość podstaw statystyki
Umiejętność programowania w języku Java
Definicja analityki biznesowej. Jej rola i zastosowanie we współczesnych systemach informatycznych.
Przegląd tradycyjnych pojęć i narzędzi analityki biznesowej. Jakość i czyszczenie danych.
Metody redukcji wymiaru: analiza składowych głównych i analiza czynnikowa.
Wnioskowanie statystyczne. Analiza regresji, współzależności i wariancji z punktu widzenia data mining.
Regresja logistyczna. Naiwna estymacja bayesowska i sieci bayesowskie. Analiza i prognozowanie szeregów czasowych.
Analiza danych nieustrukturyzowanych: analiza sentymentu, tworzenie ontologii, kategoryzacja treści, text mining.
Analiza struktury sieci WWW: wyszukiwanie informacji tekstowych i wyszukiwanie w Internecie; ranking oparty o strukturę połączeń.
Analiza użytkowania sieci WWW: wstępne przetwarzanie danych; eksploracyjna analiza użytkowania sieci; grupowanie, regułyasocjacyjne i klasyfikacja.
Nowoczesne narzędzia do zaawansowanej wizualizacji oraz eksploracji danych na przykładzie platformy SAS.
Fenomen Big Data, jego charakterystyka oraz wpływ na istniejące rozwiązania analityczne.
Analityka biznesowa na dużą skalę; nowoczesne rozwiązania wykorzystywane do przesyłania, składowania oraz przetwarzania dużych zbiorów danych.
Architektura nowoczesnych systemów do przetwarzania Big Data na przykładzie platform Elasticsearch, Apache Hadoop, Apache Spark oraz Apache Storm.
Podstawowe techniki uczenia maszynowego wykorzystywane w analityce Big Data.
Analitkya danych tekstowych w czasie rzeczywistym z wykorzystaniem platformy ElasticSearch.
Wykład wykład konwencjonalny, dyskusja, wykład problemowy, ćwiczenia laboratoryjne, praca w zespole
Opis efektu | Symbole efektów | Metody weryfikacji | Forma zajęć |
Wykład - warunkiem zaliczenia jest uzyskanie pozytywnej oceny z egzaminu przeprowadzonego w formie zaproponowanej przez prowadzącego
Laboratorium - warunkiem zaliczenia jest uzyskanie ocen pozytywnych z wszystkich ćwiczeń laboratoryjnych
Składowe oceny końcowej = wykład: 50% + laboratorium: 50%
Morzy T.: Eksploracja danych. Metody i algorytmy, PWN, Warszawa, 2013
Larose D.T.: Metody i modele eksploracji danych, PWN, Warszawa, 2008
Markov Z., Larose D.T.: Eksploracja zasobów internetowych, PWN, Warszawa, 2009
White T., Hadoop: The Definitive Guide, 3rd Edition, O'Reilly Media / Yahoo Press, 2012.
George L., HBase: The Definitive Guide, O'Reilly Media, 2011.
Stanton J.M.: Introduction to Data Science, E-book, 2013.
Zmodyfikowane przez prof. dr hab. inż. Krzysztof Patan (ostatnia modyfikacja: 22-09-2016 09:13)