SylabUZ

Generate PDF for this page

Web mining - course description

General information
Course name Web mining
Course ID 11.3-WE-BEP-EZI
Faculty Faculty of Computer Science, Electrical Engineering and Automatics
Field of study E-business
Education profile practical
Level of studies First-cycle studies leading to Engineer's degree
Beginning semester winter term 2016/2017
Course information
Semester 5
ECTS credits to win 4
Course type obligatory
Teaching language polish
Author of syllabus
  • prof. dr hab. inż. Dariusz Uciński
Classes forms
The class form Hours per semester (full-time) Hours per week (full-time) Hours per semester (part-time) Hours per week (part-time) Form of assignment
Lecture 15 1 9 0,6 Credit with grade
Project 30 2 18 1,2 Credit with grade

Aim of the course

  • zapoznanie studentów z podstawowymi modelami i technikami odkrywania informacji znajdujących się w sieci Internet
  • zapoznanie ze sposobami działania algorytmów text mining
  • ukształtowanie umiejętności eksploracji zasobów internetowych w oparciu o oprogramowanie statystyczne.

Prerequisites

podstawy analityki biznesowej

Scope

Analiza struktury sieci WWW. Wyszukiwanie informacji tekstowych i wyszukiwanie w Internecie: wyszukiwarki internetowe; roboty internetowe; indeksowanie i wyszukiwanie według słów kluczowych; ocena jakości wyszukiwania; wyszukiwanie miar podobieństwa. Ranking oparty o strukturę połączeń: analiza sieci społecznych; algorytm PageRank; autorytety i koncentratory; wyszukiwanie oparte na podobieństwie strukturalnym.

Analiza zawartości sieci WWW. Grupowanie: aglomeracyjne grupowanie hierarchiczne; algorytm k-średnich; grupowanie oparte na prawdopodobieństwie; techniki wspólnego
filtrowania. Ocena grupowania: probabilistyczne funkcje kryterialne; minimalna długość opisu i ocena cech; ocena za pomocą odwzorowania klas do grup; entropia. Klasyfikacja: algorytm najbliższego sąsiada; wybór cech; naiwny algorytm Bayesa; relacyjne uczenie się.


Analiza użytkowania sieci WWW. Wstępne przetwarzanie danych: czyszczenie i filtrowanie; analiza kliknięć; identyfikacja użytkownia i sesji; katalogi i przypisanie kategorii. Eksploracyjna analiza użytkowania: liczba żądań w sesji; zależność między długością sesji a liczbą żądań użytkownika; średni czas na stronę; czas dla pojedynczych stron. Modelowanie użytkowania sieci WWW: grupowanie; reguły asocjacyjne; klasyfikacja.


Analityka Text Mining. Klasyfikacja dokumentów. Ontologie. Ekstrakcja informacji. Klasteryzacja. Analiza trendu. Eksploracyjny text mining. Analiza sentymentu.

Teaching methods

Wykład - wykład konwencjonalny.
Projekt - zajęcia praktyczne w laboratorium komputerowym.

Learning outcomes and methods of theirs verification

Outcome description Outcome symbols Methods of verification The class form

Assignment conditions

Wykład – uzyskanie oceny pozytywnej ze sprawdzianu w formie pisemnej i/lub ustnej, przeprowadzonego na koniec semestru.


Projekt – ocena końcowa stanowi sumę ważoną ocen uzyskanych za realizację poszczególnych elementów projektu oraz formy jego prezentacji. Wkład poszczególnych elementów oceny: ocena projektu - 75%, wizualna forma prezentacji projektu 25%.


Ocena końcowa = 50 % oceny zaliczenia z formy zajęć wykład + 50 % oceny zaliczenia z formy zajęć projekt.

Recommended reading

  1. Markov, Z., Larose, D.T., Eksploracja zasobów internetowych: Analiza struktury, zawartości i użytkowania sieci WWW, Warszawa, PWN, 2009.
  2. Chakraborty, G., Pagolu, M., Garla, S., Text Mining and Analysis: Practical Methods, Examples and Case Studies Using SAS, Cary, SAS Press, 2013.
  3. Segaran, T., Programming Collective Intelligence, Cambridge, O'Reilly, 2007.

Further reading

Notes


Modified by dr hab. inż. Marcin Mrugalski, prof. UZ (last modification: 29-09-2016 21:14)