proces dobývání znalostí
příprava
= mám složitou strukturu dat, udělám z ní jednu relevantní tabulku
analýza
= to je statistika
interpretace
= hodnocení nalezených vztahů v pohledu konového uživatele
základní typy úloh
klasifikace nebo predikce
deskripce
hledání nuggetů
klasifikace = přiřazení dokumentu do jedné nebo víc předem daných skupin (tříd) podle trénovacích příkladů
shlukování = seskupování dokumentů podle jejich podobnosti bez předchozí znalosti těchto skupin
prezentace
3 zdroje databáze (databáze - OLAP, datový sklad, ..., statistika, strojové učení)
filtrace, dichotomizace, kategorizace, standartizace, normalizace, chybějící údaje
PCA
Shlukové analýzy, Asociace
Složitost
Genetické algoritmy
Mravenčí kolonie
Neuronové sítě
Stochastické algoritmy
Stromy
Vizuální programování
Big Data
bokem
vzdálenosti objektů ve vícerozměrném prostoru
Data mining
Vymezení problémů analýzy mnohorozměrných dat. Typy dat. Hrubá filtrace. Chybějící údaje, dichotomizace, kategorizace, standardizace, normalizace.
Shluková analýza, metody nehierarchické, metody hierarchické, prezentace a interpretace výsledků.
Využití metod lineární algebry (PCA, SVD, NMF).
Evoluční výpočetní techniky (genetické algoritmy, diferenciální evoluce)
Vybrané stochastické algoritmy (simulované žíhání, horolezecký algoritmus)
Optimalizace mravenčí kolonií
Neuronové sítě (modely neuronů, topologie sítí, metoda backpropagation)
Kohonenovo učení a samoorganizující se neuronové sítě
Vizuální programování (příklady jazyků v GIS produktech, grafická notace)
Stromové datové struktury (R-strom, B-strom, UB-strom)