proces dobývání znalostí
příprava
= mám složitou strukturu dat, udělám z ní jednu relevantní tabulku
analýza
= to je statistika
interpretace
= hodnocení nalezených vztahů v pohledu konového uživatele
základní typy úloh
klasifikace nebo predikce
deskripce
hledání nuggetů
klasifikace = přiřazení dokumentu do jedné nebo víc předem daných skupin (tříd) podle trénovacích příkladů
shlukování = seskupování dokumentů podle jejich podobnosti bez předchozí znalosti těchto skupin
prezentace
3 zdroje databáze (databáze - OLAP, datový sklad, ..., statistika, strojové učení)
filtrace, dichotomizace, kategorizace, standartizace, normalizace, chybějící údaje
PCA
Shlukové analýzy, Asociace
Složitost
Genetické algoritmy
Mravenčí kolonie
Neuronové sítě
Stochastické algoritmy
Stromy
Vizuální programování
Big Data
bokem
vzdálenosti objektů ve vícerozměrném prostoru