z ANN: tento typ analýzy nepoužívá závislou proměnnou (učení bez učitele), cílem je detekovat netriviální shluky v datech. V tomto případě se využívá speciální typ neuronové sítě - Kohenova mapa (SOFM - self organizing feature map). Vstupem jsou pouze hodnoty (vstupních) nezávislých proměnných.
Shluková analýza se snaží o identifikaci shluků objektů ve vícerozměrném prostoru a následnou redukce vícedimenzionálního problému kategorizací objektů do zjištěných shluků
každá metoda může počítat s jinou vzdáleností, může mít jiný algoritmus jak spojovat objekty do shluků a taky může jinak interpretovat výsledky
Cílem analýzy může být jednak zjistit vazby mezi objekty (dostatečným výstupem je dendrogram) nebo identifikovat v datech shluky, které budou využity v další analýze jako zjednodušení vícedimenzionálního problému
jak identifikovat shluky? - buď ty hranice identifikuju já, jakožto analytik. Nebo přes matematické metody.
hiearchické shlukování
aglomerativní
Výběr vhodné metriky vzdálenosti/podobnosti pro výpočet asociační matice (analýza může probíhat na libovolných metrikách vzdálenosti/podobnosti)
Výběr shlukovacího algoritmu, který podstatným způsobem ovlivňuje výsledky analýzy a možnosti její interpretace
vypočítá se asociační matice → spojí se dva nejpodobnější objekty → nová asociační matice (ty dva spojené objekty vystupují jako jeden objekt!!!) → a tak dál a tak dál
shlukovací algoritmy
nejbližší soused
průmerná vzdálenost (vážená i nevážená)
středospojná (spojení dle vzdálenosti centroidů středů shluků)
nejvzdálenější soused
divizní
Shlukování může být zastaveno po rozdělení všech objektů do shluků, po předem daném počtu kroků nebo po dosažení kritéria minimálního rozdílu mezi shluky
nehiearchické
aglomerativní
Do této skupiny lze zařadit metody hledající nejkratší spojnici mezi objekty ve vícerozměrném prostoru
Na rozdíl od klasického hierarchického aglomerativníhoshlukování může být na jeden objekt napojeno několik dalších objektů
divizní
Nejběžnější metodu je tzv. k‐meansclustering
Metoda zařazuje objekty do shluků na principu ANOVA, analogií je Wardovametoda shlukování v hierarchickém aglomerativnímshlukování
Počet shluků je předem definován, výběr nejvhodnějšího počtu shluků je prováděn buď expertně nebo pomocí matematických metod výběru optimálního počtu shluků (analýza vnitro a mezishlukovýchvzdáleností)
Permalink shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku.1483267245.txt.gz · Last modified: by efox