User Tools

Site Tools

shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku

This is an old revision of the document!


shluková analýza

  • z ANN: tento typ analýzy nepoužívá závislou proměnnou (učení bez učitele), cílem je detekovat netriviální shluky v datech. V tomto případě se využívá speciální typ neuronové sítě - Kohenova mapa (SOFM - self organizing feature map). Vstupem jsou pouze hodnoty (vstupních) nezávislých proměnných.
  • Shluková analýza se snaží o identifikaci shluků objektů ve vícerozměrném prostoru a následnou redukce vícedimenzionálního problému kategorizací objektů do zjištěných shluků
  • každá metoda může počítat s jinou vzdáleností, může mít jiný algoritmus jak spojovat objekty do shluků a taky může jinak interpretovat výsledky
  • Cílem analýzy může být jednak zjistit vazby mezi objekty (dostatečným výstupem je dendrogram) nebo identifikovat v datech shluky, které budou využity v další analýze jako zjednodušení vícedimenzionálního problému
  • jak identifikovat shluky? - buď ty hranice identifikuju já, jakožto analytik. Nebo přes matematické metody.


hiearchické shlukování

aglomerativní

  1. Výběr vhodné metriky vzdálenosti/podobnosti pro výpočet asociační matice (analýza může probíhat na libovolných metrikách vzdálenosti/podobnosti)
  2. Výběr shlukovacího algoritmu, který podstatným způsobem ovlivňuje výsledky analýzy a možnosti její interpretace
  • vypočítá se asociační matice → spojí se dva nejpodobnější objekty → nová asociační matice (ty dva spojené objekty vystupují jako jeden objekt!!!) → a tak dál a tak dál
  • shlukovací algoritmy
    • nejbližší soused
    • průmerná vzdálenost (vážená i nevážená)
    • středospojná (spojení dle vzdálenosti centroidů středů shluků)
    • nejvzdálenější soused

divizní

  • Shlukování může být zastaveno po rozdělení všech objektů do shluků, po předem daném počtu kroků nebo po dosažení kritéria minimálního rozdílu mezi shluky

nehiearchické

aglomerativní

  • Do této skupiny lze zařadit metody hledající nejkratší spojnici mezi objekty ve vícerozměrném prostoru
  • Na rozdíl od klasického hierarchického aglomerativníhoshlukování může být na jeden objekt napojeno několik dalších objektů

divizní

  • Nejběžnější metodu je tzv. k‐meansclustering
  • Metoda zařazuje objekty do shluků na principu ANOVA, analogií je Wardovametoda shlukování v hierarchickém aglomerativnímshlukování
  • Počet shluků je předem definován, výběr nejvhodnějšího počtu shluků je prováděn buď expertně nebo pomocí matematických metod výběru optimálního počtu shluků (analýza vnitro a mezishlukovýchvzdáleností)
Permalink shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku.1483267245.txt.gz · Last modified: by efox

oeffentlich