User Tools

Site Tools

shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku [2017/01/01 11:39]
efox
shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku [2017/01/03 12:53] (current)
efox [asociace]
Line 9: Line 9:
 ---- ----
  
-===== hiearchické shlukování =====+===== HIEARCHICKÉ SHLUKOVÁNÍ =====
 ==== aglomerativní ==== ==== aglomerativní ====
   - Výběr vhodné metriky vzdálenosti/podobnosti pro výpočet asociační matice (analýza může probíhat na libovolných metrikách vzdálenosti/podobnosti)   - Výběr vhodné metriky vzdálenosti/podobnosti pro výpočet asociační matice (analýza může probíhat na libovolných metrikách vzdálenosti/podobnosti)
Line 26: Line 26:
 ---- ----
  
-===== nehiearchické =====+===== NEHIEARCHICKÉ SHLUKOVÁNÍ =====
 ==== aglomerativní ==== ==== aglomerativní ====
   * Do této skupiny lze zařadit metody hledající nejkratší spojnici mezi objekty ve vícerozměrném prostoru   * Do této skupiny lze zařadit metody hledající nejkratší spojnici mezi objekty ve vícerozměrném prostoru
Line 32: Line 32:
   * {{ ::nehiearchicke.png?direct&300 |}}   * {{ ::nehiearchicke.png?direct&300 |}}
  
- +==== divizní ==== 
 +  * Nejběžnější metodu je tzv. k‐means clustering 
 +  * Metoda zařazuje objekty do shluků na principu ANOVA, analogií je Wardovametoda shlukování v hierarchickém aglomerativnímshlukování 
 +  * Počet shluků je předem definován, výběr nejvhodnějšího počtu shluků je prováděn buď expertně nebo pomocí matematických metod výběru optimálního počtu shluků (analýza vnitro a mezishlukovýchvzdáleností) 
 +  *  
 +====== asociace ====== 
 +  * hledání vztahů (asociací) mezi podmnožinami atributů 
 +  * A asi souvisí s B, A je asi příčinou B 
 +  * mohou být: 
 +        * **klasické** - 2 podmnožiny atributů v relačních datech 
 +        * **transakční** - v rámci rozsáhlé množiny atributů, zaznamenaných seznamem jejich výskytů 
 +              * Jiný častý tvar zdrojových dat pro asociace je tzv. nákupní košík. Objektem je jeden (obvykle obchodní) případ, jeho několik atributů má obvykle pevnou strukturu (datum, čas, zákazník, ... = identifikace košíku). Vysoký počet dalších, obvykle binárních atributů (seznam nakupovaného zboží = obsah košíku) je zadáván jako seznam atributů nabývajících nenulové hodnoty. Asociacemi se zde rozumějí nalezené podmnožiny atributů, vyskytujících se společně (v košíku). 
 +        * **agregované** - mezi podmnožinou atributů a jejich skupinovými charakteristikami 
 +  * antecedent -> sukcendent
  
Permalink shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku.1483267151.txt.gz · Last modified: 2017/01/01 11:39 by efox

oeffentlich