This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku [2017/01/01 11:39] efox |
shlukova_analyza_metody_nehierarchicke_metody_hierarchicke_prezentace_a_interpretace_vysledku [2017/01/03 12:53] (current) efox [asociace] |
||
---|---|---|---|
Line 9: | Line 9: | ||
---- | ---- | ||
- | ===== hiearchické shlukování | + | ===== HIEARCHICKÉ SHLUKOVÁNÍ |
==== aglomerativní ==== | ==== aglomerativní ==== | ||
- Výběr vhodné metriky vzdálenosti/ | - Výběr vhodné metriky vzdálenosti/ | ||
Line 26: | Line 26: | ||
---- | ---- | ||
- | ===== nehiearchické | + | ===== NEHIEARCHICKÉ SHLUKOVÁNÍ |
==== aglomerativní ==== | ==== aglomerativní ==== | ||
* Do této skupiny lze zařadit metody hledající nejkratší spojnici mezi objekty ve vícerozměrném prostoru | * Do této skupiny lze zařadit metody hledající nejkratší spojnici mezi objekty ve vícerozměrném prostoru | ||
Line 32: | Line 32: | ||
* {{ :: | * {{ :: | ||
- | + | ==== divizní ==== | |
+ | * Nejběžnější metodu je tzv. k‐means clustering | ||
+ | * Metoda zařazuje objekty do shluků na principu ANOVA, analogií je Wardovametoda shlukování v hierarchickém aglomerativnímshlukování | ||
+ | * Počet shluků je předem definován, výběr nejvhodnějšího počtu shluků je prováděn buď expertně nebo pomocí matematických metod výběru optimálního počtu shluků (analýza vnitro a mezishlukovýchvzdáleností) | ||
+ | * | ||
+ | ====== asociace ====== | ||
+ | * hledání vztahů (asociací) mezi podmnožinami atributů | ||
+ | * A asi souvisí s B, A je asi příčinou B | ||
+ | * mohou být: | ||
+ | * **klasické** - 2 podmnožiny atributů v relačních datech | ||
+ | * **transakční** - v rámci rozsáhlé množiny atributů, zaznamenaných seznamem jejich výskytů | ||
+ | * Jiný častý tvar zdrojových dat pro asociace je tzv. nákupní košík. Objektem je jeden (obvykle obchodní) případ, jeho několik atributů má obvykle pevnou strukturu (datum, čas, zákazník, ... = identifikace košíku). Vysoký počet dalších, obvykle binárních atributů (seznam nakupovaného zboží = obsah košíku) je zadáván jako seznam atributů nabývajících nenulové hodnoty. Asociacemi se zde rozumějí nalezené podmnožiny atributů, vyskytujících se společně (v košíku). | ||
+ | * **agregované** - mezi podmnožinou atributů a jejich skupinovými charakteristikami | ||
+ | * antecedent -> sukcendent | ||