User Tools

Site Tools

kvalita_dat

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
kvalita_dat [2018/04/11 14:48]
efox
kvalita_dat [2018/04/11 15:28] (current)
efox
Line 34: Line 34:
  
  
-====== nejistota ====== 
-  * = naše nedokolané a nepřesné znalosti o světě 
-  * **představuje rozdíl mezi obsahem datové sady a jevem, který by data měla reprezentovat** 
-  * neúplná reprezentace našeho světa 
-  * nejsme si jisti, co přesně měříme nebo vidíme v přírodě nebo ve společnosti, ani jakké závěry vyvodit i z těch dokonalých údajů 
-  * není možné vytvořit dokonalou reprezentaci světa 
-  * GISy nejsou založené na přirozených jednotkách analázy 
  
-===== 3 filtry zkreslení ===== +----
-  * reálný svět -> konceptualizace -> reprezentace -> analýza +
-  * nejistota může existovat jednak v umístění hranic zóny, ale také ve vlastnostech dané zóny +
-  * **chyba (error)** +
-        * rozdíl mezi hodnotou vlastnosti objektu měřenou s neznámou chybou (v testovací sadě) a skutečnou hodnotou vlastnosti objektu měřenou bez chyby (v referenční sadě) +
-==== 1. konceptualizace ====+
  
-  * **vágnost** +====== Crowdsourcing ====== 
-        kvůli absenci objektivních geografických jednotek +  "Outsourcing" + "Crowd" 
-        * tranformace bodových událostí na plošné jednotky +  poprvé v roce 2006 
-        * vyskytuje se důsledku špatné definice způsobené špatnou dokumentací nebo pokud jsou sledované objekty rozmazané +  komunita uživatelů dobrovolně přispívá prostředky, daty, informacemi, vědomostmi 
-  * **nejednoznačnost (ambiguity)** + 
-        * návrh vazby mezi ukazatelem jevem je nejednoznačný +===== problémy ===== 
-        * nastává tehdypokud se místo samotných jevů používají jejich nedokolané indikátory +  * roste popularita prostorových dat 
-        např. řetězení datkdy si dle meta-kategorií nejsme jisti zařazením konkrétní třídy do dané kategorie +        * -> zvyšuje se dostupnost prostorových dat 
-  * **fuzzy ístup ke klasifikaci atributů** +        * kor dneska když je echno online a na netu 
-        * **frekvenční pojetí** -> pravděpodobnost daného výsledku je definovaná jako podíl, kolikrát se výsledek vyskytuje reálném nebo imaginárním experimentu, kdy je počet testů  velmi vysoký +              * snadno použitelné nástroje pro sběr prostorových dat, jejich analýzu a prezentaci 
-        -> problém GIS - má 1 pole s jednou esnou charakteristikou a 1 pozorovatele +===== neogeografie ===== 
-              proto **subjektivní koncepce pravděpodobnosti*+  * nová geografie 
-        * ve fuzzy logice může být stupeň příslušnosti objektu ke třídě částečný +  Google Earth, Google Maps 
-        * landuse, hranice, půdní typyvegetační typy, ... +  možnost vytváření vlastních výstupů formou mapových mashupů 
-==== 2. reprezentace ==== + 
-  * rozdíl jestli dělám vektor nebo rastr +===== příklady ===== 
-  * **mixel** = prvkyu nichž výsledek statistické klasifikace naznačuje výskyt více kategorií (landcover+  * Kickstarter 
-  chybová matice+  * OpenStreetMap 
 +        * 2004 
 +        * dobrovolné mapování 
 +  * StackOverflow (odnož GIS.stackoverflpw) 
 +  GeoNet 
 +  * Wikipedia 
 +  * Github 
 +  Ushahidi 
 +        * pro sledování nepokojů v Keni po prezidentských volbách 
 +        * * 2007 
 +        * pak zásadní zlom Haiti (2010) 
 +  * ZmapujTo 
 +        * pohotový nástroj pro hlášení závad malých nedostatků ve městě 
 +        * nefungující veřejné osvětlenírozbité lavičky,... 
 + 
 +====== VGI ====== 
 +  * Volunteered Geographical Information 
 +  * = **rozsáhlé zapojení velkého počtu soukromých osob, často s malou nebo žádnou kvalifikací v oboru, k tvorbě geografických informací** 
 +  * jako součást **User Generated Geographical Content** 
 +        * UGGC je jeden z hlavních prostředků, které NG používají, aby vyjádřili svůj záměr 
 +===== User Generated Content ===== 
 +     obsah, který je produkován uživateli webových stránek a digitálními médii 
 +     * rovnost íležitostí zveřejnit data 
 +     * "je to o mně" trend - YouTubeFacebook, prostorová témata vztažená k osobě 
 +     * sítě poskytují kolektivní inteligenci, souhrnné poznatky z decentralizovaných zdrojů, nízké náklady na spolupráci 
 + 
 +  * **aktivní UGC** uživatel se připojí k aplikaci a zadá příslušná prostorová data pro aktualizaci nebo rozšíření prostorové databáze 
 +  * **pasivní UG**C - zařízení sleduje a anonymně zapisuje cesty 
 +==== potenciální ínosy UGC ==== 
 +  * Linusův zákon 
 +        je-li dost očí, jsou všechny chyby malé 
 +        přispěvatelé vykazují 
 +        * vlastní výběr, přínos, soustředění 
 +  Početnost 
 +        více přispěvovatelů prostorových dat než profesionálních tvůrců mapy 
 +  Prostorové rozdělení 
 +        * rozložení UGC tvůrců je všudypřítomné a mnohem větší než počet profesionálních tvůrců map 
 + 
 +==== kritiky UGC ==== 
 +  * některé situace je třeba chápat v reálném čase 
 +  * použitelnost produktů může být nízká 
 +  * mohou vyžadovat rozsáhlou kontrolu chyb (???) 
 +  * uživalteské priority (Subjektivismus) mohou vést k nespolehlivosti 
 +  * předsudky v odpovědích 
 +{{:ugc.png?nolink&500|}} 
 +====== prostorová databáze ====== 
 +===== optimalizace ===== 
 +  zpočátku - údaje shromáždit podle specifikací 
 +        chybná data znova získat nebo do aktualizační fronty 
 +  potom 
 +        * každý rok jsou zakomponovány významné prostorové změny 
 +        oblasti s vysokou změnou lze identifikovat přednostně a následně aktualizovat 
 +        * ostatní změny jsou nalezeny systematicky pracujícím týmem v průběhu celého pokrytí 
 +  * ⇒  zohledňuje maximální časovou hodnotu peněz i současném zvýšení integrity databáze 
 + 
 +===== harmonizace ===== 
 +  * aktivní harmonizace databáze 
 +  * kdo řídí Crouwdsourcingová data z editačního hlediska? 
 +  * Kdo stanovuje standardy pro CRWSC data?  
 +  * Kdo kontroluje jejich kvalitu? 
 +        * není dostatek údajů k ověření dat 
 +        * není dostatek pokrytíkteré rozdělí potřeby (rozdělení users) 
 +        * nedostatek standardů a kontroly kvality 
 + 
 +===== kategorie prostorových databází ===== 
 +  * **kontrolované údaje** 
 +        * NavTeq, TeleAtlas 
 +  * **hybridní údaje** 
 +        * GoogleYahoo, TomTom 
 +  * **crowdsourcingové (nekontrolované)** 
 +        Flickr, OSM
  
-==== 3. analýza ==== 
-  * dobrá GIS analýza nemůže napravit špatné pojetí geografie ani špatnou reprezentaci, ale může oslabit jejich pravděpodobné negativní důsledky 
-===== zpracovávání nejistoty ===== 
-  * **Soft Computing** 
-  * fuzzy logika, ANN, GA, teorie chaosu, pravděpodobnostní metody 
  
-===== vizualizace nejistoty ===== 
-  * **grafické proměnné:** 
-        * **vnitřní** 
-              * mění svoji hodnotu v souvislosti s měnící se nejistotou 
-              * systost barvy 
-        *** vnější** 
-              * ke standardnímu kartografickému vyjídření jsou přidány další objekty 
-              * šipky, grafy, ... 
  
-  * MacEachren 
-        * srovnávací mapy 
-              * mapa pro atribut a mapa pro nejistotu 
-        * kombinované mapy 
-              * oboje na jedné mapě 
-        * interaktivní explorační nástroj 
-        * sekvenční prezentacex 
  
Permalink kvalita_dat.1523450882.txt.gz · Last modified: 2018/04/11 14:48 by efox

oeffentlich