Datová kvalita (nejen) v oblasti otevřených dat

Datová kvalita je obecně velmi široký pojem. Vystihnout se však dá jako "připravenost dat k použití". Nízká datová kvalita tedy představuje zásadní problém pro využívání potenciálu otevřených dat.

Za kvalitu svých dat i svých katalogizačních záznamů zodpovídají jednotliví poskytovatelé. Ti tedy musí na kvalitu svých dat dbát, pravidelně ji sledovat a dělat kroky k nápravě zjištěných nedostatků. Zde nabízíme přehled nástrojů, kterými poskytovatele ve zlepšování kvality jejich dat podporujeme.


Nástroje pro zlepšení kvality otevřených dat

Statistiky NKOD a dashboardy

Denně měříme dostupnost zdrojů registrovaných v Národním katalogu otevřených dat spolu se statistikami kvality jejich metadatových záznamů. Mají právě vaše datové sady vyplněné všechny povinné položky? Jsou vámi registrované soubory a služby dostupné?

Statistiky NKOD Dashboardy poskytovatelů

Příklady špatné praxe

Sbíráme příklady špatné praxe v otevírání dat a postupy jejich nápravy. Všem tak pomáháme se učit z chyb ostatních. Také ve formátu CSV oddělujete hodnoty středníkem? Dělíte distribuce datové sady dle časového pokrytí nebo dle tématu?

Špatná praxe

Otevřené formální normy

Tvoříme otevřené formální normy - standardy, jejichž dodržování přispívá ke zvyšování interoperability otevřených dat. Otevřené formální normy se týkají jak obecných oblastí, jako propojená data či geodata, tak i konkrétních datových sad jako turistické cíle či aktuality.

Otevřené formální normy

Náhled na dashboard NKOD

…aneb jak si aktuálně vedou data v NKOD z pohledu správné registrace a dostupnosti

Aktuální dashboard NKOD

Ukazatele kvality v NKOD

...aneb "co mám dělat, aby to bylo zelený"

Nedostupné URL

Nedostupné URL

Toto indikuje problém s registrovaným URL, v tomto případě URL souboru ke stažení. Příčin může být několik, chybová zpráva je viditelná po kliknutí na ikonku. Typicky URL vede na neexistující zdroj, nebo je špatně nakonfigurován protokol HTTPS.

Konfigurace HTTPS
Nepodporovaná HTTP HEAD

Nepodporovaná HTTP HEAD

Toto může indikovat problém s nepodporovanou metodou HTTP HEAD, kterou NKOD používá pro zjišťování dostupnosti registrovaných zdrojů. Je třeba webový server nakonfigurovat tak, aby ji podporoval. Jedná se o standardní prostředek zjišťování základních informací o zdrojích na Webu, který nevyžaduje jejich stahování.

Nedostupné URL

Nedostupné CORS

Tato ikona indikuje problém s technikou CORS. Bez její podpory nebudou moci aplikace běžící v prohlížeči se souborem pracovat. Typicky je třeba korektně implementovat HTTP metodu OPTIONS.

Technika CORS
Nedostupné URL

Chybný Media typ

Tato chyba indikuje, že Media typ registrovaný v NKOD pro soubor ke stažení neodpovídá tomu, které v hlavičce Content-Type indikuje webový server. Toto znesnadňuje aplikační použití takových souborů.

Chybný Media typ
Nedostupné URL

Chybějící podmínky užití

Bez podmínek užití nejsou registrovaná data otevřená. Nedáváte tak uživatelům právní jistotu v tom, co mohou a co nemohou s daty dělat. Poskytujeme návod, jak podmínky užití stanovit.

Stanovení podmínek užití
Nedostupné URL

Vlastní podmínky užití

Národní katalog otevřených dat poskytuje předpřipravené podmínky užití pro různé případy, které mohou v otevřených datech nastat. Používat vlastní podmínky užití by tedy nemělo být třeba. Pokud použity jsou, typicky to znamená, že buď data ve skutečnosti nejsou otevřená, nebo byl špatně vyplněn katalogizační záznam.

Vlastní podmínky užití