Namísto definice otevřených dat – která přijde později – si nejprve ukážeme příklady otevřených dat a jak mohou být taková data využívána.
Ministerstvo zdravotnictví poskytuje data týkající se onemocnění covid 19. Tato data mohou být využita např. v podobě interaktivních vizualizací. Poskytovatel nemusí tyto vizualizace připravovat – otevřením dat poskytovatel umožnil třetí straně (např. serveru novinky.cz) vytvořit vizualizaci dat na mapovém podkladu, která slouží jako nová služba občanům.
Hlídač státu umožňuje prostřednictvím webového rozhraní prohledávat velké množství dokumentů majících původ ve veřejné správě či provádět nad nimi analytickou činnost. Příkladem mohou být data o kontrolních akcích zveřejňovaná Nejvyšším kontrolním úřadem – ta jsou jedním z prohledávaných zdrojů.
Příslušnou datovou sadu najdeme v Národním katalogu otevřených dat.
Uvedené dvě aplikace mají společné mimo jiné to, že staví na otevřených datech.
Klíčové je především to, že:
Další důležité aspekty používaných dat:
Aplikace nelze zaměňovat za otevřená data. Aplikace může být přístupná bezplatně, může být i užitečná, ale…
…nikdo jiný než vlastník dat nebude moci vytvořit podobnou či lepší aplikaci, nebo data v ní prezentovaná integrovat do svého systému.
Příkladem může být mapová vizualizace aktivity klíštěte obecného na území ČR, kterou na svých stránkách zveřejňuje Český hydrometeorologický ústav.
Strojově čitelná data
Příkladem strojově čitelných dat je dobře strukturovaná tabulka ve formátu CSV (textový soubor pro tabulková data, ve kterém jsou jednotlivé položky odděleny čárkami).
V těchto případech k jednotlivým datovým položkám nelze obecně přistupovat pomocí programu/aplikace – je zapotřebí člověka, aby porozuměl významu dat (např. vyčetl data z grafu či mapy).
Pro úplnost ještě představíme dvojici souvisejících pojmů: datová sada a distribuce datové sady.
Datová sada je množina souvisejících dat, vztahujících se k jednomu věcnému tématu.
Distribuce datové sady je konkrétní datový zdroj, typicky v podobě souboru či aplikačního rozhraní API, který zpřístupňuje data datové sady nebo jejich část.
Informace o poskytovaných distribucích dané datové sady se objevuje mj. v příslušném katalogizačním záznamu v NKOD.
Katalogizační záznam v NKOD přísluší konkrétní datové sadě. Obsahuje příslušná metadata datové sady, např. název datové sady, poskytovatele datové sady, informace o periodicitě aktualizace atp. Některé položky metadat jsou pro registraci do NKOD povinné.
Příkladem může být datová sada faktur přijatých daným úřadem, její distribuce pak může mít podobu CSV souboru.
Jedna datová sada může mít více distribucí, např. CSV soubor, XML soubor aj.
Ovšem pozor, jednotlivé distribuce nemohou být strukturovány/děleny např. po kvartálech, letech, obcích, krajích – v tom případě by se jednalo o různé datové sady.
Ukázkou jedné datové sady s více distribucemi mohou být např. Agendy evidované v Registru práv a povinností ve smyslu § 51 zákona č. 111/2009 Sb. o základních registrech, které jsou dostupné ve formátu JSON, JSON-LD i jako SPARQL-endpoint.
Podmínky užití dat:
Cílem je umožnit snadné šíření dat jak pro nekomerční tak i komerční účely.
Neomezující podmínky umožňují, aby data byla využívána bez nutnosti vyjednávat s jejich poskytovatelem.
Data splňující takovéto principy lze „přibalit“ k vyvíjené aplikaci/službě, tu je možné integrovat do dalších systémů, dále šířit za stejných podmínek, …
Za otevřená data budeme nyní považovat taková data, která jsou:
V dalších modulech definici otevřených dat upřesníme vzhledem k naší legislativě – definice ale samozřejmě bude v souladu s těmito principy.
Otevřená data v ČR jsou v souladu s obecnými principy FAIR – ty požadují, aby data byla:
Mezi hlavní přínosy otevřených dat patří:
Další přínosy jsou uvedeny na Portálu pro poskytovatele otevřených dat.
Pokračujte prosím na následující modul.