Sčítání lidu: Od císaře pána k otevřeným datům
, Michal ŠkopČeský statistický úřad začal v minulých měsících zveřejňovat výsledky Sčítání lidu, domů a bytů z roku 2021, a rovnou také jako otevřená data. Sčítání má více jak 150 letou tradici, počátky sahají do Rakouska-Uherska a tak se přímo nabízí ukázkové srovnání s jižními sousedy.
První “moderní” sčítání lidu se na území ČR uskutečnilo už před více než 150 lety, v roce 1869, sčítání proběhlo v celém Rakousku-Uhersku. Příkaz z 29. 3. 1869 o sčítání lidu nese podpis císaře Františka Josefa I. Tento befel také nastavil periodicitu sčítání na 10 let, což prakticky přetrvává dodnes. Prvních 5 českých sčítání, do roku 1910, tedy bylo součástí sčítání rakousko-uherských.
Díky statistickým úřadům obou zemí jsou výsledky sčítání poměrně dobře dostupné ve velkém detailu. Můžeme si tedy porovnat, jak se oněch 150 let obě tyto země s částečně společnou historií vyvíjely.
Pro ilustraci použití dat ze sčítání si vytvoříme mapu ČR a v Rakousku a znázorníme na ni, jak se za těch 150 let změnil počet obyvatel v jednotlivých obcích. Uvidíme, jestli se jevy jako urbanizace, rozvoj průmyslu a služeb, industrializace zemědělství projeví stejně. A jak se kupříkladu dodnes projevuje vyhnání sudetských Němců z území dnešního ČR na počet obyvatel dotčených obcí.
Použitá data
Pro vyhledání potřebných dat - data ze sčítání a geodata - nám dobře poslouží katalogy otevřených dat obou zemí - Národní katalog otevřených dat a Open Data Österreich - Katalog - stejně jako stránky obou statistických úřadů.
- Český statistický úřad: Výsledky sčítání 2021 - otevřená data nebo v Národním katalogu otevřených dat
- Český statistický úřad: Historický lexikon obcí České republiky 1869 - 2011.
- Český úřad zeměměřický a katastrální: RUIAN Stát - SHP
- Statistik Austria: Bevölkerung seit 1869 für Gemeinden
- Statistik Austria: Bevölkerungsstand 2022
- Statistik Austria: Gliederung Österreichs in Gemeinden
Data ze sčítání i geodata jsou obecně dostupná jako otevřená; narazíme jen na dílčí zádrhele:
Vzhledem k tomu, že v Rakousku se budou data z loňského sčítání publikovat teprve v roce 2023, použijeme aktuální data z registrů (data o počtech obyvatel se nyní v Rakousku, narozdíl od ČR, čerpají přímo z registrů obyvatel).
V České republice naopak se musíme spokojit s neotevřenými daty (ve formátu Excelu v Historickém lexikonu obcí) u dat za starší sčítání.
To jsou ale vcelku běžné problémy, velký kus práce za nás statistické úřady už udělaly např. v tom, že data jsou již přepočtena na dnešní obce.
Postup zpracování
Pro geografickou část - přípravu map obcí ČR a Rakouska - postupujeme podle článku Kartogram ČR (choropleth, choropletová mapa). Z původních souborů typu shapefile (můžeme si ČR a Rakousko rovnou spojit např. v programu QGIS) tak získáme soubor ve formátu geojson.
Údaje o počtech lidí si jen upravíme do tabulky např. pomocí kontingenční tabulky (použijeme např. Libreoffice Calc, Excel, programovací jazyk Python s knihovnou Pandas). A nakonec jednoduše vydělíme nejnovější údaj o počtu lidí v obci s údajem z roku 1869 a pro jednoduchost převedeme na procenta. Získáme tedy procentní údaj, jaký je dnes počet obyvatel obce v porovnání s dobou před 150 lety. A tento údaj znázorníme v mapě.
Obce obarvíme podle toho, zda v nyní v nich žije méně lidí než v roce 1869, zhruba stejně, nebo více lidí dnes než v roce 1869. Použijeme škálu červená-bílá-modrá, aby výsledek byl přístupný i lidem s barvoslepostí.
Výsledek
Přestože jde v první řadě o ukázku, jak lze použít otevřená data ze sčítání, výsledná mapa je sama o sobě zajímavá.
Stěhování do měst a jejich okolí je společným trendem ČR i Rakouska. Ale na první pohled vidíme, že zatímco v Čechách při tom souběžně dochází k vylidňování venkova, na většině Moravy a většině Rakouska venkov zůstává zhruba stejně obydlen jako před 150 lety a města pobírají spíše celkový nárůst obyvatel.
V ČR je vidět i důsledek vzniku průmyslových oblastí Ostravska a severozápadních Čech. U pánve severozápadních Čech (oblast zhruba od Kadaně po Ústí nad Labem) se tím jasně přebil efekt vyhnání sudetských Němců - dnes v dané oblasti žije násobně více lidí než před 150 lety.
Další použití
Podobným postupem se dají zobrazit mnohé další informace ze sčítání lidu, které se právě v této době postupně zveřejňují. Zároveň zde byla ukázka, že pokud jsou data dostupná alespoň srovnatelně ve více zemích, stojí za to je porovnat a získat tak další pohled na vlastní data.
Jiný pohled (který je pravda trochu více geeky) na vývoj počtu obyvatel (pro přehlednost v detailu za obce s rozšířenou působností/ORP v ČR a okresy/bezirke v Rakousku) ukazuje následující mapa, kde je pomocí sparkline zachycen vývoj počtu obyvatel v čase v dané ORP nebo okrese od roku 1869 po současnost - každá čára-sparkline (zleva doprava) odpovídá jednomu regionu a ukazuje průběh počtu obyvatel v čase. (Tato mapa také vznikla během tvorby tohoto článku.)
Použité nástroje a zdroje
- Kartogram ČR (choropleth, choropletová mapa)
- Python + Pandas - open source a zdarma
- D3.js - open source a zdarma
- The Globe and Mail Library of Congress Catalog