Sčítání lidu: Od císaře pána k otevřeným datům

, Michal Škop

Český statistický úřad začal v minulých měsících zveřejňovat výsledky Sčítání lidu, domů a bytů z roku 2021, a rovnou také jako otevřená data. Sčítání má více jak 150 letou tradici, počátky sahají do Rakouska-Uherska a tak se přímo nabízí ukázkové srovnání s jižními sousedy.

První “moderní” sčítání lidu se na území ČR uskutečnilo už před více než 150 lety, v roce 1869, sčítání proběhlo v celém Rakousku-Uhersku. Příkaz z 29. 3. 1869 o sčítání lidu nese podpis císaře Františka Josefa I. Tento befel také nastavil periodicitu sčítání na 10 let, což prakticky přetrvává dodnes. Prvních 5 českých sčítání, do roku 1910, tedy bylo součástí sčítání rakousko-uherských.

Příkaz z 29. 3. 1869 o sčítání lidu zdroj: Österreichische Nationalbibliothek
Příkaz z 29. 3. 1869 o sčítání lidu zdroj: Österreichische Nationalbibliothek

Díky statistickým úřadům obou zemí jsou výsledky sčítání poměrně dobře dostupné ve velkém detailu. Můžeme si tedy porovnat, jak se oněch 150 let obě tyto země s částečně společnou historií vyvíjely.

Pro ilustraci použití dat ze sčítání si vytvoříme mapu ČR a v Rakousku a znázorníme na ni, jak se za těch 150 let změnil počet obyvatel v jednotlivých obcích. Uvidíme, jestli se jevy jako urbanizace, rozvoj průmyslu a služeb, industrializace zemědělství projeví stejně. A jak se kupříkladu dodnes projevuje vyhnání sudetských Němců z území dnešního ČR na počet obyvatel dotčených obcí.

Použitá data

Pro vyhledání potřebných dat - data ze sčítání a geodata - nám dobře poslouží katalogy otevřených dat obou zemí - Národní katalog otevřených dat a Open Data Österreich - Katalog - stejně jako stránky obou statistických úřadů.

  1. Český statistický úřad: Výsledky sčítání 2021 - otevřená data nebo v Národním katalogu otevřených dat
  2. Český statistický úřad: Historický lexikon obcí České republiky 1869 - 2011.
  3. Český úřad zeměměřický a katastrální: RUIAN Stát - SHP
  4. Statistik Austria: Bevölkerung seit 1869 für Gemeinden
  5. Statistik Austria: Bevölkerungsstand 2022
  6. Statistik Austria: Gliederung Österreichs in Gemeinden

Data ze sčítání i geodata jsou obecně dostupná jako otevřená; narazíme jen na dílčí zádrhele:

Vzhledem k tomu, že v Rakousku se budou data z loňského sčítání publikovat teprve v roce 2023, použijeme aktuální data z registrů (data o počtech obyvatel se nyní v Rakousku, narozdíl od ČR, čerpají přímo z registrů obyvatel).

V České republice naopak se musíme spokojit s neotevřenými daty (ve formátu Excelu v Historickém lexikonu obcí) u dat za starší sčítání.

To jsou ale vcelku běžné problémy, velký kus práce za nás statistické úřady už udělaly např. v tom, že data jsou již přepočtena na dnešní obce.

Postup zpracování

Pro geografickou část - přípravu map obcí ČR a Rakouska - postupujeme podle článku Kartogram ČR (choropleth, choropletová mapa). Z původních souborů typu shapefile (můžeme si ČR a Rakousko rovnou spojit např. v programu QGIS) tak získáme soubor ve formátu geojson.

Údaje o počtech lidí si jen upravíme do tabulky např. pomocí kontingenční tabulky (použijeme např. Libreoffice Calc, Excel, programovací jazyk Python s knihovnou Pandas). A nakonec jednoduše vydělíme nejnovější údaj o počtu lidí v obci s údajem z roku 1869 a pro jednoduchost převedeme na procenta. Získáme tedy procentní údaj, jaký je dnes počet obyvatel obce v porovnání s dobou před 150 lety. A tento údaj znázorníme v mapě.

Obce obarvíme podle toho, zda v nyní v nich žije méně lidí než v roce 1869, zhruba stejně, nebo více lidí dnes než v roce 1869. Použijeme škálu červená-bílá-modrá, aby výsledek byl přístupný i lidem s barvoslepostí.

Výsledek

Přestože jde v první řadě o ukázku, jak lze použít otevřená data ze sčítání, výsledná mapa je sama o sobě zajímavá.

Stěhování do měst a jejich okolí je společným trendem ČR i Rakouska. Ale na první pohled vidíme, že zatímco v Čechách při tom souběžně dochází k vylidňování venkova, na většině Moravy a většině Rakouska venkov zůstává zhruba stejně obydlen jako před 150 lety a města pobírají spíše celkový nárůst obyvatel.

V ČR je vidět i důsledek vzniku průmyslových oblastí Ostravska a severozápadních Čech. U pánve severozápadních Čech (oblast zhruba od Kadaně po Ústí nad Labem) se tím jasně přebil efekt vyhnání sudetských Němců - dnes v dané oblasti žije násobně více lidí než před 150 lety.

Počet dnešních obyvatel v obcích ČR a Rakouska ve srovnání s rokem 1869 (procentuální vyjádření).
Počet dnešních obyvatel v obcích ČR a Rakouska ve srovnání s rokem 1869 (procentuální vyjádření).

Další použití

Podobným postupem se dají zobrazit mnohé další informace ze sčítání lidu, které se právě v této době postupně zveřejňují. Zároveň zde byla ukázka, že pokud jsou data dostupná alespoň srovnatelně ve více zemích, stojí za to je porovnat a získat tak další pohled na vlastní data.

Jiný pohled (který je pravda trochu více geeky) na vývoj počtu obyvatel (pro přehlednost v detailu za obce s rozšířenou působností/ORP v ČR a okresy/bezirke v Rakousku) ukazuje následující mapa, kde je pomocí sparkline zachycen vývoj počtu obyvatel v čase v dané ORP nebo okrese od roku 1869 po současnost - každá čára-sparkline (zleva doprava) odpovídá jednomu regionu a ukazuje průběh počtu obyvatel v čase. (Tato mapa také vznikla během tvorby tohoto článku.)

Změny v počtu obyvatel v ORP (ČR) a okresech (Rakousko) mezi roky 1869 a současností podle sčítání obyvatel. Vývoj v každém regionu je znázorněn pomocí sparkline. Barva sparkline odpovídá procentuální změně počtu obyvatel a tloušťka odpovídá počtu lidí.
Změny v počtu obyvatel v ORP (ČR) a okresech (Rakousko) mezi roky 1869 a současností podle sčítání obyvatel. Vývoj v každém regionu je znázorněn pomocí sparkline. Barva sparkline odpovídá procentuální změně počtu obyvatel a tloušťka odpovídá počtu lidí.

Použité nástroje a zdroje