Home
Tento časopis je zdarma distribuován zástupcům měst a obcí České a Slovenské republiky nad 5 tisíc obyvatel.

Metrika otevřených dat

David Bárta, šéfredaktor Smart Cities / Lukáš Puchrik, CleverMaps

Otevřená data jsou základním kamenem tvorby chytrého města. Jsou nejjednodušším způsobem, jak podpořit inovace a zefektivnit správu věcí veřejných. Jsou také cenným nástrojem pro podporu podnikání a zvýšení atraktivity města pro investory.

Existuje celá škála nástrojů, jak měřit návratnost či přínosy investic do otevřených dat. Existuje i žebříček zemí z hlediska jejich otevřenosti postavený na soustavě 80 indikátorů a dalších 14 indikátorů přímo pro otevřená data (webindex.org). Česká republika je v oblasti otevřených dat pod rozlišovacím minimem daného žebříčku a tudíž máme co dohánět.

Metrika pro ČR

V rámci tvorby metodiky Konceptu inteligentních měst (Zadavatel MMR v rámci programu TAČR Beta) byla vytvořena celosvětově ojedinělá indikátorová soustava pro měření otevřených dat, určená k posouzení otevřenosti měst ČR, a to ve spolupráci Centra dopravního výzkumu, v.v.i. a společnosti CleverMaps a.s. Jedná se o jednotný rámec indikátorů, které dokáží bodově ohodnotit kvantitu i kvalitu otevřených dat daného města, a tím umožnit srovnání jejich pokročilosti (viz návazný článek). Kvantitou je zjednodušeně míněn počet datových sad, kvalitou pak jejich formát vhodný pro strojové zpracování a míra jejich využití.

Jak dokumentuje text metodiky níže, nacházíme se ve fázi, kdy ještě nedokážeme chápat přínos otevřených dat, bráníme se jim, neboť je vidíme jako hrozbu, nikoliv jako silný potenciál rozvoje.

V České republice zajišťuje přístup k informacím zákon 106/1999 sb. o svobodném přístupu k informacím v platném znění. Tzv. povinným subjektům ukládá za povinnost zveřejnit předepsané informace o jejich činnosti nebo na žádost poskytnout žadateli data, jež jsou předmětem zákona. Povinné zveřejňování se aktuálně týká pouze velmi obecných informací o fungování samotných povinných subjektů bez většího užitku pro veřejnost. Žádost o data dle zákona 106/1999 sb. je ve většině případů povinnými subjekty vnímána jako útok žadatele na podstatu samotného orgánu státní správy a spíše než s ochotou data otevřít a zpřístupnit se žadatel setká s právními kličkami a odmítáním. V rámci odpovědí na žádosti pak dochází ke špatné interpretaci judikatury, případně kvůli neznalosti k nadřazování nižších právních předpisů a interních směrnic nad samotný zákon. Pro skutečné otevření dat potom nezbývá, než vyčkat všech zákonných lhůt a použít odvolání k soudu, který pak ve většině případů dá žadateli zapravdu a data otevře.

Pro změnu tohoto přístupu doporučujeme zřízení edukačního, motivačního a kontrolního programu na vládní úrovni, který by problematiku otevřených dat propagoval přes všechny úrovně státní správy a pozitivně motivoval subjekty, jež mají snahu data otvírat. Stěžejní součástí tohoto programu by byla definice otevřených datových sad pro jednotlivé resorty vytvořená na základě právní analýzy dat těchto resortů. Výsledkem by byl státem vyžadovaný seznam otevřených datových sad, které by byly povinně zveřejňovány s možností jejich prioritizace a řízení zátěže, kterou tyto požadavky způsobí.

Motivací jednotlivých subjektů k otevření dat by bylo jejich zvýhodnění v rámci přípravy státního rozpočtu. Indikátory navržené pro posouzení otevřenosti dat pro inteligentní města jsou v tomto případě plně použitelné pro hodnocení libovolného subjektu. 

Indikátory

Metodiku lze v rámci konceptu Smart Cities použít pro měřitelnost otevřenosti města, jež je definována bodově hodnocenými indikátory. Struktura indikátorů zahrnuje kvalitativní i kvantitativní posouzení otevřenosti dat v rámci města s cílem mít možnost objektivně posoudit přístup k datům ve srovnání s dalšími městy, ale také umožnit sledování otevírání datových sad v čase a motivovat k jejich smysluplnému využití pro rozvoj města. 

Indikátory jsou rozděleny do 5 podskupin zahrnující hodnocení datových sad, metadat, realizaci datového portálu (způsob jejich publikace) až po samotné aplikace otevřených dat. Výsledné hodnocení města se skládá ze dvou částí, celkového bodového hodnocení kvantity otevřených dat a celkového bodového hodnocení kvality otevřených dat města. Bodová hodnocení jsou součtem níže uvedených indikátorů.

Indikátorovou soustavu uvádíme otevřeně v plném znění, aby bylo zřejmé, jak byla a pravidelně i budou jednotlivá statutární města v ČR hodnocena.

1. Datové sady (kvalitativní i kvantitativní)

1.1. Celkový počet publikovaných datových sad (kvantitativní) hodnota: absolutní počet datových sad = počet bodů
1.2. Počet datových sad přístupných přes API (kvantitativní)
hodnota: absolutní počet datových sad = počet bodů

1.3. Počet datových sad se stupněm otevřenosti 3 (tři hvězdičky) a vyšší (kvantitativní) hodnota: absolutní počet datových sad = počet bodů

1.4. Otevřenost dat (kvalitativní) hodnota: 10 x 1–5 bodů
poznámka: Průměrné hodnocení otevřenosti dat dle pětihvězdičkové škály pro všechny publikované
datové sady.

 2. Metadata (kvalitativní)

2.1. Základní metadata

2.1.1. Název
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.2. Popis dat
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.3. Klíčová slova
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.4. Kategorie dat
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.5. Kontaktní osoba a kontakt
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.6. Licence
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.7. Platnost dat (k jakému datu jsou data platná)
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.8. Formát dat
hodnota: splněno 2 body / nesplněno 0 bodů

2.1.9. Kontrolní součet (checksum)
hodnota: splněno 2 body / nesplněno 0 bodů
poznámka: např. md5sum (http://cs.wikipedia.org)

2.2 Ostatní metadata

2.2.1. Verze
hodnota: splněno 1 bod / nesplněno 0 bodů
poznámka: odkaz na starší verze datové sady

2.2.2. Datum vytvoření datové sady
hodnota: splněno 1 bod / nesplněno 0 bodů
poznámka: datum prvotního vytvoření datové sady, nikoliv poslední aktualizace

2.2.3. Jazyk
hodnota: splněno 1 bod / nesplněno 0 bodů

2.2.4. Znaková sada
hodnota: splněno 1 bod / nesplněno 0 bodů
poznámka: např. cp1250, utf8, iso8859-2 atd.

2.2.5. Datová struktura – popis
hodnota: splněno 1 bod / nesplněno 0 bodů

2.3. Použití standardu pro metadata (např. Dublin Core)
hodnota: splněno 10 bodů / nesplněno 0 bodů

2.4 Implementace INSPIRE pro geodata
hodnota: splněno 10 bodů / nesplněno 0 bodů

3. OpenData portál (kvalitativní)

3.1. Dostupnost
hodnota: splněno 5 bodů / nesplněno 0 bodů
poznámka: odkaz na portál OpenDat není nikde schovaný a je jasně komunikovaný uživateli (Home Page, stálá položka v hlavním menu atd.)

3.2. Aktuálnost všech dostupných dat
hodnota: splněno 5 bodů / nesplněno 0 bodů

3.3. Novinky – upozornění na nová data či aktualizace a jiné změny
hodnota: splněno 2 body / nesplněno 0 bodů

3.4. Informační kanály
hodnota: splněno 2 body / nesplněno 0 bodů
poznámka: sociální sítě, RSS

3.5. Možnost prohlížet data bez nutnosti stažení
hodnota: splněno 2 body / nesplněno 0 bodů
poznámka: např. u geodat mapový portál

3.6. Filtrace a export požadované části otevřených dat
hodnota: splněno 10 bodů / nesplněno 0 bodů

3.7. Možnost stažení vzorku dat s kompletní datovou strukturou
hodnota: splněno 2 body / nesplněno 0 bodů

3.8. Koncept OpenData
hodnota: splněno 2 body / nesplněno 0 bodů
poznámka: vysvětlení co jsou OpenData a proč je publikovat pro neznalé příchozí

3.9. Zpětná vazba a podněty od uživatelů

3.9.1. Kontaktní formulář
hodnota: splněno 3 body / nesplněno 0 bodů

3.9.2. Diskuzní fórum
hodnota: splněno 5 body / nesplněno 0 bodů

3.9.3. Issue tracking (tiketovací systém pro řízení požadavků)
hodnota: splněno 10 body / nesplněno 0 bodů

3.10. Best practices
hodnota: splněno 1 bod / nesplněno 0 bodů
poznámka: příklady úspěšného použití OpenDat, odkazy na řešení nad nimi, obecná osvěta problematiky otevřených dat.

3.11. Kategorizace datových sad
hodnota: splněno 5 bodů / nesplněno 0 bodů

3.12. Vyhledávání
hodnota: splněno 5 bodů / nesplněno 0 bodů

3.13. Začlenění do národního portálu otevřených dat (podmíněno vznikem tohoto portálu)
hodnota: splněno 2 body / nesplněno 0 bodů

3.14. Statistika využívání portálu
hodnota: splněno 1 bod / nesplněno 0 bodů

4. Aplikace 

4.1. V rámci portálu uveřejněné seznamy a odkazy na aplikace postavené nad publikovanými daty (kvalitativní)
hodnota: splněno 5 bodů / nesplněno 0 bodů

4.2. Možnost přidání nově vzniklé aplikace do seznamu (kvalitativní)
hodnota: splněno 2 body / nesplněno 0 bodů
poznámka: rozumí se přidání uživatelem nikoliv správcem portálu

4.3. Motivační program pro nové aplikace (kvalitativní)
hodnota: splněno 2 body / nesplněno 0 bodů
poznámka: Studentské soutěže, dotace atd.

4.4. Pořádání tzv. hackhatonů nebo akcí podporujících vznik nových aplikací nad otevřenými daty města (kvalitativní)
hodnota: splněno 5 bodů / nesplněno 0 bodů

4.5. Počet akcí: (kvalitativní)
více než 2 akce (dle bodu 4.4) za kalendářní rok
hodnota: splněno 5 bodů / nesplněno 0 bodů
více než 5 akcí (dle bodu 4.4) za kalendářní rok
hodnota: splněno 15 bodů / nesplněno 0 bodů

4.6. Počet unikátních stažení aplikace za poslední tři měsíce (kvantitativní)
počet stažení na unikátní IP adresy ze všech veřejně dostupných relevantních zdrojů, kde je předmět aplikace vystaven
hodnota: absolutní počet = počet bodů 

4.7. Počet aktivních uživatelů za poslední tři měsíce
(kvantitativní) hodnota: absolutní počet = počet bodů

5. API (pouze kvalitativní)

5.1. Existence API
hodnota: splněno 5 bodů / nesplněno 0 bodů

5.2. Možnost parametrizace dotazů do API
hodnota: splněno 2 body / nesplněno 0 bodů

5.3. Dokumentace API
hodnota: splněno 5 bodů / nesplněno 0 bodů

5.4. Dosažitelnost změnových dat
Hodnota: splněno 1 bod / nesplněno 0 bodů

5.5. Možnost volby formátu dat
hodnota: splněno 2 body / nesplněno 0 bodů

5.6. Anonymizovaný přístup
hodnota: splněno 2 body / nesplněno 0 bodů