ISO TR 21707 - Inteligentní dopravní systémy – Informace, management a řízení integrované dopravy – Kvalita vstupních dat pro systémy ITS

Aplikační oblast: Kvalita dat, Řízení dopravy

PDF

Rok vydání normy a počet stran: Vydána 2008, 12 stran

Zavedení normy do ČSN: překladem

Rok zpracování extraktu: 2009

Skupina témat: Řízení dopravy

Téma normy: Požadavky na kvalitu vstupních dat ITS systémů

Charakteristika tématu: Požadavky na kvalitu vstupních dat do systémů ITS

Úvod, vysvětlení východisek

Popis významu stanovení kvality dat

Popis architektury, hierarchie, rolí a vztahů objektů

Definování metadat, která je nutné sledovat a určují kvalitu datové informace

Popis procesu / funkce / způsobu použití
Popis rozhraní / API / struktury systému
Definice protokolu / algoritmu / výpočtu
Definice reprezentace dat / fyzikálního významu
Definice konstant / rozsahů / omezení

Úvod

Tato technická zpráva specifikuje množinu terminologických pojmů, které definují kvalitu dat pro komunikaci mezi poskytovateli a uživateli v oblasti ITS. Jedná se tedy například o systémy dopravních informací či řízení dopravy, a to zejména pokud je mezi nimi či částmi jejich systémů otevřené rozhraní. Stejné definice mohou být využity i pro vnitřní rozhraní, ale to není předmětem této TR.

Jako typický příklad může být uveden projekt liniového řízení dopravy na dálnici D1. Snahou tohoto projektu je využít stávající data, například ze systému EFC či ze systému pro získávání dopravních informací. K popisu těchto dat by měla být použita metadata (tedy data o datech) definovaná v této normě.

Jedná se skutečně o důležitý dokument, neboť jinak by nebylo možné definovat a měřit kvalitu dat.

Poznámka: Extrakt uvádí vybrané kapitoly popisovaného dokumentu a přejímá původní číslování kapitol.

Užití

Tato norma by měla být použita při jakémkoli projektu ITS, v němž se vyskytují otevřená rozhraní mezi jednotlivými subsystémy. Umožní sdílení dat mezi těmito subsystémy a zvýší jejich využití.

Orgány státní správy by měly být seznámeny s existencí této normy a vyžadovat její využití při přípravě nových projektů řízených křižovatek, ale i přípravě projektů pro obnovu stávajích systémů.

Dodavatelé technologie se musí s touto normou seznámit skutečně detailně. Na základě této normy budou schopni sdílet data i mezi subsystémy dodávaných různými dodavately.

1. Předmět normy

Tato norma identifikuje množinu parametrů, takzvaných metadat, které mohou dohromady podat kvantifikaci kvality dat vyměněných mezi různými subsystémy. Tato TR se zaměřuje výhradně na kvalitu dat pro otevřená rozhraní, ale dá se využít jak pro sbíraná nezpracovaná data (raw data), tak i pro data po zpracování. Nerozlišuje také, zda se jedná o data statická, nebo o data v reálném čase.

Typická metadata pro kvalitu dat jsou například přesnost či aktuálnost. Tato TR definuje ovšem ještě celou řadu dodatečných metadat jako například vlastnictví (ownership), který je potřeba například pro určení omezení využití dat určitým uživatelům.

Měření kvality dat je nezbytné i pro určení jejich ceny v případě komerčního využití.

2. Termíny a definice

Všechny důležité termíny jsou definovány přímo v jednotlivých kapitolách ISO TR 21707.

Kapitola 3 uvádí zkratky a značky použité v této normě.

Další termíny a zkratky z oboru ITS jsou obsaženy ve slovníku ITS terminology (www. ITSterminology.org).

 
Další termíny a zkratky z oboru ITS jsou obsaženy ve slovníku ITS terminology.

 

4 Obecné požadavky

V této kapitole je vysvětleno, co znamená pojem kvalita dat (článek 4.1) a co by měla norma věnující se tomuto tématu definovat (článek 4.2). V článku 4.3 je potom uveden přehled a základní dělení metadat týkajících se kvality dat.

Pojem kvalita dat odpovídá množině metadat, která definují parametry předávaných dat a umožní jejich příjemci rozhodnout, zda jsou tato data vhodná pro jeho aplikaci. Různé aplikace mají různé požadavky na data a není tedy možné říci, že data sbíraná každou minutu jsou kvalitnější, než data sbíraná v pětiminutových intervalech.

Tato norma potom musí identifikovat, která metadata jsou vhodná a užitečná pro příjemce dat a jak tato metadata mají být strukturovaná.

V článku 4.3 jsou metadata rozdělena do několika úrovní. Na nejnižší úrovni se jedná o metadata zaměřená na přesnost, aktuálnost, či například pravděpodobnost správnosti. Jako konkrétní příklad může být uvedena míra přesnosti polohy, délka fronty, či přesnost časového razítka.

Kvalita dat se ovšem týká i datových objektů vyšší úrovně, jako jsou definice zvláštních dopravních situací nebo měření dopravního toku. Zde se obvykle metadata vyjadřují jako kombinace metadat z nižší úrovně.

Na nejvyšší úrovni se potom jedná o metadata týkajících se celých podmnožin datových služeb, jako je například dostupnost či spolehlivost dané služby.

 

5 Metadata popisující kvalitu dat

V této kapitole jsou detailně definována jednotlivá metadata. Každý typ těchto metadat popisujících kvalitu dat je vyjádřen jako objekt datové kvality, společně s množinou parametrů - metadat. Tyto objekty se mohou týkat datové služby jako celku, či jednotlivých částí (datových entit).

V jednotlivých podkapitolách jsou uvedeny jednotlivé objekty kvality dat společně s jednotlivými metadaty. Přehled objektů je uveden v následujícím seznamu (dané číslo vždy odpovídá označení konkrétního článku):

  1. Kompletnost služby

  2. Dostupnost služby

  3. Stupeň služby

  4. Věrohodnost

  5. Přesnost

  6. Aktuálnost

  7. Měření polohy

  8. Zdroj měření

  9. Vlastnictví

Pro příklad uvedeme v následujících odstavcích výběr z článku 5.2 Dostupnost služby.

5.2 Dostupnost služby

Poskytovatel dat musí být schopen specifikovat množinu metadat, která definují dostupnost dané služby (nejčastěji odvozenou z předchozích praktických zkušeností). Tato dostupnost může být uživatelem očekávaná a často je součástí písemné dohody (Service Level Agreement).

Následující metadata mohou být použita pro objekt dostupnost služby:

  • Perioda dostupnosti (Availability period – AP) je doba, po kterou je zaručena dostupnost dané služby. Obvykle se udává ve formátu den/týden/měsíc s uvedením speciálních podmínek (například 24/7 mimo státních svátků)

  • Střední doba opravy (Mean time to repair – MTTR) je střední doba od nahlášení poruchy dané služby do jejího opravení

  • Střední doba mezi poruchami (Mean time between failures – MTBF) je střední doba mezi dvěma poruchami daného systému

Skutečná hodnota dostupnosti je potom definována podle této rovnice:

 

6 Shrnutí objektů datové kvality a jejich parametrů

Tabulka 6.1 uvádí seznam objektů datové kvality, jejich možných metadat, rozdělení, zda se jedná o metadata obecná, nebo pro jednotlivé instance, a formu, jakou jsou definovány (textem, číselně, či jinak). Výběr pro již popsaný objekt dostupnost služby je jako příklad uveden i zde:

Tabulka 6.1 – Objekty datové kvality

Objekt datové kvality

Metadata

Instance metadata

Obecná metadata

Jak je definován

...

Dostupnost služby

Perioda dostupnosti

 

X

Text

Střední doba opravy

 

X

hh:mm

Střední doba mezi poruchami

 

X

hh:mm

...


 


 

 

Výběr podle typu

Výběr podle aplikačních oblastí