Slim combineren, integreren en interpreteren van data uit meerdere domeinen

Het slim combineren en integreren van bediencentrales uit meerdere domeinen heeft ook een direct impact op de data- en informatiehuishouding van de centrale. Datafusie en dataverrijking zijn nu al onmisbaar, maar met het oog op de steeds complexere toekomst vraagt een iCentrale nieuwe innovaties in machine learning, aldus de auteur.

 
Foto: Louis Haagman
 
Een iCentrale staat voor het bedienen van meerdere domeinen en voor trigger based werken. Dit heeft onmiskenbaar z’n consequenties voor de datahuishouding in de bediencentrale. Het volume en de diversiteit van de data zal in ieder geval toenemen: elk domein heeft immers z’n specifieke datasets. Maar dat de systemen in de centrale zelfstandig veranderingen in het actuele beeld van deze domeinen moeten kunnen ‘waarnemen’ – de gedachte achter trigger based werken – veronderstelt uiterst nauwkeurige en betrouwbare data en een flinke dosis kunstmatige intelligentie, waaronder machine learning.

Dat intelligente eindpunt hebben we binnen het programma iCentrale nog niet bereikt, maar het pad is al wel uitgestippeld. Dat bestaat uit drie trajecten: het binnenhalen van multidomeindata, het opwaarderen van de data tot zinvolle en betrouwbare multidomeininformatie en het interpreteren van die informatie. Met die laatste stap zijn we dan op het niveau van geautomatiseerd beslissingen nemen en triggers genereren.

Data verzamelen
Het eerste traject van data binnenhalen lijkt redelijk rechttoe-rechtaan, maar schijn bedriegt. Eén punt is dat het ‘dataniveau’ van de verschillende iCentrale-domeinen nogal uiteenloopt. Het domein wegverkeer doet het relatief goed, hoewel nieuwe bronnen als floating car data nodig zijn. Het zicht op parkeerbeheer, crowdmanagement en tunnel-, brug- en sluisbediening daarentegen is vaak beperkt en fragmentarisch.

Met relatief nieuwe loten als sensordata, floating device data en social media-data is wellicht een mooie inhaalslag te maken op de wat mager bemeten domeinen, maar met het gebruik van die datasets moeten we nog ervaring opdoen. Ook zullen bedrijven de gewenste data moeten ontsluiten.
Hier ligt overigens een directe relatie met een ander Beter Benutten-programma, namelijk Talking Traffic. Hierin werken meerdere cloud providers aan het binnenhalen, combineren, integreren en verwerken van grote hoeveelheden data van een grote diversiteit aan bronnen. De programma’s iCentrale en Talking Traffic kunnen elkaar hierin enorm versterken – zeker ook omdat veel iCentrale-partners ook actief zijn in Talking Traffic.

Een ander aspect in het eerste traject is om alle data op het basale niveau van tijd en geografische locatie ‘recht te trekken’. Dit is een voorwaarde voor het kunnen combineren en samenvoegen van de data in traject 2.

Van data naar informatie
De data uit traject 1 is nog niet per se bruikbare kennis of informatie. De lat binnen een iCentrale ligt sowieso hoog: als je ooit monitoringtaken wilt kunnen automatiseren, dan heb je volledige, nauwkeurige, betrouwbare, domeinbrede en vooral ook real time en voorspelde data nodig. Om dat te bereiken, zullen we de data van verschillende herkomst moeten verrijken, combineren en fuseren.

Een mooi voorbeeld van wat mogelijk is op het vlak van datafusie betreft (weg)verkeersinformatie. De traditionele lusdata zijn nauwkeurig, maar het aantal meetpunten is – zeker op het gemeentelijke en provinciale wegennet – beperkt. Gsm-data en floating car data zijn beduidend minder nauwkeurig en hebben een lage(re) penetratiegraad, maar zijn wel landelijk dekkend. Deze bronnen afzonderlijk geven dus geen van alle het complete plaatje, maar als we lusdata fuseren met gsm-data en/of floating car data vullen de datasets elkaars lacunes in, met betere en betrouwbaardere informatie als resultaat.
Dit betreft dan nog het samenvoegen van data bínnen een domein. Extra interessant voor iCentrale-toepassingen wordt het als we data van verschillende domeinen slim combineren. We kunnen er dan voor zorgen dat gebeurtenissen in het ene domein leiden tot (andere) acties in een ander domein.

Interpreteren van informatie
Dan het veruit lastigste traject op weg naar het eindpunt: de stap naar een geautomatiseerde monitoring (interpretatie) van informatie. In een iCentrale zal niet langer de operator of netwerkmanager bepalen wat relevant is, maar de datasoftware.

Om de verbanden en correlaties tussen informatie uit verschillende bronnen te leggen, kunnen we niet zonder kunstmatige intelligentie. Zonder vooraf de complexiteit volledig te hoeven modelleren of begrijpen, speuren slimme algoritmes naar patronen en herkennen ze verbanden. De ontwikkelingen op dit vlak gaan snel, zoals ook de ontwikkelingen op het gebied van de zelfrijdende auto bewijzen. In z’n huidige vorm herkennen diensten als (C)ACC en Lane Assist zelfstandig het verband tussen de maximumsnelheid, de afstand tot de voorligger en de markering op de weg.

Nog intelligenter wordt als we ook machine learning kunnen toepassen in bediencentrales. Hierbij neemt het algoritme ‘als dan’-relaties waar en verfijnt het op basis daarvan de achterliggende wiskundige vergelijkingen. Veel webwinkels maken gebruik van deze techniek om producten aan te bieden op basis van eerder koopgedrag.
In het verkeersdomein is machine learning nog geen gemeengoed, maar de mogelijkheden zijn wel groot. Denk aan het herkennen van een normaal verloop in de dag, zoals het verloop in de parkeerbezetting van een parkeergarage, de verkeerssituatie op een route of de ‘vaste’ openingstijden van een brug. Het algoritme leert dan bijvoorbeeld dat een brugopening leidt tot een bepaalde fileopbouw voor de brug.
Voor trigger based werken is dat een essentiële stap. Immers, als de zelflerende algoritmen een normaal verloop in de dag betrouwbaar genoeg herkennen, is het niet langer nodig dat een operator meekijkt. Alleen als de werkelijkheid begint af te wijken van de verwachte waarde (het normale verloop), geeft het algoritme een seintje – en komt de operator in actie.

Overigens hoeft het niet bij alleen ‘triggeren’ te blijven. Als bijvoorbeeld een parkeergarage steeds rond dezelfde tijd bijna vol is, kan het algoritme dat ook voorspellen en automatisch de verwijzing naar de parkeergarage (laten) stoppen. En als er een correlatie is tussen snelheidsonderschrijding in een tunnel en een wachtrij na de tunnel, dan kan het algoritme de betreffende richting van de verkeersregelinstallatie meer prioriteit geven. Deze geautomatiseerde bediening verhoogt de efficiëntie van de werkprocessen aanzienlijk.

iCentrale vraagt om nieuwe technieken
De nieuwe manier van werken in een iCentrale heeft een grote impact op de data- en informatiehuishouding. In het programma is een pad uitgezet om de data-inwinning en verwerking stapsgewijs en gestructureerd op niveau te brengen. De snelle ontwikkelingen in de informatietechnologie ondersteunen dit pad: de toenemende beschikbaarheid van veel en (bijna) real-time data in combinatie met zelflerende algoritmen effenen de weg naar volledig trigger based werken in een slimme iCentrale.

____

De auteur
Jasper Caerteling is projectmanager bij Be-Mobile.

 

De MotoGP TT Assen als praktijkcase

Tijdens de MotoGP TT Assen van 23 tot en met 25 juni 2017 hebben partners van het programma iCentrale enkele nieuwe datatechnieken ingezet om de verkeersontwikkeling rond het evenement te monitoren.

De jaarlijkse MotoGP TT Assen trekt duizenden motorrijders en automobilisten. Om dit verkeer te kunnen monitoren, zijn floating car data gebruikt – vaste sensoren zijn op het wegennet rond het circuit nauwelijks voorhanden.
De floating car data zijn omgezet naar een grafische kaartweergave. Er zijn algoritmen gebruikt die op basis van de actuele data plus historische reistijden continu de vertraging op vooraf gedefinieerde routes bepaalden. Ook dit is grafisch weergegeven, zodat de coördinator real-time inzicht had in de vertraging per route.
Dit bleek vooral nuttig om te beoordelen welke routes nog restcapaciteit hadden. Op deze wijze kon de coördinator de verkeersstromen beter sturen.