DiTTlab: (big) data meets simulatie

We hebben al eerder bericht over het DiTTlab. Maar in een themanummer over verkeersmodellen mag een nadere kennismaking met dit lab natuurlijk niet ontbreken. De hoogleraren Hans van Lint en Alexander Verbraeck vertellen in deze bijdrage over de propositie van DiTTlab en over de eerste projecten die er worden uitgevoerd.

 
Foto: Robert de Voogd. Met dank aan: MiniWorld RotterdamDelft Integrated Traffic and Travel Laboratory, afgekort tot DiTTlab, is een laboratorium waarin (big) data en open-source simulatiegereedschappen met elkaar worden gecombineerd. Studenten, onderzoekers en stakeholders uit zowel de publieke als private sector werken erin samen aan belangrijke onderzoeksvragen rond verkeer en vervoer.

Het idee om van DiTTlab niet slechts een universiteitsfeestje te maken maar een samenwerkingsverband tussen TU Delft, industrie en publieke partners werd eind 2013 geboren. In de zomer van 2014 werd het al realiteit, toen TU Delft een memorandum of understanding tekende met CGI. Deze zomer zal DiTTlab – althans, de sponsoring en financiering – worden ondergebracht in een stichting, waarin ook NDW en DITCM een sleutelrol gaan vervullen. Daarmee staat de deur wagenwijd open voor samenwerking met nog veel meer publieke en private partijen.

De DiTTlab-propositie
Er zijn drie belangrijke redenen waarom een onafhankelijke omgeving waarin data en (open-source) simulatiemodellen worden gecombineerd, juist nu van cruciaal belang is voor de BV Nederland.

Allereerst kunnen we met de data een scala aan maatregelen en ontwikkelingen in de huidige verkeer- en vervoerpraktijk op uniforme wijze monitoren, begrijpen en optimaliseren. Dat is nodig, want er staat het nodige te gebeuren in de nabije toekomst. Zo verwachten we een systeemsprong naar automatisch en coöperatief rijden. Er lopen grote infrastructurele projecten, zoals bij de Zuidas rond Amsterdam en de Noord-Zuidlijn in dezelfde regio. En er zal een hele reeks aan projecten gaan lopen binnen het Beter Benutten-programma, de ITS Corridor, DITCM enzovoort.

Ten tweede zijn er vragen die weliswaar fundamenteler van aard zijn maar nog altijd heel nauw raken aan belangrijke thema’s in de huidige praktijk. Bijvoorbeeld: kunnen we voor de verkeerscentrales van de (nabije) toekomst schaalbare netwerkbrede toestandschatters en voorspellers ontwikkelen op grond van verschillende databronnen? Andersom geredeneerd: hoeveel vaste meetpunten in combinatie met floating car data zijn er nodig om deze schattingen en voorspellingen te doen met een voldoende kwaliteitsniveau?

Maar – en dat is reden nummer drie – er zijn ook onderzoeksvragen die ogenschijnlijk veel verder van de behoeften van de praktijk liggen. Ogenschijnlijk, omdat het niet beantwoorden ervan uiteindelijk heel kostbaar kan zijn. Het gaat onder meer om de vraag hoe we de resultaten uit effectstudies kunnen opschalen naar netwerkbrede effecten en naar allerlei ‘wat als’-scenario’s. Wat als het percentage coöperatieve voertuigen omhoog gaat? Wat betekent dat voor de veiligheid en efficiency van de huidige infrastructuurknooppunten? Wat als nieuwe hybridevormen van netwerkbreed verkeersmanagement breed worden uitgerold? Is het mogelijk om de dynamica van verkeerstromen met een veranderende mix van rijondersteuning en automatisering te beschrijven en voorspellen?

Voor al dit soort vragen hebben we verkeerssimulatiemodellen nodig. In onze dagelijkse praktijk merken we dat de voorspellingskracht van veel van de beschikbare theorieën beperkt is. Als we nu al slecht het rijstrookwisselgedrag kunnen voorspellen, hoe moet het dan als we met de huidige generatie modellen willen voorspellen hoe autorijders reageren op een colonne automatisch rijdende vrachtwagens of op een hoog percentage automatische voertuigen van misschien wel tien verschillende merken in een stedelijk gebied? Daarom is onzes inziens een open-source aanpak cruciaal. Dat maakt het mogelijk om interdisciplinair samen te werken (verkeerskunde meets computer science) met zowel onderzoekers als gebruikers, en om een plaats te geven aan nieuwe ontwikkelingen vanuit een groot aantal vakgebieden.

De DiTTlab-architectuur op hoofdlijnen
De DiTTlab-architectuur op hoofdlijnen
Het goede nieuws is dat dit binnen DiTTlab kan. Bijgaande figuur (klik voor een vergrote weergave) geeft een schematische weergave van DiTTlab zoals we dat voor ogen hebben: een geïntegreerde omgeving voor databewerking en de ontwikkeling van open-source simulatie. Een belangrijk deel van de architectuur is zelfs al ingevuld en inmiddels draaien de eerste projecten al. Om een beeld te geven van ons werk in het lab bespreken we er twee.

Urban Mobility Lab: meer zien door datafusie
Het Urban Mobility Lab-project is een van de eerste kortlopende onderzoeksprojecten in het onderzoeksprogramma van het instituut AMS (AMS staat voor Instute for Advanced Metropolitan Solutions. In dit nieuwe instituut werken publieke en private partijen samen met TU Delft, U/Wageningen en MIT om oplossingen te vinden voor de complexe problemen in metropole regio’s. Zie www.ams-amsterdam.com). De insteek van het project is om data uit heel veel verschillende verkeers- en vervoersbronnen bij elkaar te brengen en aan de hand daarvan multimodale stromen te analyseren. Een belangrijk deel van het Urban Mobility Lab-onderzoek voeren we uit in het DiTTlab.

Om data uit verschillende bronnen te kunnen combineren, moeten die geografisch aan elkaar worden gekoppeld. Ook heb je tools nodig om verschillende doorsnedes uit de database te selecteren. Om te demonstreren hoe dat fuseren in de praktijk gaat en dat het inderdaad leidt tot nieuwe inzichten die niet mogelijk zijn met de databronnen afzonderlijk, hebben we een ‘triple event’ op 28 maart 2015 in Amsterdam Bijlmer-Arena als case genomen. De drie events waren de interland Nederland-Turkije in de ArenA, een André Hazes-tribute in de Ziggo Dome en een Carrebean dance-event in de Heineken Music Hall. Om de verschillende stromen te monitoren zijn de volgende databronnen gebruikt:

  • Kaarten van het gebied, van OpenStreetMap en van de gemeente.
  • Dynamische parkeergegevens rond de ArenA.
  • Aankomst- en vertrekgegevens van metro en trein op station Amsterdam-Bijlmer. We zijn hierbij uitgegaan van data uit OV-chipkaarten.
  • Data van de NDW over het rijkswegennet, het provinciale wegennet en het stedelijke wegennet. De gegevens omvatten intensiteiten, snelheden, reistijden en statusgegevens.
  • Tellingen van voetgangersbewegingen op de ArenA Boulevard en rondom de ArenA. Hiervoor hebben we de technologie van Placemeter gebruikt (IP-camera’s voor het meten van voetgangers- en fietsersbewegingen).

Op het moment van schrijven zijn we ook nog druk bezig om additionele bronnen te ontsluiten, onder meer gegevens van verkeersregelinstallaties in Amsterdam, floating car data en data van de ArenA zelf, te weten in- en uitgaande stromen bij de diverse in- en uitgangen.

Ook ingewikkelde en elkaar kruisende stromen zoals die op ons triple event blijken we dankzij datafusie goed in beeld te kunnen brengen. Een voorbeeld: met de Placemeter-camera’s zijn lang niet alle voetgangersstromen gemeten – dan hadden we het dubbele aantal studenten en camera’s moeten inzetten. Maar de ontbrekende stromen kunnen we reconstrueren door de Placemeter-gegevens te combineren met parkeer- en openbaar-vervoerdata. Als het ook lukt om de data over de in- en uitstroom bij de diverse ArenA-ingangen te verkrijgen, is zelfs een complete herkomst-bestemmingsmatrix samen te stellen van de voetgangersstromen rond het terrein.

NDW Traffic Observatory: intelligente historische database
Het tweede dataproject in DiTTlab, NDW Traffic Observatory, voeren we uit voor NDW. Het doel is om een prototype intelligente historische verkeersdatabase te ontwikkelen, waarin het zoeken naar verkeersgegevens kan plaatsvinden op basis van verkeerskarakteristieken (bijvoorbeeld zware of lichte congestie, x procent extra vertraging) en trefwoorden (zoals weekdag, zwaar ongeluk, regen, bijzondere omstandigheden), in plaats van uitsluitend op basis van tijdsperiodes.

We zullen hiertoe filepatronen, de zogenaamde ‘vlekkenkaarten’, opslaan inclusief de verkeerskarakteristieken en alle mogelijke verklarende factoren (weer, incidenten, evenementen enzovoort). Hiervoor zullen we opnieuw verschillende databronnen geografisch aan elkaar koppelen. Maar we gaan nog een stap verder: het is de bedoeling dat de database leert om zelf filepatronen te classificeren.

We leggen het idee hierachter uit met behulp van figuur 2. Links is een kaartje met de A13 van Rijswijk naar Rotterdam. De grafieken ernaast zijn vier snelheids-vlekkenkaarten op verschillende dagen in de afgelopen paar maanden. Wat direct opvalt zijn de grote verschillen in file- en reistijdpatronen: op 8 juni is er een beperkt aantal filegolven die terugslaan van Rotterdam Zestienhoven. Op 31 mei zien we daarbovenop zwaardere filegolven plus een terugslag vanaf de ruit Rotterdam. Op 28 april en 24 maart is er bovendien sprake van additionele homogene (zware) congestie door een enkele en dubbele rijstrookafsluiting, vanwege respectievelijk een bermbrand en een ongeluk. Grote verschillen in filepatronen dus en even grote verschillen in onderliggende oorzaken. Het is uiteraard onbegonnen werk om voor alle wegen in het NDW-bestand handmatig een dergelijke classificatie te maken. Maar het idee is dat we (1) van een selectie van routes zulke classificaties maken, over verschillende periodes. Vervolgens (2) ontwikkelen we routines die op grond van de voorbeelden leren om deze classificaties automatisch te doen. Die routes hoeven niet beperkt te zijn door een wegnummer: een route kan ook gedefinieerd worden over knooppunten heen.

Als dat lukt, dan kun je gerust van een enorme efficiencyslag spreken. NDW-partners kunnen dan heel gericht zoeken naar spitsperiodes met uitsluitend reguliere files, of juist naar de extremen en uitzonderingen. Bovendien is er directe visuele feedback mogelijk met behulp van de vlekkenkaarten, reistijdkarakteristieken en andere analytics.

Vier verschillende congestiepatronen op de A13 met verschillende karakteristieken en verklarende factoren.
Vier verschillende congestiepatronen op de A13 met verschillende karakteristieken en verklarende factoren.

 
Open-source multiscale multi-modal simulation
Tot zover twee dataprojecten. Wat we ook willen is nieuwe simulatiemodellen ontwikkelen die klaar zijn voor alle technologische veranderingen die zich as we speak voordoen. Dat is een niet te onderschatten uitdaging omdat die modellen om moeten kunnen gaan met meer modaliteiten (bij automatisch transport is bijvoorbeeld de interactie tussen auto’s en langzame modaliteiten interessant), met meer aspecten (zo moeten bij elektrisch vervoer effecten van rijgedrag en de locaties van oplaadpunten meegenomen worden), met meer lagen (zoals de effecten van kilometerheffing die kunnen leiden tot het aanpassen van routes), en met een integratie van planning en uitvoering (bijvoorbeeld slimme apps bij openbaar vervoer of Uber). Om een idee te geven van het werk dat ons hierbij in het verschiet ligt: de simulatiemodellen die momenteel gebruikt worden, zijn veelal gericht zijn op één modaliteit, één modelniveau, en niet in staat om gedrag van individuele actoren gedetailleerd genoeg mee te nemen!

Om toch op het gewenste niveau modellering te komen hebben we in DiTTlab gekozen voor een moderne, open simulatietoolbox geschikt voor meerdere modaliteiten en analyselagen. Met de toolbox kunnen snel simulatie-instrumenten worden ontwikkeld voor een groot aantal typen analyses. De toolbox is open, zowel wat architectuur als wat te gebruiken algoritmes en dataformaten betreft. Door de focus op open en uitbreidbare modules is het relatief gemakkelijk om de toolbox aan te passen voor nieuwe vragen.

Een eerste versie van de toolbox is gereed, en samen met partners vanuit de industrie wordt de functionaliteit stap voor stap uitgebreid met nieuwe algoritmes, invoerfuncties, uitvoerfuncties en analyses. Uitgangspunt hierbij is dat we ons niet beperken tot één algoritme of functionaliteit en dat we een groot aantal invullingen van de functies toelaten. Heldere interfaces helpen om verschillende implementaties te maken van de modules, die tot specifieke simulaties kunnen worden samengevoegd. Later dit jaar zullen de simulaties worden ingezet in de eerste projecten, waar we de aanpak en het gebruiksgemak voor modelontwikkelaars kunnen testen.

Stip op de horizon: samenhang tussen data en simulatieprojecten
De combinatie van nieuwe simulatiegereedschappen met open data is uniek. De aanpak met data driven simulatie stelt onderzoekers en gebruikers in staat om de structuur van modellen automatisch op te bouwen op basis van beschikbare data. Zo worden modellen opgebouwd uit GIS-bestanden en OpenStreetMap. Voor real-time toepassingen kan de momentane toestand van het verkeerssysteem ook automatisch ingeladen worden in het model.
Om alles nog even kort en bondig samen te vatten: met behulp van de ‘OpenTrafficSim’-aanpak binnen DiTTLab is TU Delft klaar om de complexe vervoersvragen van vandaag en morgen te beantwoorden.

____

De auteurs
Prof. dr. ir. Hans van Lint is hoogleraar Traffic Simulation & Computing op de TU Delft.
Prof. dr. ir. Alexander Verbraeck is hoogleraar Systems and Simulation op de TU Delft.