Kansen voor het OV: data van gsm en OV-chipkaart combineren

De grootste uitdaging van de openbaarvervoersector is om tegemoet te komen aan de verscheidenheid aan reispatronen en de bijbehorende behoeften en voorkeuren van reizigers. Maar hoe doe je dat? Hoe kun je vraag en aanbod van OV beter matchen? Bestaande databronnen helpen, maar zijn nog niet afdoende. De combinatie van nieuwe bronnen – gsm en OV-chipkaart – biedt echter mogelijkheden.

 

 
In het openbaarvervoerdomein gebruiken we verschillende databronnen om het OV-netwerk te ontwerpen, te monitoren en up-to-date te houden. Voorbeelden zijn het Onderzoek Verplaatsingen in Nederland (OViN), locatiegegevens van OV-voertuigen (via NDOV), geanonimiseerde OV-chipkaartdata en onderzoeken en realtime-gegevens op basis van gsm-data, wifi, bluetooth en social media.

Al deze bronnen bieden unieke informatie – maar niet het complete plaatje. Neem het OViN: dit onderzoek geeft een goed beeld van de totale reisbehoefte en de ruimtelijke spreiding hiervan, maar biedt geen inzicht in de spreiding van de reisbehoefte over de tijd. De gedetailleerde OV-chipkaartdata vertellen ons alles over de vraag naar openbaar vervoer, maar zeggen weer niets over de totale vervoersvraag.
De gsm-data zijn afgeleid van de belrecords van één provider: het betreft de locatie en tijd wanneer de telefoon verbinding maakt met een antenne. Hoe vaker de telefoon gebruikt wordt (bellen, sms’en of dataverbruik), hoe vaker deze verbinding maakt met een antenne. De gsm-data van de provider zijn met behulp van een algoritme opgehoogd naar de totale populatie. Deze gegevens zijn gevalideerd en zeer betrouwbaar gebleken. De gsm-data geven daarmee interessante informatie over verplaatsingsgedrag in het algemeen, zoals herkomst-bestemmingsgegevens gedurende de dag en indicaties van de gebruikte vervoerswijze. Wegens privacy en om redenen van betrouwbaarheid zijn de gsm-data echter alleen beschikbaar op een ruimtelijk geaggregeerd niveau (zones van een of meer postcode-4 gebieden).

Als het gaat om het ontwerpen van OV-netwerken en het matchen van vraag en aanbod in openbaar vervoer, biedt elk van deze bronnen toegevoegde waarde. Maar wat bovenstaande voorbeelden ook goed laten zien, is dat de bronnen elkaar kunnen aanvullen: wat de ene niet levert, heeft de andere in huis. Datafusie biedt dus mogelijkheden.

Gsm en OV-chipkaart
In een gezamenlijke studie van TU Delft, Goudappel en DAT.Mobility hebben onderzoekers een methodiek ontwikkeld om OV-chipkaartdata en gsm-data te combineren. Zoals al blijkt uit het bovenstaande, vullen deze datasets elkaar perfect aan: de eerste biedt detailinformatie, maar dan alleen over het OV-gebruik; de tweede is ruimtelijk gezien veel minder gedetailleerd maar het gaat wel over verplaatsingsgedrag in het algemeen. Door deze bronnen samen te voegen kunnen we het openbaarvervoergebruik zonegewijs analyseren in relatie tot de totale vervoersvraag. Het is daarbij mogelijk zowel de ruimtelijke als de temporele patronen van OV-gebruik te vergelijken met de totale ruimtelijke en temporele reispatronen. En dat biedt weer inzicht in de (mis)match van vraag en aanbod in ruimte en tijd – ideaal om OV-potentie op te sporen!

Case study Rotterdam
Werkt dat ook zo in de praktijk? Om dat te onderzoeken hebben we de datafusiemethode toegepast in een case study Rotterdam, in samenwerking met RET. In deze studie onderzochten we of het huidige OV-bedieningsinterval voldoende aansluit bij de latente vraag. Preciezer geformuleerd: komt het OV-aanbod in de late avond en vroege ochtend overeen met een respectievelijke daling dan wel stijging in de algehele vraag naar vervoer? Alle werkdagen tussen 5 januari en 31 mei 2015 zijn in deze studie meegenomen, met uitzondering van een aantal dagen waarin grote evenementen plaatsvonden.

De resultaten laten goed uitkomen dat er in Rotterdam potentie is om het OV-bedieningsinterval in de vroege ochtend en in de late avond uit te breiden. Uit de gefuseerde data blijkt bijvoorbeeld dat in de vroege ochtend, juist voordat het OV wordt opgestart, er een uur-tot-uur toename in bezoekersaantallen van 33% tot 88% kan worden waargenomen in diverse delen van de Rotterdamse regio – zie figuur 1. Hierbij is ook de netto-verandering in bezoekersaantallen geanalyseerd. Dit illustreert de potentiële vraag voor extra openbaarvervoeraanbod in de vroege ochtend: in een aantal zones neemt het aantal bezoekers fors toe (zones zijn groen tot donkergroen gekleurd) terwijl het OV-bedieningsinterval juist laag is (stippen zijn lichtrood).
Op vergelijkbare wijze hebben we een analyse uitgevoerd voor het OV-aanbod in de late avond – zie figuur 2. Wederom zijn er ‘mismatches’ zichtbaar, daar waar de kleuren van de zones en de stippen afwijken.
 

Figuur 1: Relatieve veranderingen ten opzichte van het vorige uur gedurende werkdagen in de vroege ochtend in Rotterdam voor bezoekersdrukte (kleur van de zone) en OV-gebruik (kleur van stip in de zone).

 
Figuur 2: Relatieve veranderingen ten opzichte van het vorige uur gedurende werkdagen in de late avond in Rotterdam voor bezoekersdrukte (achtergrondkleur van de zone) en OV gebruik (kleur van stip in de zone).

 
Na deze eerste ‘potentiescan’ moet de latente OV-vraag nog in meer detail onderzocht worden. Hierbij dienen we de mogelijke lijnvoeringen en het OV-marktaandeel in beschouwing te nemen, aangezien het OV-aanbod tijdens deze uren niet een volledige modal shift zal realiseren. Om vast te stellen of het uitbreiden van het OV-bedieningsinterval kansrijk is, zijn inschattingen voor het gebruik van OV en de kosten voor extra aanbod noodzakelijk.

Hoe dan ook, de datafusie van OV-chipkaartdata en gsm-data blijkt van toegevoegde waarde ter ondersteuning van OV-planning: in de Rotterdamse case study kon de OV-vinger op de juiste plek (en tijd) worden gelegd.

Een tweede case study in Amsterdam, in samenwerking met GVB, bevestigt die waarde. In deze studie hebben we de effecten van speciale ‘evenementen’ – festivals bijvoorbeeld, maar ook verstoringen in het transportnetwerk – op de volledige vervoersvraag en OV-reispatronen onderzocht. Ook nu lieten de verschillen tussen beide mobiliteitspatronen zien dat er op verschillende momenten en in verschillende gebieden nog OV-potentie was.

Meer toepassingen
De methode om de twee datasets te fuseren is in principe geschikt om een grote range aan datasets met (geaggregeerde of gedesaggregeerde) informatie over herkomsten en bestemmingen te fuseren.

De toepassingen zijn ook divers. In de Rotterdamse studie hebben we gezocht naar de match tussen vervoersvraag en OV-aanbod, maar de datafusie kan meer details opleveren. Op afstanden groter dan 10 kilometer is het bijvoorbeeld mogelijk om in de gsm-data modaliteiten te onderscheiden. Voor die afstanden kunnen we bovendien herkomsten en (vervolg)bestemmingen van reizigers gedurende de dag onderscheiden. Dat geeft een goed beeld van de richting van de potentiële OV-vraag.

____

De auteurs
Karin de Regt is adviseur Openbaar vervoer, parkeren en locatieontwikkeling bij Goudappel Coffeng.
Niels van Oort is adviseur Openbaar vervoer bij Goudappel Coffeng en assistant professor Openbaar vervoer bij TU Delft.
Oded Cats is assistant professor Openbaar vervoer bij TU Delft.
Hans van Lint is hoogleraar Verkeersimulatie en -data bij TU Delft.