Hans van Lint, Hoogleraar verkeersimulatie TU Delft: “Big data kan ons veel verder brengen”

______
Dit artikel hoort bij het thema-artikel ‘Big data in het mobiliteitsdomein’.
______

“Het beschrijven en begrijpen van individueel rij- en reisgedrag en van de resulterende verkeer- en vervoerstromen is een empirische wetenschap. Simpel gezegd: kennis van verkeer en vervoer begint en eindigt met data. In die data herkennen we terugkerende patronen. Op basis daarvan stellen we allerlei hypotheses op en bedenken we theorieën en modellen. Die toetsen we vervolgens met behulp van nieuwe data en zo is de cirkel rond. We doorlopen die cirkel continu – dat is de wetenschappelijke methode! – en elke nieuwe ronde levert weer nieuwe inzichten op. Inmiddels hebben we daarmee een sterk bouwwerk van theorieën en modellen gebouwd.

Toch kraakt en piept dat bouwwerk hier en daar nog behoorlijk en op sommige plekken ontbreekt zelfs de fundering. Daarom wil ik kort bespreken hoe de vlag er in ons vakgebied bijstaat en hoe big data ons (veel!) verder kan brengen.

Laat ik beginnen met reisgedrag. Om reisgedrag te begrijpen onderzoeken we alle korte- en langetermijnbeslissingen die leiden tot vervoer en uiteindelijk verkeer tussen A en B. Er zijn behoorlijk wat theorieën bedacht die voorspellingen doen over hoe we die beslissingen maken: waarnaartoe, met welke vervoerwijze, hoe laat en langs welke routes. De oudste veronderstellen dat reizigers rationele, alwetende rekenmachines zijn die alle opties naast elkaar leggen en de optie kiezen met het meeste ‘nut’, wat dat ook moge zijn. Gedragswetenschappers hebben inmiddels veel realistischere alternatieven bedacht, zoals ellende-minimalisatie, risicovermijding en nog veel meer. Niettemin, al die beslistheorieën zijn – en ik citeer een Amerikaanse collega – “assumption-rich and data-poor”. Als we dus niet op grote schaal individuele data verzamelen over gedrag én context om die beslistheorieën te toetsen, blijven de voorspellingen die we ermee maken op z’n best twijfelachtig.

Dan verkeersafwikkeling. We hebben de dynamica van files en wachtrijen op snelwegen behoorlijk in de vingers. Mits we voldoende data hebben kunnen we met die macroscopische modellen zelfs heel aardige voorspellingen doen. Ook van voetgangers begrijpen we de macroscopische dynamica en fenomenologie redelijk, hoewel het doen van voorspellingen hier al veel lastiger is: voetgangersverkeer is sterk contextafhankelijk.
Maar zodra we een niveau dieper gaan, naar individueel rij-, loop- en fietsgedrag, neemt het aantal theorieën drastisch toe. De meeste theorieën kunnen één of meer fenomenen beschrijven of zelfs verklaren, zoals voertuigvolggedrag of rijstrook wissellen, maar ze gaan weer nat op andere fenomenen. De reden is simpel: we hebben de data (nog) niet om de onderliggende gedragsaannames te verifiëren of falsifiëren. Voor sommige fenomenen, waarbij bijvoorbeeld interacties tussen verkeersdeelnemers plaatsvinden, bestaan zelfs helemaal nog geen consistente theorieën.
Ook hier geldt dus: als we niet op grote schaal microscopische data over rijgedrag en context verzamelen om de modellen te toetsen, blijven de voorspellingen die we ermee maken vooral ‘an educated guess’.

Ik zie dus ongelooflijk mooie kansen voor het gebruik van big data, mits we die combineren en fuseren met de data die we al hebben en de kennis die al bestaat. Dat is niet alleen van belang voor mijn promovendi, maar voor iedereen die gebruik maakt van modellen om voorspellingen te doen over verkeer en vervoer. Kennis over verkeer en vervoer begint en eindigt met data. Chocola maken van big data begint en eindigt met kennis over verkeer en vervoer.”