Tutorial: Innovaties in keuzemodellen

Keuzemodellen modelleren het keuzegedrag van mensen op een wiskundige manier. Ze worden over de hele wereld gebruikt om keuzegedrag kwantitatief te analyseren en te voorspellen. Toepassingen variëren van stemgedrag van kiezers tot consumentenvoorkeuren voor de nieuwste smartphone. Maar ook onze mobiliteitskeuzes laten zich prima modelleren. Hoe dat werkt en hoe een en ander zich in de afgelopen decennia ontwikkeld heeft, bespreken we in deze tutorial Keuzemodellen.

In het transportdomein spelen keuzemodellen een cruciale rol. Om maar een paar toepassingen te noemen: we gebruiken ze voor de analyse en optimalisatie van verkeersstromen, we voorspellen er de effecten van nieuwe transporttechnologieën mee en keuzemodellen vormen de basis van maatschappelijke kosten-batenanalyses.

Gegeven het belang van deze modellen voor ons vakgebied, is het niet verbazingwekkend dat veel van de belangrijkste innovaties in keuzemodellen hun oorsprong vinden in ons transportdomein. Reden om in deze tutorial de belangrijkste ontwikkelingen van de laatste decennia op een rij te zetten.

De basis: het Logit-model
Begin jaren 1970 introduceerde Daniel McFadden het zogeheten Logit-model. Centraal in dit model staat de logit-keuzekansformule. Deze formule bestond al langer, maar het was McFadden die er een econometrische conceptualisatie aan verbond die in één klap een fundament bood voor de analyse van keuzegedrag. Het door McFadden ontwikkelde Random Utility Maximization (RUM) Logit-model is gebaseerd op de veronderstelling dat mensen het alternatief (bijvoorbeeld: de vervoerswijze) kiezen met het hoogste nut (U), en dat we een deel (V) van dit nut kunnen verklaren door de kenmerken van het bewuste alternatief. Dit zogenaamde systematische nut V is een functie van relevante factoren en hun gewicht: bijvoorbeeld de reistijd en rijstijdbetrouwbaarheid van een vervoerswijze, en het belang van beide factoren voor de reiziger. Een ander deel van het nut wordt niet bekend verondersteld (‘niet geobserveerd’). Wanneer we aannemen dat dit deel van het nut zijn eigen statistische verdeling heeft – we modelleren het niet-geobserveerde nut met een storingsterm ε – dan komen we voor de keuzekans P op de volgende eenvoudige formule:

Omdat deze formule een gesloten vorm heeft, kunnen we heel gemakkelijk de kans P berekenen dat alternatief i gekozen wordt uit een keuzeset met J alternatieven.

In de jaren zeventig van de vorige eeuw opende dit de deur om op een nieuwe gedesaggregeerde manier reizigersgedrag te voorspellen. Nadat een keuzemodel is geschat op basis van geobserveerde keuzes (van bijvoorbeeld vervoerswijze), kan de onderzoeker het belang van de verschillende factoren statistisch bepalen. Bijvoorbeeld: hoeveel belangrijker is reistijdwinst dan een verhoging van de reistijdbetrouwbaarheid? Ook kunnen we het keuzemodel gebruiken om het marktaandeel van een nieuw stuk snelweg of een nieuwe OV-verbinding te voorspellen.

Innovaties in de 20e eeuw
In de eerste twee decennia sinds de introductie van het Logit-model waren de meeste innovaties in keuzemodellen gericht op de storingsterm ε. Het bleek namelijk dat de meest praktische specificatie van deze term in veel gevallen onrealistische voorspellingen opleverde. Dit was met name het geval wanneer er sprake was van een keuzeset waarin sommige alternatieven veel op elkaar leken, en dus kenmerken deelden. Denk bijvoorbeeld aan een keuze tussen de auto, tram en bus: de laatste twee opties zijn beiden OV en delen dus een aantal kenmerken. In zo’n geval geeft de storingsterm van het Logit-model geen goede weergave van wat het probeert te modelleren (het niet-geobserveerde nut), en dit leidt tot verkeerde voorspellingen.

Onderzoekers kwamen al snel met alternatieve specificaties, die meer realistisch keuzegedrag voorspelden. Sommige van deze modellen hebben inmiddels ook ruimschoots hun weg gevonden naar de beroepspraktijk. Denk aan het Nested Logit-model, het Cross-Nested Logit-model, en het Path-Size Logit-model.

Sinds de eeuwwisseling is de aandacht voor de storingsterm afgenomen, deels omdat de belangrijkste verbeteringen al zijn bedacht. In het vervolg van deze richten we ons daarom op enkele andere innovaties van recentere datum.

De wiskunde van gedrag
Traditioneel gezien hechten de ontwerpers van keuzemodellen zeer aan verankering in klassieke economische axioma’s van rationeel keuzegedrag, en aan gebruiksvriendelijkheid van het model. Neem bijvoorbeeld de specificatie van het systematisch nut V in de context van een afweging tussen reistijd T en reistijdbetrouwbaarheid B. De meest praktische en rationele specificatie van V is lineair-additief:

In woorden: de reiziger beoordeelt de vervoerswijze op beide factoren, en vermenigvuldigt elke score met het bijbehorende gewicht. De som van deze deelnutten geeft de eindscore, ofwel het totale systematisch nut van de vervoerswijze. Deze specificatie van V klinkt heel intuïtief, maar decennia van gedragsonderzoek heeft aangetoond dat werkelijk keuzegedrag vaak lang niet zo rationeel tot stand komt als door dit model verondersteld wordt.

Zo toonden Daniel Kahneman en Amos Tversky in hun Nobelprijs-winnende Prospect Theory aan, dat het niet zozeer de absolute waarden van bijvoorbeeld reistijd en betrouwbaarheid zijn die ertoe doen, maar hoe deze waarden zich verhouden tot het referentiepunt van de reiziger. Een negatieve afwijking ten opzichte van het referentiepunt – bijvoorbeeld een reistijd die langer is dan die van de gebruikelijke route – telt bovendien aanmerkelijk zwaarder dan een positieve afwijking. Deze ‘verliesaversie’ is inmiddels ook breed geaccepteerd in de economische wetenschap, en er zijn verschillende keuzemodellen die er rekening mee houden.

Het grootste probleem van deze op verliesaversie gebaseerde keuzemodellen, is dat het niet evident is wat het referentiepunt is van de reiziger, en dus wélk referentiepunt de onderzoeker moet gebruiken in zijn keuzemodel. Neem het voorbeeld van routekeuze en reistijd. Is de reistijd op een gemiddelde dag het referentiepunt, of de ‘free flow’ reistijd zonder vertraging, of de door de reiziger verwachte reistijd? Recent onderzoek laat zien dat afhankelijk van het door de onderzoeker gekozen referentiepunt, de modeluitkomsten flink uiteen kunnen lopen. Dit is een interessant maar ook zorgwekkend inzicht: er is nog heel wat vervolgonderzoek nodig over de rol van referentiepunten in keuzegedrag!

Ook aan de TU Delft worden keuzemodellen ontwikkeld die uitgaan van beperkte rationaliteit. De door ons ontwikkelde aanpak is gebaseerd op het in de gedragswetenschappen zeer gangbare idee dat mensen bij het maken van keuzes spijt achteraf willen vermijden (in tegenstelling tot de veronderstelling dat mensen nut maximaliseren). Dit zogenaamde spijtmodel is verwant aan de hierboven genoemde notie van verliesaversie, met als belangrijkste verschil de specificatie van het referentiepunt: het spijtmodel gaat ervan uit dat mensen de verschillende keuzealternatieven vergelijken op elke afzonderlijke factor. De prestaties van de concurrerende alternatieven vormen het referentiepunt. Bijvoorbeeld: de reistijd van een route wordt vergeleken met de reistijd van elke andere route en hetzelfde gebeurt voor reistijdbetrouwbaarheid. Is jouw route langzamer dan een concurrent, dan levert dat spijt op. Hoe groter het verschil, en hoe groter het gewicht dat je hecht aan reistijd, hoe groter de spijt. Net als in Prospect Theory, krijgt spijt een zwaarder gewicht dan zijn positieve tegenhanger, door economen ‘rejoice’ genoemd.

In formulevorm ziet de spijt die een reiziger anticipeert bij het vergelijken van de reistijd van twee mogelijke vervoerswijzen er als volgt uit:

Hier staat ∆ voor het verschil in reistijd tussen de twee alternatieven. Spijtaversieparameter μ wordt geschat, en geeft aan hoeveel meer gewicht mensen in een bepaalde keuzesituatie hechten aan spijt dan aan ‘rejoice’. Als beide aspecten even belangrijk blijken te zijn, is het spijtmodel equivalent aan het klassieke, lineair-additieve nutsmodel. De elegantie van dit zogenaamde μRRM-model zit hem dus in het feit dat de onderzoeker niet a priori hoeft te kiezen voor een bepaalde beslisregel – spijt of nut.
Dit model is inmiddels opgenomen in de meest gebruikte econometrische softwarepakketten.

Het modelleren van heterogeniteit
Geen mens maakt keuzes op exact dezelfde manier en ook is geen keuzesituatie gelijk. Er is om die reden veel onderzoek verricht naar het modelleren van heterogeniteit in keuzegedrag. In eerste instantie probeerden onderzoekers heterogeniteit te vangen door segmentatie op basis van bijvoorbeeld geslacht, opleidingsniveau of inkomen. Zo kon men bijvoorbeeld achterhalen of hoger opgeleiden een ander gewicht toekenden aan reistijdonbetrouwbaarheid dan lager opgeleiden. Hoewel dit type heterogeniteit belangrijk is en deze segmentatiemodellen nog steeds veel gebruikt worden, zijn ze onvolledig: ze missen de aanzienlijke heterogeniteit binnen segmenten. Met andere woorden, ook twee personen met dezelfde sociodemografische achtergrond kunnen zeer van elkaar verschillen in keuzegedrag. Econometristen noemen dit ongeobserveerde heterogeniteit.

Sinds de ontdekking van het Logit-model wisten onderzoekers al hoe ze ongeobserveerde heterogeniteit moesten modelleren: door parameters (de gewichten) volgens een statistische verdeling te laten variëren tussen mensen. Zo kan het gewicht van de factor ‘reistijd’ een verdeling in de populatie volgen. Hoewel iedereen lagere reistijden zal prefereren, varieert de mate waarin men gevoelig is voor reistijd aanzienlijk in de populatie. Het Mixed Logit-model, dat dit type ongeobserveerde heterogeniteit kan modelleren, produceert aanzienlijk betere voorspellingen dan (al dan niet gesegmenteerde) conventionele Logit-modellen.

Toch duurde het ruim 25 jaar voordat het Mixed Logit-model populair werd. De reden is simpel: tot de eeuwwisseling was de rekencapaciteit van computers niet toereikend om de integralen van het Mixed Logit-model uit te rekenen. Nog steeds kan het dagen duren voordat een Mixed Logit-model geschat is, zeker als het aantal integralen oploopt, wat het geval is als de onderzoeker vermoedt dat meerdere gewichten variëren in de populatie.

De afgelopen paar jaar is het Mixed Logit-model op zijn beurt onderwerp van kritiek geworden. De reden? Het is niet flexibel genoeg, omdat het vereist dat de onderzoeker a priori de statistische verdeling van de gewichten bepaalt. Deze verdeling (bijvoorbeeld de Normaalverdeling of de Lognormaalverdeling) hoeft niet overeen te komen met hoe de gewichten werkelijk variëren binnen de populatie. Bovendien blijkt dat de modeluitkomsten sterk beïnvloed worden door de gekozen verdeling. De oplossing voor deze uitdaging is onlangs gevonden in zogenaamde Latente Klasse-modellen. Deze veronderstellen dat er verschillende klassen van individuen zijn, en dat elke klasse verschilt in termen van gewichten en beslisregels. In plaats van dat de onderzoeker van te voren specificeert hoeveel klassen er zijn, wie in welke klasse zit, en hoe de klassen van elkaar verschillen in gewichten en beslisregels, wordt dit overgelaten aan het proces van modelschatting. Met andere woorden, de data spreken voor zich. Recent onderzoek laat zien, dat deze Latente Klasse-modellen het niveau van modelleren weer een trede hoger hebben getild, omdat ze flexibeler zijn dan Mixed Logit-modellen en minder afhangen van inschattingen van de onderzoeker. Ze leveren ook waardevolle informatie op over de verdeling van gewichten en beslisregels over de populatie. Ze staan toe om te testen wat er nu precies voor zorgt dat bepaalde individuen (met bepaalde persoons- en situatiekenmerken) behoren tot een bepaalde klasse. Welke kenmerken bepalen of iemand bijzonder spijtavers is, of bovengemiddeld waarde hecht aan betrouwbare reistijden? Tot slot: we kunnen zonder veel problemen elementen van segmentatie- en Mixed Logit-modellen integreren in Latente Klasse-modellen, wat hun aantrekkingskracht verder vergroot.

Innovaties in dataverzameling: keuze-experimenten
Een keuzemodel is zo betrouwbaar als de data waarmee het geschat is. Veel van het onderzoek in ons vakgebied gaat dan ook over dataverzameling: hoe observeer je keuzes die een betrouwbare basis vormen voor modelschatting en -toepassing? Traditioneel zijn zogenaamde Stated Preference (SP)-data populair in mobiliteitsonderzoek. Deze data verzamelen we met behulp van zogenaamde keuze-experimenten, waarin deelnemers wordt gevraagd om te kiezen uit een set van hypothetische alternatieven. De voordelen van deze manier van dataverzameling zijn evident: de experimentele opzet zorgt voor systematiek en controle. Ook is het mogelijk om met de SP-methode keuzes voor nog niet bestaande alternatieven, zoals een nieuwe OV-dienst, te onderzoeken.

Inmiddels zijn onderzoekers erin geslaagd om optimale SP-experimenten te ontwerpen, die efficiënt zijn in de zin dat ze met een minimaal aantal respondenten betrouwbare modelschattingen garanderen. Innovaties op dit gebied zitten met name in het optimaliseren van experimenten voor de steeds betere modellen die beschikbaar komen. Zo toont onderzoek van de TU Delft in samenwerking met de Universiteit van Sydney aan, dat een experiment dat optimaal is voor nutsmaximaliserend keuzegedrag, bijzonder inefficiënt kan zijn voor de analyse van spijtgebaseerd keuzegedrag. Hetzelfde geldt voor experimenten die voor Mixed Logit versus standaard Logit geoptimaliseerd zijn. Hiervoor is inmiddels gebruiksvriendelijke software ontwikkeld, zodat ook buiten de wetenschap het gebruik van efficiënte keuze-experimenten gemeengoed aan het worden is.

Conclusie
Keuzemodellen spelen al ruim veertig jaar een cruciale rol in het transportdomein. Er is in die tijd grote vooruitgang geboekt, bijvoorbeeld in het modelleren van beperkt rationeel gedrag en heterogeniteit, en in het efficiënt verzamelen van betrouwbare data. Veel van deze ontwikkelingen hebben inmiddels hun weg gevonden naar de beroepspraktijk, waar ze leiden tot betere voorspellingen van verkeer en mobiliteit. De relevantie van deze ontwikkelingen voor de beleidspraktijk is moeilijk te overschatten.

____

De auteurs
Prof. dr. ir. Caspar Chorus is hoogleraar Choice behavior modeling aan de TU Delft en hoofd van de sectie Transport en Logistiek.
Dr. ir. Sander van Cranenburgh is universitair docent aan de TU Delft.

Gerelateerde berichten

Hoe zelfrijdende voertuigen op de weg ons rijgedrag beïnvloeden

Discussietafel Auto: “We moeten nú thuiswerkbeleid maken”

Het nieuwe normaal in verkeer en vervoer