28 februari 2023
Door René Borsje - DOVA/OV-data
Dit artikel is deel 2 van een vierluik over de vernieuwing van het MIPOV.
Vernieuwing MIPOV - Datahuishouding
De vorige nieuwsbrief (december 2022) legt uit dat er gewerkt wordt aan een nieuwe versie van het MIPOV, of voluit het Model Informatieprofiel Openbaar Vervoer. Het MIPOV geeft aan hoe vervoerders welke informatie in welke frequentie aan hun concessieverlener dienen te leveren. Deze informatie is namelijk nodig voor onder meer concessiebeheer, aanbestedingen en voor verantwoording. Ook is die informatie gewenst voor het nauwlettend volgen van ontwikkelingen en het maken van beleid. De vernieuwde versie van het MIPOV legt meer nadruk op de aanlevering van data, dan de huidige versie, die uitgaat van de aanlevering in tabelvorm.
Het MIPOV richt zich met data op drie hoofdgroepen. De eerste hoofdgroep is de dienstregeling en de uitvoering daarvan: aanbod en uitvoeringskwaliteit. De tweede hoofdgroep gaat over het reisgedrag. En de derde hoofgroep gaat in op (on)gemak (denk aan klachten, verstoringen en duurzaamheid). Voor de vernieuwing van het MIPOV wordt zoveel mogelijk gebruik gemaakt van bestaande standaarden, zoals SIRI en NeTEx. De laatstgenoemde standaard bevat informatie over de dienstverlening (zie hiervoor ook BISON). Verder is ook aansluiting bij het landelijke project Open Data voor de informatiehuishouding vanuit Translink, die werkt met data die gegenereerd worden met de OV-chip en nu ook OV-pay. Hoewel dit project zich met name richt op informatie over concessiegrenzen heen, kan deze werkwijze ook binnen concessies worden toegepast. Een eenduidige aanpak draagt bij aan consistentie en samenhang.
Waarom data in plaats van tabellen?
Strikt genomen is een tabel ook een dataset. De kolommen zijn de variabelen en de regels de zogenoemde records. In het vernieuwde MIPOV beschikken we over meer gedetailleerde informatie. De gebruiker kan daarbij zelf de afweging maken wat belangrijk is om weer te geven in een notitie, verslag of in een dashboard. Anders gezegd: er ontstaat meer flexibiliteit voor de rapportage. Een ander voordeel van het werken met meer gedetailleerdere datasets (meer variabelen èn records) is dat diepgaandere analyse mogelijk is. Anders dan bij geaggregeerde tabellen kunnen verschillende ontwikkelingen en verschillen op recordniveau worden weergegeven.
Data delen
OV-autoriteiten en vervoerders zijn niet de enige actoren met een informatiebehoefte met betrekking tot het OV. Naast kennisinstellingen en universiteiten willen ook belangenorganisaties, adviesbureaus en individuen meer weten over het OV. Vanuit de privacywetgeving en goed opdrachtgeverschap is het niet toegestaan en/of wenselijk om alle informatie op detailniveau te delen. Wel is het wenselijk dat de informatie die gedeeld wordt, optelbaar en vergelijkbaar is. Om dat mogelijk te maken zijn afspraken nodig over hoe cijfers zo eenduidig mogelijk tot stand komen en gebruikers gewaarschuwd worden voor eventuele misinterpretatie. Voor OV-autoriteiten en vervoerders met meer dan één concessie is het wel zo efficiënt om afspraken te maken over hoe die cijfers worden aangeleverd. Dit geldt niet alleen voor lopende concessies. Ook voor nieuwe concessies en aanbestedingen biedt dit efficiëntievoordeel.
Naast het voordeel van eenduidige levering en verwerking, is er misschien nog wel een belangrijker argument voor deze eenduidige aanpak. Door te werken met standaarden is het namelijk mogelijk om de datakwaliteit efficiënt en effectief te monitoren. Geleverde databestanden kunnen eenduidig worden gecontroleerd op volledigheid, consistentie en uitschieters. Dergelijke controle op datakwaliteit draagt namelijk bij aan het vertrouwen en het gebruiken van die data. Hoe meer de dezelfde data door meer partijen wordt gebruikt - zelfs al is het geaggregeerd - dan wordt voorkomen dat er langs elkaar heen wordt gewerkt. Of dat er nodeloos tijd wordt verspild aan het verklaren of begrijpen van eventuele verschillen: men kan zich dan gericht focussen op datagedreven beleid.