Methodiek
Methodiek
Callejear combineert meerdere officiële en openbare databronnen tot een samenhangend straatprofiel. Hieronder leggen we uit hoe dat werkt.
Stap 1 — Databronnen koppelen
Elke straat wordt geïdentificeerd via de Basisregistratie Adressen en Gebouwen (BAG) van het Kadaster. Dit is de bron voor gebouwen, adressen, bouwjaren en oppervlakten. Via de BAG-identificatie koppelen we aanvullende bronnen:
- CBS Kerncijfers: demografie, inkomen, huishoudsamenstelling op buurtniveau
- WOZ: vastgoedwaarderingen via CBS
- EP-Online: energielabels per adres
- GTFS/OVapi: openbaar vervoer (haltes, lijnen, frequenties)
- OSM: voorzieningen (winkels, scholen, parken, horeca)
- RIVM: geluidbelasting (Lden)
- PDOK: overstromingsrisicozones
Stap 2 — Kwaliteitscontrole
Niet elke straat heeft voldoende data voor een betrouwbaar profiel. Elke pagina toont een datakwaliteitsscore met het dekkingspercentage per bron. Straten met onvoldoende data worden gemarkeerd, zodat bezoekers weten waar de informatie nog beperkt is.
Stap 3 — Scores berekenen
De leefbaarheidsscore (0-100) is een gewogen gemiddelde van zeven componenten. Elke component draagt bij volgens een vast gewicht:
- Voorzieningen / loopbaarheid (20%) — nabijheid van winkels, zorg, horeca en dagelijkse voorzieningen binnen loopafstand (bron: OSM)
- Bereikbaarheid / OV-connectiviteit (15%) — aantal OV-lijnen, halteafstand en frequentie (bron: GTFS/OVapi)
- Luchtkwaliteit (15%) — luchtkwaliteitsindex op basis van metingen en modeldata (bron: RIVM/Open-Meteo)
- Geluidsniveau (15%) — gemiddelde geluidbelasting in dB Lden (bron: RIVM geluidskaarten; bij ontbreken: geschat op basis van omgevingskenmerken)
- Overstromingsrisico (15%) — risico op wateroverlast op basis van overstromingskaarten (bron: PDOK)
- Fietsbaar (10%) — fietsvriendelijkheid op basis van nabijheid van fietsinfrastructuur en bestemmingen (bron: OSM)
- Groen (10%) — nabijheid van parken en groenvoorzieningen (bron: OSM)
Wanneer een component niet beschikbaar is voor een straat, wordt een neutrale fallbackwaarde van 60 gebruikt. Dit wordt vermeld in het datakwaliteitsoverzicht op de straatpagina.
Overige scores
Naast de leefbaarheidsscore berekenen we ook deelscores:
- Woningkwaliteit — gemiddelde van vloeroppervlakte, energielabel en bouwjaar (elk 33%)
- Stadslust — combinatie van activiteitenaanbod, loopbaarheid en OV-connectiviteit (elk 33%)
- Groen — parken en luchtkwaliteit (elk 50%)
Transparantie over schattingen
Sommige waarden worden geschat wanneer officiële data ontbreekt:
- Geluidsniveau: wanneer RIVM-data ontbreekt, schatten we het geluidsniveau op basis van OV-connectiviteit, aantal voorzieningen en commerciële panden. Dit wordt op de pagina gemarkeerd als schatting.
- Huurprijs per m²: afgeleid van de WOZ-waarde per m² (factor 0,0032). Dit is een indicatieve schatting, geen marktprijs. Dit wordt op de pagina gemarkeerd als schatting.
Stap 4 — Redactionele laag
Bovenop de ruwe data genereren we een redactionele samenvatting per straat. Deze beschrijft het straatprofiel, geeft context bij de cijfers en wijst op opvallende kenmerken. De tekst wordt algoritmisch gegenereerd op basis van de data en is per straat uniek.
Beperkingen
Wij melden altijd eerlijk wat we niet weten. Ontbrekende data (bijvoorbeeld energielabels of voorzieningen) wordt expliciet vermeld op elke pagina. Onze scores zijn indicatief en vervangen geen professioneel advies.
Wanneer minder dan ongeveer 55% van de componenten van de leefbaarheidsscore onderbouwd is met gemeten data, tonen we de score helemaal niet meer. Zo voorkomen we dat een straat zonder geluid-, lucht- of overstromingsdata automatisch een opgeblazen cijfer krijgt dat uitsluitend steunt op bereikbaarheidsindicatoren.
Updates
De onderliggende data wordt periodiek bijgewerkt wanneer nieuwe versies van de bronbestanden beschikbaar komen (BAG, CBS, WOZ). De datum van de laatst verwerkte data staat vermeld op elke pagina.
Verantwoordelijk redacteur
Methodiek en redactionele lijn: Yoel Castaño (LinkedIn). Feedback of correcties: [email protected].