Geographische voorspelling van de levensverwachting met behulp van machine learning

Aanvraag voor: Gezondheidsmonitor Volwassenen en Ouderen 2016
Type: Toegang tot databestand
Status: In behandeling
Bestanden:
Gegevens aanvrager
Organisatie: Erasmus Universiteit & Nationale Nederlanden
Adres organisatie:

Burgemeester Oudlaan 50

3062PA Rotterdam

Aanvraaggegevens
Titel onderzoek: Geographische voorspelling van de levensverwachting met behulp van machine learning
Is uw organisatie opdrachtgever voor het onderzoek?
Ik doe het onderzoek voor mijn master scriptie. Het onderzoek voer ik uit bij Nationale Nederlanden. Zij zijn benieuwd hoe de levensverwachting door Nederland verdeeld is.
Voert u dit onderzoek uit in samenwerking met andere organisaties, zoals universiteiten en onderzoekinstituten?
Erasmus Universiteit
Omschrijving van onderzoek:
Voor mijn onderzoek probeer ik in kaart te brengen welke variabelen van groot belang zijn voor de gerealiseerde levensverwachting in 2016. Ik maak gebruik van de sterftekansen van het CBS en de verdeling van de populatie (op basis van leeftijd) om de verwachte overlijdensgevallen te vergelijken met de werkelijke overlijdensgevallen. Als input variabelen geef ik de uitkomsten van de survey van uw onderzoek van het gezondheidsmonitor. In eerste instantie gebruik ik een Multinomial Logit model (vrijwel lineair), waarna ik hetzelfde ga proberen voor het niet-lineaire Feedforward Neural Network model (simpel machine learning techniek). Ik ben benieuwd hoe sommige variabelen belangrijker / minder belangrijk worden als het model niet-lineair wordt en hoop dit te kunnen verklaren. Vervolgens wil ik in kaart brengen of het belang van de variabelen hetzelfde is door nederland. Omdat ik met een machine learning techniek werk is het van groot belang dat ik zo veel mogelijk data gebruik, dat komt ten goede van de nauwkeurigheid van het model. De type variabelen die ik wil gaan gebruiken zijn: sociaaleconomisch, gedragspeficiek (alcohol, roken, bewegen etc.) en psychologisch (eenzaamheid, depressie, ervaren gezondheid etc.).
Welke onderwerp(en) heeft u voor uw onderzoek nodig?
Alcoholgebruik, Angst & depressie, Bewegen, Eenzaamheid, Ervaren gezondheid, Lengte & gewicht, Regie over eigen leven, Roken
Welke achtergrondkenmerken heeft u voor uw onderzoek nodig?
Etniciteit/herkomst, Geografische indicator; GGD niveau , Geografische indicator; gemeentecode, Geografische indicator; postcode, Geslacht, Leeftijd, Opleiding, Rondkomen, Werksituatie
Wenst u de gegevens te koppelen aan andere (registratie) bestanden?
Op welk geografisch niveau worden de gegevens gepubliceerd?

Mijn onderzoek betreft geheel Nederland op gemeentelijk- en wijkniveau.

Waar worden de gegevens gepubliceerd of gerapporteerd?
Dat weet ik (nog) niet. Ik ga er vanuit dat het onderzoek niet genoeg diepgang gaat krijgen in 5 maanden om een publicatie te krijgen.
Wat is de verwachte datum van publicatie of rapportage van gegevens (maand-jaar)?
N.v.t.
Overige opmerkingen: