Project R-4478

Titel

Geavanceerde screeningstechnieken voor ultrahoog dimensionele data (Onderzoek)

Abstract

Statistici worden vaak geconfronteerd met grote datasets uit verschillende wetenschappelijke onderzoeksdomeinen. Hoewel onderzoekgebieden zoals genetica, neurologie, financiën en aardwetenschappen verschillende vragen stellen, delen ze een gezamenlijk thema: ze steunen op het extraheren van nuttige informatie uit grote datasets hoewel het aantal verklarende variabelen zeer groot kan zijn in vergelijking tot de steekproefgrootte. In zo'n geval zijn de parameters enkel identificeerbaar als het aantal verklarende variabelen dat relevant is voor de response klein is. Hiervoor is variabelenselectie nodig. Sure independence screening (SIS) is een krachtige methode voor het selecteren van variabelen wanneer het aantal verklarende variabelen zeer groot is. In dit project bestuderen we alternatieven voor de bestaande SIS methode die ook bruikbaar zijn wanneer de grote datasets extra moeilijkheden bevatten.

Periode

01 februari 2013 - 31 december 2013