Il Propensity Score è lo strumento statistico utilizzato nella Propensity Score Analysis per minimizzare selection bias e bias da fattori confondenti presenti negli studi osservazionali comparativi (i.e. intervento vs. controllo). Attraverso la determinazione di questo score è possibile conoscere la probabilità di ciascun individuo del campione di essere assegnato al gruppo intervento o controllo in presenza di specifiche condizioni di base (i.e., covariate) così da creare gruppi bilanciati di intervento e controllo.
Per poter eseguire il calcolo di questo score si procede in due step: dapprima si identificano tutte le covariate che possono dare origine a selection bias e/o bias da fattori confondenti, e successivamente, utilizzando tali covariate, si procede con l’elaborazione di modelli statistici basati su regressione logistica o su tecniche di machine learning. Lo scopo di questa lezione è presentare:
- l’approccio metodologico per determinare le covariate da includere nella determinazione del propensity score;
- la procedura di calcolo del propensity score utilizzando la regressione logistica.
Propensity Score analysis di Marilù Garo
Scelta delle covariate
Per poter eseguire il calcolo del propensity score il primo passo è l’identificazione delle covariate che possono determinare bias da fattori confondenti e/o selection bias. Per fare ciò risulta fondamentale conoscere l’impatto di ogni covariata nella determinazione della relazione causale tra intervento e outcome così da poterne neutralizzare l’effetto attraverso appunto tecniche di propensity score analysis. A tal fine la scelta delle covariate da includere nel modello di propensity score deve essere eseguita in modo da armonizzare conoscenze teoriche, conoscenze empiriche ed evidenza statistica.
Revisione della letteratura
Il primo fondamentale passo è l’analisi del framework teorico alla base dello studio, ossia la revisione della letteratura circa le possibili relazioni causali tra intervento e outcome ed i possibili meccanismi sottostanti a tale relazione. Da questa preliminare e necessaria disamina della letteratura è possibile identificare in modo pressoché completo tutte le covariate e/o i fattori confondenti che possono alterare i risultati dello studio e dunque inficiare la validità della relazione causale. La revisione della letteratura permette inoltre di motivare l’inclusione/esclusione di ciascuna covariata nell’elaborazione del modello di propensity score e di identificare covariate similari, ossia covariate correlate tra loro e che possono essere sostituite nel modello una all’altra al fine di ottenere il modello più efficiente. In caso di dubbi, può essere molto utile in questa fase richiedere il parere di esperti nello specifico campo di indagine.
Controllo dei dati
Lo step successivo è il controllo della reale disponibilità dei dati: dati incompleti, di bassa qualità o non disponibilità di covariate emerse da letteratura come rilevanti ai fini della relazione causa-effetto rappresentano frequenti limitazioni nella creazione di un modello di propensity score efficiente e affidabile. Per superare tali problematiche è possibile valutare l’impatto della mancanza di tali informazioni e verificare
Continue reading...
Please Login to see full post.