Dati e Variabili: Classificare le Informazioni

BASIC ACCESS – € 3.99

I dati sono gli oggetti base su cui si fonda la biostatistica. Tuttavia, le informazioni che costituiscono i dati possono essere variegate, eterogenee, complesse, in ragione della loro natura (numeri o testo) e possono variare da individuo ad individuo. Questo fa sì che i dati si presentano con caratteristiche differenti (e.g., numeri, classificazioni, raggruppamenti, condizioni, stati) e necessitano pertanto di una metodologia biostatistica differente che li possa rendere attendibili.

In effetti, la mancata identificazione della natura del dato ed il conseguente trattamento con una metodologia non adeguata possono fornire risultati assurdi. Per dare un’idea, faccio un semplice esempio. Lo strumento biostatistico più noto è la media: la media piace a tutti in quanto è semplice da calcolare e sembra far acquisire forza matematica a tutto ciò che viene misurato. Tuttavia, se trattassimo la variabile Sesso (maschio o femmina) come una variabile numerica (e.g., assegnando valore 1 per maschio e 2 per femmina) e applicassimo la media, il risultato potrebbe essere 1.5.  Cosa significherebbe 1.5 per la variabile Sesso? Assolutamente nulla!

Da ciò discende che, prima di qualsivoglia elaborazione statistica, è necessario comprendere e definire correttamente la natura dei dati su cui si lavora, così da identificare l’approccio biostatistico più idoneo. Senza identificazione del dato, ogni pianificazione statistica è inutile. Lo scopo di questa lezione è di fornire le linee guida per distinguere tra dati e variabili e dunque tra dati qualitativi e dati quantitativi, descrivendo le differenti tipologie di dati così da impostare l’elaborazione statistica in modo corretto sin dalle fasi iniziali.

Ogni elaborazione di biostatistica prende avvio dai dati. I dati sono l’insieme delle informazioni numeriche e non numeriche che servono per quantificare il fenomeno oggetto di indagine. Con il termine “dato” si intende riferirsi in particolare ad una precisa caratteristica di un individuo o un oggetto. Pensando ad esempio ad un classico dataset in ambito di ricerca medica, il dato è l’informazione riferita ad un preciso soggetto del campione. L’insieme di tutte le informazioni per tutti i soggetti rappresenta appunto “i dati”. A loro volta, i dati sono raggruppati in variabili, ossia in categorie che descrivono le caratteristiche di individui o oggetti. Se ad esempio consideriamo un campione di pazienti di cui annotiamo Sesso (maschio o femmina), Altezza (in cm) e Peso (in kg), l’insieme di tutte le informazioni di Sesso, Peso e Altezza prende il nome generico di dati, mentre le singole caratteristiche osservate, ossia il Sesso, il Peso e l’Altezza, si chiamano variabili.

Perchè il termine Variabile?

L’utilizzo del termine “variabile” non è casuale. La parola deriva dal latino variabilis, termine derivato dal verbo “variare” che significa che quanto osservato può o è soggetto a

Continue reading...

Please to see full post.

No questions found.

Carrello
  • Il carrello è vuoto.
Index
Torna in alto