Bootstrap (statistica)
Il bootstrap è una tecnica statistica di ricampionamento con reimmissione per approssimare la distribuzione campionaria di una statistica. Permette perciò di approssimare media e varianza di uno stimatore, costruire intervalli di confidenza e calcolare p-value di test quando, in particolare, non si conosce la distribuzione della statistica di interesse.
Nel caso di campionamento casuale semplice, il funzionamento è il seguente: consideriamo un campione effettivamente osservato di numerosità pari ad n, diciamo . Da si ricampionano m altri campioni di numerosità costante pari ad n, diciamo ; in ciascuna estrazione bootstrap, i dati provenienti dal primo elemento del campione, cioè , possono essere estratti più di una volta e ciascun dato ha probabilità pari a 1/n di essere estratto.
Sia lo stimatore di che ci interessa studiare, diciamo . Si calcola tale quantità per ogni campione bootstrap, . In questo modo si hanno a disposizione m stime di , dalle quali è possibile calcolare la media bootstrap, la varianza bootstrap, i percentili bootstrap etc. che sono approssimazioni dei corrispondenti valori ignoti e portano informazioni sulla distribuzione di .
Partendo quindi da queste quantità stimate è possibile calcolare intervalli di confidenza, saggiare ipotesi, etc.
Voci correlate
[modifica | modifica wikitesto]Collegamenti esterni
[modifica | modifica wikitesto]Controllo di autorità | Thesaurus BNCF 52499 · LCCN (EN) sh91004766 · BNF (FR) cb12378257v (data) · J9U (EN, HE) 987007536908405171 |
---|