Intervalo de confianza

En estatística, denomínase intervalo de confianza a un par ou varios pares de números entre os cales se estima que estará certo valor descoñecido cunha determinada probabilidade de acerto. Formalmente, estes números determinan un intervalo, que se calcula a partir dos datos dunha mostra, e o valor descoñecido é un parámetro da poboación. A probabilidade de éxito na estimación represéntase con 1 - α e chámase nivel de confianza. Nestas circunstancias, α é o chamado erro aleatorio ou nivel de significación, isto é, unha medida das posibilidades de fallar na estimación mediante ese intervalo.^[1]

O nivel de confianza e a amplitude do intervalo varían conxuntamente, de forma que un intervalo máis amplo terá máis probabilidade de acerto (maior nivel de confianza), mentres que para un intervalo máis pequeno, que ofrece unha estimación máis precisa, aumenta a súa probabilidade de erro.

Para a construción dun determinado intervalo de confianza é necesario coñecer a distribución teórica que segue o parámetro que se quere estimar, θ.^[2] é habitual que o parámetro presente unha distribución normal. Tamén poden construírse intervalos de confianza coa desigualdade de Chebyshev.

En definitiva, un intervalo de confianza ao 1 - α por cento para a estimación dun parámetro da poboación θ que segue unha determinada distribución de probabilidade, é unha expresión do tipo [θ₁, θ₂] tal que P[θ₁ ≤ θ ≤ θ₂] = 1 - α, onde P é a función de distribución de probabilidade de θ.

Exemplos

Intervalo de confianza para a media dunha poboación

Dunha poboación de media $\mu$ e desvío típico $\sigma$ pódense tomar mostras de $n$ elementos. Cada unha destas mostras ten á súa vez unha media. Pódese demostrar que a media de todas as medias da mostra coincide coa media da poboación:^[3] $\mu _{\bar {x}}=\mu$

Ademais, se o tamaño das mostras é o suficientemente grande,^[4] ou a distribución da poboación é normal, a distribución de medias da mostra é, practicamente, unha distribución normal con media μ e un desvío típico dado pola seguinte expresión: $\sigma _{\bar {x}}={\frac {\sigma }{\sqrt {n}}}$ . Isto represéntase como segue: ${\bar {X}}\sim N\left(\mu ,{\tfrac {\sigma }{\sqrt {n}}}\right)$ . Se tipificamos, séguese que: ${\frac {{\bar {X}}-\mu }{\frac {\sigma }{\sqrt {n}}}}=Z\sim N(0,1)$

Nunha distribución Z ~ N(0, 1) pode calcularse facilmente un intervalo dentro do que caia unha determinada porcentaxe das observacións, é dicir, é sinxelo atopar z₁ e z₂ tales que P[z₁ ≤ z ≤ z₂] = 1 - α, onde (1 - α)•100 é a porcentaxe desexada.

Nesta distribución normal de medias pódese calcular o intervalo de confianza onde se atopará a media da poboación se só se coñece unha media da mostra ( ${\bar {x}}$ ), cunha confianza determinada. Habitualmente manéxanse valores de confianza do 95 e do 99 por cento. Este valor chámase $1-\alpha$ (debido a que $\alpha$ é o erro que se cometerá).

Para iso precísase calcular o punto $X_{\alpha /2}$ —ou a súa versión tipificada $Z_{\alpha /2}$ ou valor crítico— xunto co seu "oposto na distribución" $X_{-\alpha /2}$ . Estes puntos delimitan a probabilidade para o intervalo, como se mostra na seguinte imaxe:

Ese punto é o número tal que:

\mathbb {P} [{\bar {x}}\geq X_{\alpha /2}]=\mathbb {P} [z\geq z_{\alpha /2}]=\alpha /2

E na versión tipificada cúmprese que:

z_{-\alpha /2}=-z_{\alpha /2}

Así:

\mathbb {P} \left[{\bar {x}}-z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {x}}+z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}}\right]=1-\alpha

De onde se obterá o intervalo de confianza:

\left({\bar {x}}-z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}},{\bar {x}}+z_{\alpha /2}{\frac {\sigma }{\sqrt {n}}}\right)

O intervalo de confianza vén dado pola media da mostra $({\bar {x}})$ ± o produto do valor crítico $Z_{\alpha /2}$ polo erro estándar $\left({\tfrac {\sigma }{\sqrt {n}}}\right)$ se non se coñece e n é grande (habitualmente tómase n ≥ 30):^[5]

Aproximacións para o valor $z_{\alpha /2}$ para os niveis de confianza estándar son 1,96 para $1-\alpha =95\%$ e 2,576 para $1-\alpha =99\%$ .

Intervalo de confianza para unha proporción

O intervalo de confianza para estimar unha proporción p, coñecida como unha proporción da mostra p_n dunha mostra de tamaño n, a un nivel de confianza do (1-α)•100% é:

\left(p_{n}-z_{\alpha /2}{\sqrt {\frac {p_{n}(1-p_{n})}{n}}},\;p_{n}+z_{\alpha /2}{\sqrt {\frac {p_{n}(1-p_{n})}{n}}}\right)

Na demostración destas fórmulas están involucrados o teorema central do límite e a aproximación dunha binomial por unha normal.^[1]

Exemplo práctico

Suponse que unha máquina chea de cuncas con xeado está axustada para verter a cantidade de 250 g. Como a máquina non pode encher cada cunca con exactamente 250 g, o contido que se engade a cada cunca individual presenta certa variación e asígnaselle unha variable aleatoria X. Asúmese que esta variación se axusta a unha distribución normal de arredor da cantidade media desexada de 250 g, cun desvío estándar de 2.5 g. Para determinar se a máquina está calibrada axeitadamente, tómase unha mostra aleatoria de n = 25 cuncas de xeado para pesalas. A medición resultante é X₁, …, X₂₅, unha mostra aleatoria procedente de X.

Para μ, é suficiente con dar unha estimación. O estimador adecuado é a media da mostra:

{\hat {\mu }}={\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}.

A mostra sinala os pesos reais x₁, …, x₂₅, con media:

{\bar {x}}={\frac {1}{25}}\sum _{i=1}^{25}x_{i}=250.2\,{\text{gramos}}.

Ao tomar outra mostra de 25 cuncas, é esperable, de igual xeito, que a masa presente valores como 250.4 ou 251.1 gramos. Un valor medio da mostra de 280 gramos en cambio, sería extremadamente excepcional se o contido medio das cuncas está na práctica preto dos 250 gramos. Hai un intervalo arredor do valor observado de 250.2 gramos da media da mostra para o que se a media da poboación completa efectivamente toma un valor neste rango, os datos observados non poderían ser considerados particularmente infrecuentes. Este intervalo denomínase intervalo de confianza para o parámetro μ. Os extremos do intervalo deben calcularse a partir da mostra para que resulten funcións estatísticas da mostra X₁, …, X₂₅ e deste modo son á súa vez variables aleatorias.

Neste caso, determínanse os extremos considerando a media da mostra X que como provén dunha distribución normal está tamén normalmente distribuída coa mesma esperanza μ, pero cun erro estándar de:

{\frac {\sigma }{\sqrt {n}}}={\frac {2.5~{\text{g}}}{\sqrt {25}}}=0.5\ {\text{gramos}}

Por estandarización, obtense unha variable aleatoria:

Z={\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}={\frac {{\bar {X}}-\mu }{0.5}}

dependente do parámetro μ que debe ser estimado, pero cunha distribución normal estándar independente do parámetro μ. Polo tanto, é posible atopar números −z e z, independentes de μ, entre os que está Z con probabilidade 1 − α, unha medida de como de “confiados” queremos estar.

Tomamos 1 − α = 0.95, por exemplo. Así, temos:

\!P(-z\leq Z\leq z)=1-\alpha =0.95.

O número z provén dunha función de distribución acumulada, neste caso a función de distribución normal acumulativa é:

{\begin{aligned}\Phi (z)&=P(Z\leq z)=1-{\tfrac {\alpha }{2}}=0.975,\\[6pt]z&=\Phi ^{-1}(\Phi (z))=\Phi ^{-1}(0.975)=1.96,\end{aligned}}

e obtense:

{\begin{aligned}0.95&=1-\alpha =P(-z\leq Z\leq z)=P\left(-1.96\leq {\frac {{\bar {X}}-\mu }{\sigma /{\sqrt {n}}}}\leq 1.96\right)\\[6pt]&=P\left({\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}}\leq \mu \leq {\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}\right)\end{aligned}}.

Noutras palabras, o límite inferior dun intervalo de confianza do 95% é:

{\text{Extremo inferior}}={\bar {X}}-1.96{\frac {\sigma }{\sqrt {n}}},

e o superior dese intervalo é:

{\text{Extremo superior}}={\bar {X}}+1.96{\frac {\sigma }{\sqrt {n}}}.

Cos valores deste exemplo, o intervalo de confianza é:

{\begin{aligned}0.95&=P\left({\bar {X}}-1.96\times 0.5\leq \mu \leq {\bar {X}}+1.96\times 0.5\right)\\[6pt]&=P\left({\bar {X}}-0.98\leq \mu \leq {\bar {X}}+0.98\right).\end{aligned}}

Isto podería interpretarse como: con probabilidade do 0.95 atopamos un intervalo de confianza no que se cumpre que o parámetro μ está entre os límites estocásticos

\!{\bar {X}}-0{.}98

e

\!{\bar {X}}+0.98.

Isto non implica que hai unha probabilidade de 0.95 de atopar o parámetro μ no intervalo obtido empregando o valor efectivamente establecido para o valor medio da mostra.

({\bar {x}}-0.98,\,{\bar {x}}+0.98).

Cada vez que se repitan as medicións, darán outro valor para a media X da mostra. No 95% dos casos μ estará entre os límites calculados a partir da media, pero no 5% dos casos non o estará. O intervalo de confianza efectivo calcúlase levando os valores de masas de xeados medidas á fórmula. Este intervalo de confianza de 0.95 resulta:

({\bar {x}}-0.98;{\bar {x}}+0.98)=(250.2-0.98;250.2+0.98)=(249.22;251.18).\,

O segmento vertical representa 50 realizacións dun intervalo de confianza para μ.

Noutras palabras, o intervalo de confianza do 95% está entre o límite inferior de 249.22 g e o superior de 251.18 g.

Como o valor desexado 250 de μ está dentro do intervalo de confianza resultante non hai razón para crer que a máquina non está correctamente calibrada.

O intervalo calculado ten límites fixos, onde μ podería ou non estar limitado. Así, este suceso ten probabilidade 0 ou 1. Non é posible dicir: "con probabilidade (1 − α) o parámetro μ está no intervalo de confianza." Só sabemos que por repetición en 100(1 − α) % dos casos, μ estará no intervalo calculado. En 100α% dos casos, polo contrario isto non sucede. Desafortunadamente, non se coñece en cales dos casos isto acontece. Por iso pódese dicir: "con nivel de confianza 100(1 − α) %, μ está no intervalo de confianza."

O erro máximo calcúlase como 0.98 dado que é a diferenza entre o valor no que se conserva a confianza dentro dos límites superior e inferior.

A figura ilustra 50 realizacións dun intervalo de confianza para unha poboación media dada μ. Se se selecciona aleatoriamente unha realización, a probabilidade de esxoller un intervalo que conteña o parámetro é do 95%; porén, podería darse a desafortunada situación de elixir a errónea.

Notas

↑ ^1,0 ^1,1 Rius Díaz, Francisca (1997). Bioestatística. Métodos y aplicacións. Málaga: Universidade de Málaga. ISBN 84-7496-653-1. Arquivado dende o orixinal o 23 de decembro de 2009. Consultado o 7 de abril de 2009.
↑ Guerriero, V. (2012). "Power Law Distribution: Method of Multi-scale Inferential Statistics". J. Mod. Math. Fr.
↑ É unha consecuencia do Teorema central do límite.
↑ Na práctica considérase normal a distribución se n > 30.
↑ Sotomaior Velasco, Gabriel; Wisniewski, Piotr Marian (2001). "10.2. Intervalos de confianza para medias". Probabilidade e estatística para ingeniería e ciencias. Cengage Learning Editores. p. 230. ISBN 970686136X. Consultado o 20 de abril de 2009.

Véxase tamén

Bibliografía

Fisher, R. A. (1956). Statistical Methods and Scientific Inference. Oliver and Boyd, Edinburgh (p. 32).
Freund, J. E. (1962). Mathematical Statistics. Prentice Hall, Englewood Cliffs, NJ (pp. 227–228).
Hacking, I. (1965) Logic of Statistical Inference. Cambridge University Press, Cambridge.
Keeping, E. S. (1962). Introduction to Statistical Inference. D. Van Nostrand, Princeton, NJ.
Kiefer, J. (1977). Journal of the American Statistical Association, 72, 789-827.
Neyman, J. (1937). Philosophical Transactions of the Royal Society of London A, 236, 333-380.
Robinson, G. K. (1975). Biometrika, 62, 151-161.
Zar, J. H. (1984). Biostatistical Analysis. Prentice Hall International, New Jersey. pp. 43–45.

Outros artigos

[rius-1] 1,0 ^1,1 Rius Díaz, Francisca (1997). Bioestatística. Métodos y aplicacións. Málaga: Universidade de Málaga. ISBN 84-7496-653-1. Arquivado dende o orixinal o 23 de decembro de 2009. Consultado o 7 de abril de 2009.

[2] Guerriero, V. (2012). "Power Law Distribution: Method of Multi-scale Inferential Statistics". J. Mod. Math. Fr.

[3] É unha consecuencia do Teorema central do límite.

[4] Na práctica considérase normal a distribución se n > 30.

[5] Sotomaior Velasco, Gabriel; Wisniewski, Piotr Marian (2001). "10.2. Intervalos de confianza para medias". Probabilidade e estatística para ingeniería e ciencias. Cengage Learning Editores. p. 230. ISBN 970686136X. Consultado o 20 de abril de 2009.

[1]

[2]

[3]

[4]

[5]