Artículos

1.6.5.3: Intervalos de confianza - Matemáticas


Estamos listos ahora para dar el primer paso en el mundo de la estadística inferencial y el uso pruebas estadísticas. Fueron inventados para resolver la cuestión principal del análisis estadístico (Figura ( PageIndex {1} )): cómo estimar algo sobre población usando solo su muestra? Esto suena a magia. Por ejemplo, la población podría exhibir uno de distribuciones de datos estándar.

Figura ( PageIndex {1} ) Representación gráfica de la pregunta estadística principal: ¿cómo estimar la población (azul) a partir de la muestra (rojo)? La flecha roja se relaciona con el intervalo de confianza. Para responder a la pregunta "roja grande", se necesita el valor p.

Primero calculemos intervalo de confianza. Este intervalo predecir con una probabilidad dada (generalmente 95%) donde la tendencia central particular (media o mediana) se ubica dentro de la población. No lo mezcle con los cuantiles del 95%, estas medidas tienen una naturaleza diferente.

Empezamos por comprobar el hipótesis que el la media de la población es igual a 0. Este es nuestro hipótesis nula, H (_ 0 ), que deseamos aceptar o rechazar según los resultados de la prueba.

Código ( PageIndex {1} ) (R):

Aquí usamos una variante de prueba t para datos univariados que a su vez utiliza el estándar Distribución t de Student. Primero, esta prueba obtiene un estadística del conjunto de datos original, los llamados estadística t. La estadística de prueba es una medida única de algún atributo de una muestra; reduce todos los datos a un valor y con ayuda de la distribución estándar, permite recrear la “población virtual”.

La prueba de estudiante tiene un precio: debe asumir que su población es "paramétrica", "normal", es decir, interpretable con una distribución normal (distribución del juego de dardos, consulte el glosario).

En segundo lugar, esta prueba estima si la estadística derivada de nuestros datos puede provenir razonablemente de la distribución definida por nuestro supuesto original. Este principio se encuentra en el corazón del cálculo valor p. La última es la probabilidad de obtener nuestro estadístico de prueba si el supuesto inicial, hipótesis nula era verdadera (en el caso anterior, la altura media del árbol es igual a 0).

¿Qué vemos en el resultado de la prueba? estadística t es igual a 66,41 a 30 grados de libertad (gl (= 30 )). El valor p es realmente bajo ( (2.2 times e ^ {- 16} )), casi cero y definitivamente mucho más bajo que el nivel de confianza "sagrado" de 0.05.

Por lo tanto, rechazamos la hipótesis nula, o nuestra suposición inicial de que la altura media del árbol es igual a 0 y, en consecuencia, vaya con el hipótesis alternativa que es un opuesto lógico de nuestra suposición inicial (es decir, "la altura es no igual a 0 ”):

Sin embargo, lo realmente importante en este momento es la intervalo de confianza—Un rango en el que la media real de la población debe caer con una probabilidad dada (95%). Aquí es estrecho, abarcando desde 73,7 hasta 78,3 y no incluye cero. Lo último significa nuevamente que la hipótesis nula no es compatible.

Si sus datos no van bien con la distribución normal, necesita más universal (pero menos potente) Wilcoxon prueba de suma de rangos. Usa mediana en lugar de la media para calcular el estadístico de prueba V. Nuestra hipótesis nula será que la mediana de la población es igual a cero:

Código ( PageIndex {2} ) (R):

(Por favor, ignore los mensajes de advertencia, simplemente dicen que nuestros datos tienen vínculos: dos salarios son idénticos).

Aquí también rechazaremos nuestra hipótesis nula con un alto grado de certeza. Pasar un argumento conf.int = TRUE devolverá el intervalo de confianza para la mediana de la población; es amplio (porque el tamaño de la muestra es pequeño) pero no incluye cero.


Ver el vídeo: Intervalo de Confianza (Enero 2022).