Informacion

Prueba de hipótesis para la diferencia de dos proporciones de población

Prueba de hipótesis para la diferencia de dos proporciones de población

En este artículo, veremos los pasos necesarios para realizar una prueba de hipótesis, o prueba de significación, para la diferencia de dos proporciones de población. Esto nos permite comparar dos proporciones desconocidas e inferir si no son iguales entre sí o si una es mayor que la otra.

Resumen y antecedentes de la prueba de hipótesis

Antes de entrar en los detalles de nuestra prueba de hipótesis, veremos el marco de las pruebas de hipótesis. En una prueba de significación intentamos demostrar que una afirmación sobre el valor de un parámetro de población (o, a veces, la naturaleza de la población en sí) es probable que sea cierta.

Acumulamos evidencia para esta afirmación realizando una muestra estadística. Calculamos una estadística de esta muestra. El valor de esta estadística es lo que usamos para determinar la verdad de la declaración original. Este proceso contiene incertidumbre, sin embargo, podemos cuantificar esta incertidumbre

El proceso general para una prueba de hipótesis viene dado por la siguiente lista:

  1. Asegúrese de que se cumplan las condiciones necesarias para nuestra prueba.
  2. Indique claramente las hipótesis nulas y alternativas. La hipótesis alternativa puede implicar una prueba unilateral o bilateral. También debemos determinar el nivel de significación, que se denotará con la letra griega alfa.
  3. Calcule la estadística de prueba. El tipo de estadística que utilizamos depende de la prueba particular que estamos realizando. El cálculo se basa en nuestra muestra estadística.
  4. Calcule el valor p. El estadístico de prueba se puede traducir a un valor p. Un valor p es la probabilidad de que el azar produzca el valor de nuestra estadística de prueba bajo el supuesto de que la hipótesis nula es verdadera. La regla general es que cuanto menor es el valor p, mayor es la evidencia contra la hipótesis nula.
  5. Obtener una conclusión. Finalmente, usamos el valor de alfa que ya estaba seleccionado como valor umbral. La regla de decisión es que si el valor p es menor o igual que alfa, entonces rechazamos la hipótesis nula. De lo contrario, no podemos rechazar la hipótesis nula.

Ahora que hemos visto el marco para una prueba de hipótesis, veremos los detalles de una prueba de hipótesis para la diferencia de dos proporciones de población.

Las condiciones

Una prueba de hipótesis para la diferencia de dos proporciones de población requiere que se cumplan las siguientes condiciones:

  • Tenemos dos muestras aleatorias simples de grandes poblaciones. Aquí "grande" significa que la población es al menos 20 veces mayor que el tamaño de la muestra. Los tamaños de muestra se denotarán por norte1 y norte2.
  • Los individuos en nuestras muestras han sido elegidos independientemente uno del otro. Las poblaciones mismas también deben ser independientes.
  • Hay al menos 10 éxitos y 10 fracasos en nuestras dos muestras.

Mientras se cumplan estas condiciones, podemos continuar con nuestra prueba de hipótesis.

Las hipótesis nulas y alternativas

Ahora necesitamos considerar las hipótesis para nuestra prueba de significación. La hipótesis nula es nuestra afirmación sin efecto. En este tipo particular de hipótesis, nuestra hipótesis nula es que no hay diferencia entre las dos proporciones de población. Podemos escribir esto como H0: pags1 = pags2.

La hipótesis alternativa es una de tres posibilidades, dependiendo de los detalles de lo que estamos probando:

  • Hunapags1 es mayor que pags2. Esta es una prueba de una cola o unilateral.
  • Huna: pags1 es menos que pags2. Esta también es una prueba unilateral.
  • Huna: pags1 no es igual a pags2. Esta es una prueba de dos colas o de dos lados.

Como siempre, para ser cautelosos, debemos usar la hipótesis alternativa de dos lados si no tenemos una dirección en mente antes de obtener nuestra muestra. La razón para hacerlo es que es más difícil rechazar la hipótesis nula con una prueba de dos lados.

Las tres hipótesis se pueden reescribir indicando cómo pags1 - pags2 está relacionado con el valor cero. Para ser más específicos, la hipótesis nula se convertiría en H0:pags1 - pags2 = 0. Las posibles hipótesis alternativas se escribirían como:

  • Hunapags1 - pags> 0 es equivalente a la declaración "pags1 es mayor que pags2."
  • Hunapags1 - pags<0 es equivalente a la declaración "pags1 es menos que pags2."
  • Hunapags1 - pags2  ≠ 0 es equivalente a la declaración "pags1 no es igual a pags2."

Esta formulación equivalente en realidad nos muestra un poco más de lo que sucede detrás de escena. Lo que estamos haciendo en esta prueba de hipótesis es convertir los dos parámetros pags1 y pagsen el parámetro único pags1 - pags2. Luego probamos este nuevo parámetro contra el valor cero.

La estadística de prueba

La fórmula para la estadística de prueba se da en la imagen de arriba. A continuación se explica cada uno de los términos:

  • La muestra de la primera población tiene tamaño norte1. El número de éxitos de esta muestra (que no se ve directamente en la fórmula anterior) es k1.
  • La muestra de la segunda población tiene tamaño norte2. El número de éxitos de esta muestra es k2.
  • Las proporciones de la muestra son p1-sombrero = k1 / ny P2-hat = k2 / n2 .
  • Luego combinamos o agrupamos los éxitos de ambas muestras y obtenemos: p-hat = (k1 + k2) / (n1 + n2).

Como siempre, tenga cuidado con el orden de las operaciones al calcular. Todo debajo del radical debe calcularse antes de sacar la raíz cuadrada.

El valor p

El siguiente paso es calcular el valor p que corresponde a nuestra estadística de prueba. Utilizamos una distribución normal estándar para nuestra estadística y consultamos una tabla de valores o utilizamos software estadístico.

Los detalles de nuestro cálculo del valor p dependen de la hipótesis alternativa que estamos usando:

  • Para Huna: pags1 - pags> 0, calculamos la proporción de la distribución normal que es mayor que Z.
  • Para Huna: pags1 - pags<0, calculamos la proporción de la distribución normal que es menor que Z.
  • Para Huna: pags1 - pags2  ≠ 0, calculamos la proporción de la distribución normal que es mayor que |Z|, el valor absoluto de Z. Después de esto, para tener en cuenta el hecho de que tenemos una prueba de dos colas, duplicamos la proporción.

Regla de decisión

Ahora tomamos una decisión sobre si rechazar la hipótesis nula (y, por lo tanto, aceptar la alternativa), o si no rechazamos la hipótesis nula. Tomamos esta decisión comparando nuestro valor p con el nivel de significancia alfa.

  • Si el valor p es menor o igual que alfa, entonces rechazamos la hipótesis nula. Esto significa que tenemos un resultado estadísticamente significativo y que vamos a aceptar la hipótesis alternativa.
  • Si el valor p es mayor que alfa, no podemos rechazar la hipótesis nula. Esto no prueba que la hipótesis nula sea cierta. En cambio, significa que no obtuvimos suficiente evidencia convincente para rechazar la hipótesis nula.

Nota especial

El intervalo de confianza para la diferencia de dos proporciones de población no agrupa los éxitos, mientras que la prueba de hipótesis sí. La razón de esto es que nuestra hipótesis nula supone que pags1 - pags2 = 0. El intervalo de confianza no asume esto. Algunos estadísticos no agrupan los éxitos para esta prueba de hipótesis, y en su lugar usan una versión ligeramente modificada de la estadística de prueba anterior.