Un estadístico que se usa para evaluar si existe una diferencia significativa entre los valores observados y los valores esperados en un conjunto de datos categóricos.

Descripción

La prueba de chi cuadrado mide la discrepancia entre lo que se espera teóricamente y lo que realmente se observa. Se usa comúnmente en pruebas de hipótesis, especialmente para analizar distribuciones de frecuencia.

Su fórmula es:

Chi cuadrado es igual a la suma, para cada categoría, del cuadrado de la diferencia entre el valor observado y el valor esperado, dividido entre el valor esperado. Esta fórmula evalúa cuán diferentes son las frecuencias observadas respecto a las esperadas.

Donde:

Oi: frecuencia observada en la categoría i

Ei: frecuencia esperada en la categoría i

Usos frecuentes

  • Prueba de bondad de ajuste: evalúa si una muestra sigue una distribución específica.
  • Prueba de independencia: determina si dos variables categóricas están relacionadas.
  • Prueba de homogeneidad: compara distribuciones de una variable categórica entre varios grupos.

Ejemplos

Supongamos que hemos realizado una encuesta a 100 personas sobre su bebida favorita (café o te) y sus respuestas se agruparon por género. Los datos observados se reflejan en la siguiente tabla de contingencia:

Género Café Te Total
Hombre 20 10 30
Mujer 30 40 70
Total 50 50 100

1. Hipótesis

2. Calcular las frecuencias esperadas

Se calculan con la siguiente fórmula:

E sub i j igual a la multiplicación del total de la fila por el total de la columna, dividido entre el total general. Esta fórmula se usa para calcular la frecuencia esperada en una celda de una tabla de contingencia.

Las frecuencias esperadas serían:

Género Café Te
Hombre 15 15
Mujer 35 35

3. Calcular χ²

Cálculo del estadístico chi cuadrado. La fórmula general muestra que chi cuadrado es igual a la suma, para cada categoría, del cuadrado de la diferencia entre el valor observado y el esperado, dividido entre el valor esperado. Luego se sustituye: chi cuadrado igual a (20 menos 15) al cuadrado sobre 15, más (10 menos 15) al cuadrado sobre 15, más (30 menos 35) al cuadrado sobre 35, más (40 menos 35) al cuadrado sobre 35. Esto se convierte en 25 sobre 15, más 25 sobre 15, más 25 sobre 35, más 25 sobre 35, lo que da aproximadamente 1.67 más 1.67 más 0.71 más 0.71, igual a 4.76.

4. Comparar con valor crítico

Con gl = (filas – 1)(columnas – 1) = (2-1)(2-1) = 1 y un nivel de significancia del 5% (α = 0.05), el valor crítico es aproximadamente 3.84.

Como 4.76 > 3.84, se rechaza la hipótesis nula (H₀).

5. Conclusión

Hay evidencia estadística de que la preferencia de bebida depende del género.

Sinónimos:
khi cuadrado