Prueba del Chi-Cuadrado de una Variable en Excel

Muchas situaciones requieren la prueba chi-cuadrado de una variable.  Lamentablemente, es uno de los pocos estadísticos básicos que el complemento “Data Analysis” en Excel no realiza, y a menudo es una molestia calcularlo sin SPSS, R o un programa estadístico diferente.  Para ayudar con este problema, decidí crear una guía sobre el cálculo de una prueba chi-cuadrado de una variable en Excel. No es tan fácil como la mayoría de los demás análisis en Excel, pero espero que te resulte útil. No dudes en enviarme un correo electrónico a MHoward@SouthAlabama.edu si tienes alguna pregunta sobre cómo realizar un texto chi-cuadrado de una variable en Excel.


Entonces, ¿qué hace una prueba chi-cuadrado de una variable?  Determina si hay un número igual (o desigual) de observaciones en las categorías de una única variable de agrupación.  ¿Suena confuso?  Veamos algunos ejemplos.

Imagina que tienes una clase y cuentas cuántos alumnos son hombres y cuántos son mujeres.  En este ejemplo, tendríamos una variable de agrupación, el sexo, que tiene dos categorías, hombre y mujer.  Puedes realizar una prueba chi-cuadrado para determinar si existe una diferencia estadísticamente significativa en el número de hombres y mujeres de la clase.

Aquí tenemos otro ejemplo:  Supongamos que tienes 100 empleados y les pregunta si son obreros, empleados de oficina o empleados de servicios.  En este ejemplo, se tendría una variable de agrupación, el tipo de ocupación, que tiene tres categorías: obreros, empleados de oficina y empleados de servicios.  Para determinar si existe una diferencia estadísticamente significativa en el número de obreros, empleados de oficina y empleados de servicios en la muestra, puedes realizar una prueba de chi-cuadrado.

Ahora que sabemos para qué se utiliza una prueba de chi-cuadrado, podemos calcular una prueba de chi-cuadrado en Excel.  Para empezar, abre tu conjunto de datos en Excel. Haz clic aquí para ver el conjunto de datos que utilizaré en este ejemplo. Incluye los colores de pelo de 100 estudiantes muestreados aleatoriamente, y comprobaremos si existe una diferencia significativa en la distribución de los colores de pelo dentro de la muestra: rubio, castaño y pelirrojo.

Los datos deben verse más o menos así:

Lo primero que queremos hacer es calcular el valor esperado de cada casilla.  Para ello, sumamos todas las celdas y las dividimos por el número de celdas, lo que también se conoce como sacar la media de las celdas.  En Excel, puedes hacerlo utilizando la función =PROMEDIO().  Primero, escribe “=PROMEDIO(” (sin comillas), luego resalta las celdas que quieras promediar y cierra el paréntesis escribiendo “)”.  Sigue adelante y haz esto para la primera fila.  Puedes verlo en la imagen de abajo:

Ahora, haz lo mismo para las dos celdas siguientes, y añade un título para esta columna.  He utilizado el título “Expected”, ya que esta columna representa el valor esperado para las celdas.

¿Has obtenido 33.33333 para cada una de las celdas?  ¡Excelente!  Al realizar una prueba de chi-cuadrado de una variable, el valor esperado siempre será el mismo para cada una de las celdas.

Ahora, debes añadir una nueva columna, en la que restarás los valores esperados de los valores observados para cada fila.  Para hacerlo en la primera fila, escribe “=”, haz clic en la frecuencia de la primera fila (35 en este ejemplo), escribe “-“, haz clic en el valor esperado para la primera fila (33.33333 para este ejemplo) y, por último, pulsa Intro.  Esto debería dar “=B2-C2” en la celda, lo que dará como resultado un valor de 1,666667.

Ahora haz lo mismo para las otras dos filas y añade un título a esta columna.  Yo utilizo el título “Obs-Exp”, ya que esta columna representa los valores observados menos los esperados.

Queremos elevar al cuadrado estos valores en la siguiente columna.  Para hacerlo, escribimos “=”, hacemos clic en la celda que queremos elevar al cuadrado, escribimos “^2 y pulsamos Intro.  Para escribir “^”, sólo tienes que mantener pulsada la tecla Mayús y pulsar el número 6.  Podemos ver esta operación para la primera fila en la imagen de abajo.

Hagamos lo mismo con las demás filas y añadamos un título.  Utilicé el título “Obs-Exp^2”, porque esta fila son los valores observados, menos los valores esperados, al cuadrado.

Después, tenemos que dividir estos valores por los valores esperados.  Hagamos esto primero en la primera fila.  En la siguiente columna, escribe “=”, haz clic en la celda “Obs-Exp^2” de la primera fila, escribe “/”. haz clic en la celda “Esperado” de la primera fila y pulsa Intro.  Puedes ver esto en la imagen de abajo:

Sigue adelante y haz lo mismo para las otras dos celdas de esta columna y añade un título.  He utilizado el título, “Obs-Exp^2 / Exp”, porque eso es exactamente lo que representa esta columna.

Para el último cálculo, necesitamos sumar los valores de la última columna utilizando la función=SUMA().  Para ello, escribe “=SUMA(“, resalta las tres celdas de la última columna, escribe “)” y, por último, pulsa intro.

Por último, añade un título para que no olvidemos lo que representa este número.  Yo he utilizado el título “Estadístico Chi-Cuadrado”.

¡Uf!  ¡Ya hemos terminado con los cálculos!  ¿Has obtenido el número 30.5 como resultado?  Si es así, ¡excelente!  Si no… vuelve a intentarlo.

¿Qué significa este número?  Sinceramente, no significa mucho por sí solo.  Para determinar si nuestro resultado es estadísticamente significativo, tenemos que comparar nuestro número con una tabla de significación chi-cuadrado.  Para utilizar esta tabla (abajo), tenemos que determinar nuestros grados de libertad, así como cuál queremos que sea nuestro nivel de significación (también conocido como alfa).

Para una prueba chi-cuadrado de una variable, los grados de libertad son el número de grupos restado por uno.  En este ejemplo teníamos tres grupos, por lo que nuestros grados de libertad serían dos.  Alternativamente, fijamos nuestro nivel de significación en 0.05, ya que sólo consideraremos que un resultado es estadísticamente significativo si el valor p es menor que 0.05.

Una vez decididos estos números, utilizamos la tabla siguiente para encontrar nuestro valor de corte de la prueba chi-cuadrado.  Si nuestro resultado es superior al número de la tabla, entonces nuestros resultados son estadísticamente significativos.  Por lo tanto, en el cuadro de abajo, encuentra donde la fila de dos grados de libertad se cruza con la columna de nivel de significación .05.

¿Podrías encontrarlo?  Es el número 5.991.  Por lo tanto, nuestro resultado debe ser mayor que 5.991 para ser estadísticamente significativo.  Como nuestro resultado fue 30.5, podemos decir que es estadísticamente significativo.  Esto significa que no tuvimos una distribución equitativa de las observaciones entre los tres grupos.  En otras palabras, tuvimos una distribución desigual de observaciones entre los tres grupos.

Esto es todo sobre las pruebas de chi-cuadrado de una variable.  Espero que esta página haya sido de ayuda.  Si todavía tienes preguntas, ponte en contacto conmigo en MHoward@SouthAlabama.edu.