A menudo utilizo las pruebas t de dos muestras como introducción a Excel en mis cursos de estadística de pregrado – y a veces también en mis cursos de postgrado. Como los estudiantes todavía se están acostumbrando a las funciones en Excel, suelen tener muchas dificultades con esta lección. Por esta razón, he creado la siguiente página para proporcionarle una guía fácil de leer sobre la realización de pruebas t de dos muestras en Excel. Como siempre, si tienes alguna pregunta, ¡escríbeme a MHoward@SouthAlabama.edu!
Antes de aprender sobre las pruebas t de dos muestras en Excel, primero debemos saber para qué se utiliza una prueba t de dos muestras. La definición del libro de texto dice que una prueba t de dos muestras se utiliza para “determinar si dos conjuntos de datos son significativamente diferentes entre sí”; sin embargo, yo no soy partidario de esta definición. En su lugar, prefiero decir que una prueba t de dos muestras se utiliza para “probar si las medias de una variable medida en dos grupos son significativamente diferentes”. Así pues, una prueba t de dos muestras se utiliza para responder a preguntas similares a las siguientes:
- En nuestra muestra, ¿las mujeres tienen mejores notas en los exámenes que los hombres?
- ¿Los hombres son más altos que las mujeres?
- ¿Los alumnos de una clase impartida por el Dr. Howard obtienen mejores resultados en un examen que los de la clase del Dr. Smith?
- ¿Los empleados del grupo de formación A tienen mejor rendimiento que los del grupo de formación B?
Ahora que sabemos para qué se utiliza una prueba t de dos muestras, podemos calcular una prueba t de dos muestras en Excel. Para empezar, abra sus datos en Excel. Si no tiene un conjunto de datos, descargue el conjunto de datos de ejemplo aquí. En el conjunto de datos de ejemplo, estamos comparando las notas de los exámenes de dos clases (Dr. Howard y Dr. Smith) para determinar qué clase tiene notas más altas en un examen.
Los datos deben verse así:
Si no es así, no pasa nada. Puede calcular una prueba t en Excel con bastante facilidad utilizando muchos formatos de datos diferentes, pero nos ajustaremos al formato de la imagen para simplificar.
Una vez que tenga los datos abiertos, haga clic en la pestaña Datos de la parte superior. Luego haga clic en Data Analysis, como se ve abajo:
De todos modos, si funcionó, la siguiente ventana debería haber aparecido. Usted querrá hacer clic en la t-Test: Two-Sample Assuming Unequal Variances, y luego presionar OK – como se ve abajo:
Aparecerá la siguiente ventana. En esta ventana, primero debe hacer clic en el icono para identificar su Rango de Variable 1. Luego, necesita resaltar (hacer clic y arrastrar) sus datos y presionar el ícono nuevamente (se ve abajo). Esto identificará los datos que representan el Grupo 1 para su prueba t, que son las calificaciones del examen del Dr. Howard en el ejemplo actual.
Haga exactamente lo mismo pero identifique los datos del Grupo 2 en su lugar, que son las puntuaciones del examen del Dr. Smith en el ejemplo actual.
¿Su ventana ahora se ve así?
Si es así, ¡bien! Haga clic en “Aceptar” y veamos qué obtenemos.
Uhh, ¿qué significa esto? Bueno, veámoslo.
Este es su estadístico t, que es el tamaño del efecto. Es una estimación estandarizada de la diferencia entre los dos grupos. Sin embargo, a no ser que tenga bastantes conocimientos de estadística, probablemente no signifique mucho para usted. Por lo tanto, deberíamos fijarnos en los valores p… ¿pero en cuál?
Excel proporciona valores p de una cola y de dos colas. Los valores p de dos colas son estimaciones más conservadoras, y normalmente los utilizo para determinar si mis resultados son significativos. Veamos cuál es el valor p de dos colas:
¡Ahí está! De nuestros resultados, podemos identificar que…
- La estadística de prueba es: 2.783
- El valor p es: .015
Como nuestro valor p es inferior a 0.05, podemos rechazar el nulo y suponer que existe una diferencia significativa entre nuestros grupos. ¡Bien!
Pero, ¿cómo sabemos qué grupo obtuvo resultados significativamente mejores? Para ello, tenemos que calcular las medias entre los dos grupos. En este ejemplo, fueron:
- Media de la clase del Dr. Howard – 88.5
- Media de la clase del Dr. Smith – 75.3
Por lo tanto, como hubo una diferencia significativa y la clase de la Dr. Howard tuvo la media más alta, sabemos que la clase de la Dr. Howard rindió significativamente mejor en el examen que la clase de la Dr. Smith.
Lo hemos logrado. Hemos calculado todo lo que necesitábamos saber sobre la prueba t. ¡Buen trabajo!
¿Aún tiene alguna pregunta? ¿O comentarios sobre esta guía? No dude en enviarme un correo electrónico a MHoward@SouthAlabama.edu. Siempre estoy dispuesto a conversar.