SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 11
TEMA 11: TEST DE CHI CUADRADO (x^2)
1. Test de Chi Cuadrado
Es la prueba más utilizada.
CARACTERÍSTICAS
Solo se puede utilizar cuando las dos variables son
cualitativas, no importa de que categoría sean.
RAZONAMIENTO A SEGUIR:
1. Suponemos que la hipótesis nula es cierta (que es la que establece que no hay relación entre las dos variables).
2. Los resultados obtenidos los vamos a comparar con los esperados si la hipótesis nula se cumpliera. Voy a ver si tras la comparación hay una diferencia grande o pequeña.
1. Suponemos que la hipótesis nula es cierta (que es la que establece que no hay relación entre las dos variables).
2. Los resultados obtenidos los vamos a comparar con los esperados si la hipótesis nula se cumpliera. Voy a ver si tras la comparación hay una diferencia grande o pequeña.
Para utilizarlo, utilizamos la tabla de contingencia.
3. Vamos a ubicar en las filas: variable independiente y en las columnas la variable independiente.
3. Vamos a ubicar en las filas: variable independiente y en las columnas la variable independiente.
Situación más sencilla: tabla de contingencia general para
la comparación de dos variables dicotómicas.
Denominada 2X2 porque tiene dos variables con dos categorías cada una, si una variable tuviera tres categorías en vez de dos sería 2x3.
4. Datos a tener en cuenta y que hay que aplicar:
Denominada 2X2 porque tiene dos variables con dos categorías cada una, si una variable tuviera tres categorías en vez de dos sería 2x3.
4. Datos a tener en cuenta y que hay que aplicar:
- La prueba de Chi cuadrado se utiliza para comprobar si la diferencia que observamos
- Es debida al azar:
- Es debida a algo más, por ejemplo a una asociación entre las variables que estudiamos.
- Frecuencia observada: la que recogen los datos.
- . Frecuencia esperada: probabilidad a priori.
- . Grados de libertad: van a venir determinados de estas hipótesis por esta operación:
Ejemplo: quiero saber si hay diferencias por sexos en el
consumo de tabaco.
Pasos a seguir:
1. Realizamos la tabla de valores observados.
Pasos a seguir:
1. Realizamos la tabla de valores observados.
FUMAN
|
NO FUMAN
|
TOTAL
|
|
MUJERES
|
23
|
28
|
51
|
HOMBRES
|
103
|
135
|
238
|
Total
|
126
|
163
|
289
|
2. Determinamos las variables y las hipótesis nula u alternativa.
Variable independiente: sexo
Variable dependiente:
tabaco
1 Tras
hacer la tabla, comparamos los porcentajes: porque al ver a través de los
números absolutos, la diferencia de la muestra entre chicos y chicas es muy
grande, por lo que lo tenemos que ver los porcentajes.
2 Formulamos
la hipótesis nula: no existe relación entre el sexo y el consumo de tabaco.
Formulamos la hipótesis alternativa: existe asociación entre el sexo y el consumo de tabaco.
3
3. Realizamos la tabla de esperados
4 Calculamos los porcentajes para una mejor interpretación del riesgo relativo que posteriormente será calculado.
A 5. Aplicamos fórmula.
6. Tras obtener el resultado comparamos con el valor de X2 para p=0.05. Según esto, rechazaremos o aceptaremos la hipótesis nula.
Formulamos la hipótesis alternativa: existe asociación entre el sexo y el consumo de tabaco.
3
3. Realizamos la tabla de esperados
4 Calculamos los porcentajes para una mejor interpretación del riesgo relativo que posteriormente será calculado.
A 5. Aplicamos fórmula.
6. Tras obtener el resultado comparamos con el valor de X2 para p=0.05. Según esto, rechazaremos o aceptaremos la hipótesis nula.
FUMAN
|
NO FUMAN
|
TOTAL
|
|
MUJERES
|
23
54.9%
|
28
45.1%
|
51
100%
|
HOMBRES
|
103
56
|
135
43
|
238
|
Total
|
126
|
163
|
289
|
ç
2. Condiciones para aplicar la Chi cuadrado.
- · -Las observaciones deben ser independientes: las categorías de las variables tienen que ser excluyentes, es decir, no se puede ser fumador y no fumador a la vez. Ni los sujetos se pueden clasificar en más de un lugar.
- · Utilizar variables cualitativas, sean nominales u ordinales.
- · Más de 50 casos como muestra, la muestra tiene que tener mínimo esta muestra.
- · Las frecuencias teóricas o esperadas en cada casilla no deben ser inferiores a 5 en número absoluto. Si son menores que 5, no podemos sacar conclusiones del contraste de hipótesis con Chi-cuadrado.
Esto va a ocurrir en tablas de contingencia
que haya mucha celdas. Por lo que en muchas ocasiones se agrupan en una.
Si no se cumplen estos requisitos
se aplica el test estadístico de Fisher
o la corrección de continuidad de Yates (es otra variante del test de CHI
CUADRADO)
Comentarios
Publicar un comentario