SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 11


TEMA 11: TEST DE CHI CUADRADO (x^2)





    1.  Test de Chi Cuadrado

Es la prueba más utilizada.

CARACTERÍSTICAS
Solo se puede utilizar cuando las dos variables son cualitativas, no importa de que categoría sean.

RAZONAMIENTO A SEGUIR:
1. Suponemos que la hipótesis nula es cierta (que es la que establece que no hay relación entre las dos variables).

2. Los resultados obtenidos los vamos a comparar con los esperados si la hipótesis nula se cumpliera. Voy a ver si tras la comparación hay una diferencia grande o pequeña.
Para utilizarlo, utilizamos la tabla de contingencia.

3. Vamos a ubicar en las filas: variable independiente y en las columnas la variable independiente.
Situación más sencilla: tabla de contingencia general para la comparación de dos variables dicotómicas.
 Denominada 2X2 porque tiene dos variables con dos categorías cada una, si una variable tuviera tres categorías en vez de dos sería 2x3.

4. Datos a tener en cuenta y que hay que aplicar:

  • La prueba de Chi cuadrado se utiliza para comprobar si la diferencia que observamos
-                            Es debida al azar:
-                            Es debida a algo más, por ejemplo a una asociación entre las variables que estudiamos.

  •          Frecuencia observada: la que recogen los datos.
  • .       Frecuencia esperada: probabilidad a priori.
  • .       Grados de libertad: van a venir determinados de estas hipótesis por esta operación:
  (Número de filas-1) x (números de columna -1).
  Si la tabla es de 2X2 el grado de libertad es 1.

  • Fórmula de Chi Cuadrado:




Ejemplo: quiero saber si hay diferencias por sexos en el consumo de tabaco.

Pasos a seguir:
1. Realizamos la tabla de valores observados.


FUMAN
NO FUMAN
TOTAL
MUJERES
23
28
51
HOMBRES
103
135
238
Total
126
163
289





2. Determinamos las variables y las hipótesis nula u alternativa.
Variable independiente: sexo
Variable dependiente: tabaco

1     Tras hacer la tabla, comparamos los porcentajes: porque al ver a través de los números absolutos, la diferencia de la muestra entre chicos y chicas es muy grande, por lo que lo tenemos que ver los porcentajes.
2      Formulamos la hipótesis nula: no existe relación entre el sexo y el consumo de tabaco.
      Formulamos la hipótesis alternativa: existe asociación entre el sexo y el consumo de tabaco.
3   
      3. Realizamos la tabla de esperados


     4 Calculamos los porcentajes para una mejor interpretación del riesgo relativo que posteriormente será calculado.
A   5. Aplicamos fórmula.
     6. Tras obtener el resultado comparamos con el valor de X2 para p=0.05. Según esto, rechazaremos o aceptaremos la hipótesis nula.



FUMAN
NO FUMAN
TOTAL
MUJERES
23
54.9%
28
45.1%
51
100%
HOMBRES
103
56
135
43
238
Total
126
163
289








ç

2. Condiciones para aplicar la Chi cuadrado.


  • ·         -Las observaciones deben ser independientes: las categorías de las variables tienen que ser excluyentes, es decir, no se puede ser fumador y no fumador a la vez. Ni los sujetos se pueden clasificar en más de un lugar.
  • ·         Utilizar variables cualitativas, sean nominales u ordinales.
  • ·         Más de 50 casos como muestra, la muestra tiene que tener mínimo esta muestra.
  • ·         Las frecuencias teóricas o esperadas en cada casilla no deben ser inferiores a 5 en número absoluto. Si son menores que 5, no podemos sacar conclusiones del contraste de hipótesis con Chi-cuadrado.
Esto va a ocurrir en tablas de contingencia que haya mucha celdas. Por lo que en muchas ocasiones se agrupan en una.
Si no se cumplen estos requisitos se aplica  el test estadístico de Fisher o la corrección de continuidad de Yates (es otra variante del test de CHI CUADRADO)

Comentarios

Entradas populares de este blog