viernes, 5 de abril de 2019

TEMA 5: ESTADÍSTICAS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS

Esta tema trata sobre los estadísticos univariables: medidas resumen para variables cuantitativas. Las cuales son las siguientes: medidas de tendencia central, medidas de dispersión, medidas de posición. Forma de distribución: asimetría y curtosis.

Existen tres grandes tipos de medidas estadísticas: 
  • Medidas de tendencia central: dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse. Más o menos es un dato donde tendemos a agruparnos. 
    • Media aritmética o media. Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos valores de la variable observada entre el total de observaciones. 


    • Mediana: es de tendencia central y de posición. 
Mediana (impar, par)

    • Moda: es el valor con mayor frecuencia, si hay más de una se dice que la muestra es bimodal (2 modas). Se puede calcular para cualquier tipo de variable.  Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor (hi /ci). 


  • Medidas de posicióndividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Nos ayudan a identificar la posición que ocupa un individuo concreto de manera ordenada. 

    • Cuantiles hace tener en cuenta la posición de las variables en la muestra. 
      •  Se calculan para variables cuantitativas y, al igual que la mediana, sólo tienen en cuenta la posición de los valores en la muestra.
      • Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente





  • Medidas de dispersión o variabilidaddan información acerca de la heterogeneidad de nuestras observaciones. Si mezclo gente de 18 con personas de 3 años, hay mucha dispersión. Si hay uno de 18 y otro de 19 y digo que la media es de 18, no hay apenas dispersión. 
    • Rango o recorrido: diferencia entre el mayor y el menor valor de la muestra:  |
      • xn -x1|.
    • Desviación media: media aritmética de las distancias de cada observación con respecto a la media de la muestra: 
      • dm= å |xi -𝑥|/n. 
    • Desviación típica:  cuantifica el error que cometemos si representamos una muestra únicamente por su media (el parámetro en la población se representa por σ) 
      • s= √å (xi -𝑥)2/n-1. 
    • Varianza: expresa la misma información en valores cuadráticos (en la población el parámetro se expresa por σ2): 
      • s2= å(xi -𝑥)2 /n-1
    • Recorrido intercuartílico: diferencia entre el tercer y el primer cuartil
      •  |Q3 -Q1| 
    • Coeficiente de variación: es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas: 
      • c.v.=s/x

DISTRIBUCIONES NORMALES

Distribución normal y más. Aquí os dejo un enlace  de un página web bastante interesante, ya que os presenta las distintas distribuciones que podemos conocer. 

  • En la estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. 
  • La campana de Gauss es simétrica. Campana de Gauss




  • La mediana y la moda van a coincidir al ser distribución normal.

ASIMETRÍA Y CURTOSIS
La siguiente información será bastantes más esquemática, pero si os surgen dudas, os dejo el enlace de esta página web, de la cual he obtenido la información. Asimetría y curtosis

  • Asimetría: Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central. Es adimensional ya adopta valores entre -1 y 1.
Los resultados pueden ser los siguientes: 
    • G1 = 0, distribución simétrica. 
    • G1 > 0, distribución asimétrica positiva. 
    • G1 < 0, distribución asimétrica negativa. 
  • Curtosis: Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución.
    • G2 = 0, distribución mesocúrtica.
    • G2 > 0, distribución leptocúrtica.
    • G2 < 0, Distribución paticúrtica. 

No hay comentarios:

Publicar un comentario

CONCLUSIÓN

Pues como todo, todo tiene su fin, y esta asignatura esta llegando a su fin. Personalmente puedo decir que nunca me había enfrentado a esto,...