jueves, 17 de mayo de 2018

TEMA-5-ESTADÍSTICOS UNIVARIABLES


RESUMEN NUMÉRICO DE UNA SERIE ESTADÍSTICA

Además de las tablas podemos resumir una serie de observaciones mediante “estadísticos”: “Función de los datos observados”
Tres grandes tipos de medidas estadísticas:
  •        Medidas de tendencia central: dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse.
  •          Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de nuestras observaciones
  •       Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos

MEDIDAS DE TENDENCIA CENTRAL

Media aritmética o media, (𝑥 ): (el parámetro en poblaciones se representa por µ)
  •       Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos valores de la variable observada entre el total de observaciones. La fórmula es 𝑥 = åx/n
  •       Cuando los datos son agrupados, para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase 𝑥 = åmc fi /n

Mediana:
  •                  Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor.
  •        Si el número de observaciones es impar el valor de la observación será justamente la observación que ocupa la posición (n/2)+1
  •                  Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1
  •                Propiedad: robustez. Sólo tiene en cuenta la posición de los valores en la muestra y por tanto tiene mucho mejor comportamiento que la media cuando hay observaciones extremas.

Moda:
  •          Es el valor con mayor frecuencia (que más veces se repite)
  •          Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos)
  •        Se puede calcular para cualquier tipo de variable – Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor (hi /ci)


MEDIDAS DE POSICIÓN


Cuantiles:
  •       Se calculan para variables cuantitativas y, al igual que la mediana, sólo tienen en cuenta la posición de los valores en la muestra.
  •       Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente

o   Percentiles:
§  Dividen la muestra ordenada en 100 partes
§  El percentil “i” (Pi ), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores
§  Para buscar la posición de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi ) sea superior al valor del percentil
§  El valor del P50corresponde al valor de la mediana
o   Deciles:
§  Dividen la muestra ordenada en 10 partes
§  El decil “i” (Di ), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores
§  El valor del D5corresponde al valor de la mediana y, por tanto, al del P50
o   Cuartiles:
§  Dividen la muestra ordenada en 4 partes
§  El Q1 , primer cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 25% de las observaciones son menores y que el 75% son mayores.
§  El Q2 , segundo cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2 coincide con el valor del D5, con al valor de la mediana P50

§  El Q3 , tercer cuartil indica el valor que ocupa una posición en la seria numérica de forma que el 75% de las observaciones son menores y que el 25% son mayores.

§  El Q4 , cuarto cuartil indica el valor mayor que se alcanza en la seria numérica



MEDIDAS DE DISPERSIÓN


La información aportada por las medidas de tendencia central es limitada.
Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra |xn -x1 |
Desviación media: media aritmética de las distancias de cada observación con respecto a la media de la muestra: dm= å |xi -𝑥 |/n
Desviación típica: cuantifica el error que cometemos si representamos una muestra únicamente por su media (el parámetro en la población se representa por σ) s= √å (xi -𝑥 ) 2 /n-1
Varianza: expresa la misma información en valores cuadráticos (en la población el parámetro se expresa por σ 2 ): s 2= å (xi -𝑥 ) 2 /n-1
Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil= |Q3 -Q1 |
Coeficiente de variación: es una medida de dispersión relativa, ya que todas las demás se expresan en la unidad de medida variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medida: c.v.=s/(media)


DISTRIBUCIONES NORMALES


En estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones)
Esta curva se conoce como campana de Gauss.

ASIMETRÍAS Y CURTOSIS

ASIMETRÍAS

Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media.
Es adimensional y adopta valores entre -1 y 1.


Los resultados pueden ser los siguientes:

  •       g 1 = 0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media)
  •         g1 > 0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda)
  •         g1 < 0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha)


CURTOSIS O APUNTAMIENTO


Coeficiente de apuntamiento o curtosis de una variable, sirve para medir el grado de concentración de los valores que toma en torno a su media.
Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.
Adopta también valores entre -1 y 1.
Los resultados pueden ser los siguientes:
  •          g 2 = 0 (distribución mesocúrtica) . Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
  •          g2 > 0 (distribución leptocúrtica ). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
  •          g2 < 0 (distribución platicúrtica) . Presenta un reducido grado de concentración alrededor de los valores centrales de la variable





No hay comentarios:

Publicar un comentario

REFLEXIÓN

Bueno y aquí llegamos juntos al final del camino. Me gustaría hacer una pequeña reflexión con respecto a la asignatura de ETIC´S. Para empe...