ESTADÍSTICA DESCRIPTIVA
Sirve para describir y resumir
datos. Se refiere al tipo de estadística que normalmente vemos en los medios de
difusión.
Describe y analiza una
determinada población o muestra sin pretender sacar conclusiones de tipo
general.
Describe, analiza y representa un
grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan
la información contenida en ellos.
- Organiza de manera clara y fácil de analizar la información
- Resume los datos
- Explora las relaciones entre variables
- Es preliminar antes de la inferencia
ESTADÍSTICA INFERENCIAL
Utiliza muestras de datos para
sacar conclusiones sobre poblaciones más grandes. Este tipo de método se
encuentra más frecuentemente en artículos publicados sobre investigación
científica.
Infiere o induce leyes de
comportamiento de una población, a partir del estudio del análisis de una
muestra.
Apoyándose en el cálculo de
probabilidades y a partir de datos muestrales, efectúa:
- Estimaciones
- Decisiones
- Predicciones
- Generalizaciones sobre un conjunto mayor de datos
VARIABLES:
Presentación de datos
- Tablas de frecuencia: estructura de columnas y filas para organizar y resumir datos. Hay que seguir una serie de pautas.
o
Datos que muestran frecuencias en columnas y categoría
de las variables en filas.
o
Presentan información repetitiva de forma
visible y comprensible.
o
Requisitos:
§
Son autoexplicativas
§
Tienen que tener un título, breve y claro
§
Son sencillas y de fácil comprensión
§
Indican lugar, fecha y fuente de información
§
Incluye las unidades de medida en cada cabecera
§
Indican frecuencias absolutas (número absoluto)
y relativas (proporción)
COMO HACER UNA TABLA DE FRECUENCIA A PARTIR DE UNA DE DATOS AGRUPADOS:
- Definición de intervalos
- Definición de extremos de los intervalos
- Definición de amplitud o distancia entre los extremos
- Cálculo de la marca de clase de cada intervalo
La manera de hacerlo sería la
siguiente: primero calculamos el recorrido (xn niño que pesa mas y x1 niño q
pesa menos) Re = xn – x1 = 6.1 –3.3 = 2.8
Cuando no se nos dice nada el nº
de intervalos, se obtiene calculando la raíz cuadrada del nº de datos observado.
Veremos que la raíz cuadrada de 40 es igual a 6.32 por lo tanto tomaremos 6
intervalos.
Como el recorrido es 2.8 si lo
dividimos por el nº de intervalos tendremos la amplitud de cada uno de ellos y
así: 2,8/6 = 0,46.
Frecuencias absolutas (𝒇𝒊
):
- Número de individuos que presentan una modalidad, o que están incluidos en un intervalo
Frecuencias relativas (𝒉𝒊
):
- Proporción de individuos referidos al total que presentan una modalidad o que están incluidos en un intervalo
Frecuencias acumuladas ( 𝒇𝒊
ó 𝒉𝒊
)
- Número de individuos menores o iguales que la modalidad o el intervalo que estamos estudiando
Los intervalos tienen que ser
mutuamente excluyente
Para comprobar que no me he
equivocado al calcular los intervalos y su amplitud, tengo que sumar y me tiene
que dar N.
INDICADORES/CONCEPTO DE INDICADOR:
En el análisis descriptivo se
usan en gran medida los números relativos, que son la expresión de la relación
de dos o más cantidades.
La frecuencia absoluta no puede
ser un indicador pues le falta un denominador que la relacione con el tamaño de
la muestra o población, y/o el periodo en el que se presentaron los eventos.
Existen muchos indicadores
elaborados en:
- Instituto Nacional de Estadística (INE)
- Instituto de Estadística de Andalucía (IEA)
- Centro de Investigaciones Sociológicas (CIS)
Se define indicador como la
medida de la frecuencia de un determinado suceso en una población, expresado
como un número que puede ser:
- Proporción
- Tasa
- Razón
- Odds
Los indicadores siempre están
formados por un numerador y un denominador, es decir, es el resultado del
cociente entre dos magnitudes.
PROPORCIONES
Se define como una medida resumen
para variables cualitativas, que consiste en la comparación, a través de un
cociente (división) entre un subconjunto y el conjunto al que pertenece.
TASAS (RATE):
Es una medida que expresa el
riesgo de ocurrencia del evento (enfermedad) estudiado.
En realidad es una proporción,
pero con relación espacial y temporal. El denominador incluye una unidad de
tiempo.
Consiste en la comparación, a
través de una división, entre el número de veces que ocurre un cierto tipo de
evento y la población en la que puede ocurrir dicho evento en un tiempo
determinado.
MEDIDAS MÁS EMPLEADAS:
INCIDENCIA
Número de nuevos
casos de enfermedad que ocurren en un período específico de tiempo, en una
población a riesgo de desarrollar la enfermedad.
La incidencia es
una medida de riesgo.
- Incidencia acumulada (proporción de incidencia): Riesgo de que se produzca el suceso
o
Se calcula utilizando un período de tiempo
durante el cual consideramos que todos los individuos de la población están a
riesgo de la enfermedad.
o
Es la proporción de sujetos que desarrollan la
enfermedad, en un período de tiempo, del total de población a riesgo al inicio
del período.
o
Mide el riesgo promedio de padecer la enfermedad
(probabilidad de desarrollar la enfermedad)
- Tasa de incidencia (densidad de incidencia): Velocidad de aparición de nuevos casos con respecto al tamaño de la población
o
Con frecuencia, no todos los individuos a riesgo
(denominador) son seguidos durante el mismo período de tiempo.
o
Si se disponen de los diferentes tiempos de
observación (“tiempos en riesgo”) de los diferentes individuos, se puede
calcular la densidad de incidencia o tasa de incidencia
o
Es necesario especificar la unidad de tiempo a
las que se refiere la tasa (personas–año; personas–mes, personas–semana, etc.).
o
Una misma cantidad de personas-tiempo se puede
obtener mediante el seguimiento de distintos grupos de población.
o
Se mide en unidades de tiempo–1 .
o
No son proporciones, es una tasa instantánea
o
Expresa la “tasa” a la cual ocurren los eventos
en sujetos de la población en riesgo en cualquier momento.
o
Expresa velocidad: la tasa de cambio instantáneo
o la rapidez con la que se desarrolla el evento en la población.
§ Tasa:
datos agregados
§ Densidad
de incidencia: tasa obtenida de datos individuales.
- Densidad de incidencia basada en datos individuales:
o Nuevos casos/Personas-tiempo a riesgo
o
Personas – tiempo:
§ Suma
de tiempos que los individuos están a riesgo de desarrollar el evento.
§ Las
unidades a utilizar dependen del investigador. Los eventos poco frecuentes
suelen describirse en personas-año o un múltiplo del mismo (100 o 1000
personas-año). En cambio en los eventos más frecuentes (ej: la gripe) se pueden
utilizar personas-semana o personas-día.
RAZONESO “RATIOS”
Es una medida de
resumen para variables cualitativas que consiste en la comparación, a través de
una división entre dos conjuntos.
Los dos
conjuntos son distintos, es decir, uno no incluye al otro.
El numerador del
cociente, por tanto, no está incluido en el denominador, como sí sucedía en las
proporciones.
ODDS O VENTAJA
El cociente
entre la proporción o probabilidad de ocurrencia de un evento y la proporción o
probabilidad (complementaria) de no ocurrencia, se denomina con el término
inglés “odds”, empleado en el lenguaje de apuestas.
Sus valores van
desde 0 (eventos que nunca ocurren) hasta el infinito (eventos que ocurren
siempre)
MEDIDAS DE ASOCIACIÓN: RELACIONES ENTRE
PROPORCIÓN, RATIOS Y ODDS
La magnitud de
asociación entre dos fenómenos (por ejemplo entre un factor de exposición y una
enfermedad), puede estimarse a través de medidas que relacionen proporciones,
tasas y odds.
Las tres más importantes son:
- Razón de prevalencias: Estudios descriptivos de corte transversal. Realiza una ratio entre dos prevalencias (proporciones).
- Riesgo relativo o razón de riesgos o razón de incidencias: Estudios de observacionales de seguimiento o estudios experimentales. Realiza una ratio entre dos incidencias acumuladas (proporciones) o dos densidades de incidencia (tasas).
- Odds ratio o razón de ventajas: Estudios de casos y controles. Realiza una ratio entre dos medidas “odds” o ventajas.
No hay comentarios:
Publicar un comentario