ESTIMACIÓN E INFERENCIA ESTADÍSTICA
Al conjunto de procedimientos que
permiten elegir muestras de tal forma que éstas reflejan las características de
la población le llamamos técnicas de muestreo.
Siempre que trabajamos con
muestras (no estudiamos el problema en toda la población sino en una parte de
ella) hay que asumir un cierto error.
Si la muestra se elige por un
procedimiento de azar, se puede evaluar un error. La técnica de muestreo en ese
caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa
muestra elegida al azar se llama error aleatorio.
En los muestreos no
probabilísticos no es posible evaluar el error. En los muestreos
probabilísticos, el error aleatorio es inevitable, pero es evaluable.
Proceso de inferencia: quiero
medir un parámetro, no lo puedo medir en todos los sujetos, realizo una
selección preferiblemente aleatoria, una muestra mediante muestreo, calculo
estimador de ese parámetro y a partir del estimador hago la inferencia, es
decir, puedo aproximarme al conocimiento del parámetro.
PROCEDIMIENTO MUESTRAL O TÉCNICA DE MUESTREO
Un muestreo es un método tal que
al escoger un grupo pequeño de una población podamos tener un grado de
probabilidad de que ese pequeño grupo posea las características de la población
que estamos estudiando. Tenemos que tener en cuenta además de la técnica el
tamaño.
- El tamaño de la muestra a tomar va a depender de:
- El error aleatorio (estándar)
- De la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar
- De la variabilidad de la variable a estudiar (varianza en la población)
- El tamaño de la población del estudio.
Cálculo del tamaño de la muestra
para estimar la media de una población: el tamaño de población que tengo que
escoger es:
n= z2 x S2 / e2
- Z es el valor que depende del nivel de confianza 1-α con que se quiera dar a los intervalos calculados a partir de estimadores de esa muestra (Para nivel de confianza 95% z= 1,96 y para el nivel de confianza 99% z= 2,58)
- S2 es la varianza poblacional
- e es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar, es decir, en cuantos puntos quiero equivocarme en 1, 2, 3…
- Si tras esta operación se cumple el resultado: N>n (n- 1). El cálculo del tamaño termina.
- Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula n’= n/ 1 + (n/N)
Para calcular el tamaño de una
muestra cuando queremos estimar una proporción:
- P es la proporción de una categoría de la variable (si presencia de la enfermedad
- 1-p la proporción de la otra categoría (no tengo la enfermedad)
- Z valor que depende del nivel de confianza 1-α
- N es el tamaño de la población
- e es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de las variables a estudiar.
Tipos de muestreo
- No probabilístico: son los peores porque no utilizan el azar y siempre hay un sesgo de selección (tú lo seleccionas). No sigue proceso aleatorio y no puede considerarse que la muestra sea representativa de una población. Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza. Entre ellos encontramos:
o Por conveniencia o Internacional: el
investigador decide, según sus objetivos, los elementos que integrarán la
muestra considerando las unidades “típicas” de la población que desea conocer.
o
Por cuotas (es una variante del de
conveniencia): el investigador selecciona la muestra considerando algunos
fenómenos o variables a estudiar, como: sexo, raza, religión etc.
o
Accidental: consiste en utilizar para el
estudio las personas disponibles en un momento dado, según lo que interesa
estudiar. De las tres es la peor. Por ejemplo, ir a una biblioteca a medir el
perfil del estudiante general.
- Probabilísticos: introducen el azar, por lo que me ayuda a saber con qué fiabilidad puedo hacer la inferencia. Todos y cada uno de los elementos tienen una probabilidad calculable y por lo tanto, conocida, de ser elegidas para la muestra. Consiste en extraer una parte (o muestra) de una población o universo, de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionadas.
o
Por conglomerado: es el menos fiable. Si
no disponemos de una lista detallada enumerada de cada una de las unidades que
conforman el universo y resulta muy complejo elaborarla. En la selección de la
muestra en lugar de escogerse cada unidad se toman los subgrupos conjuntos de
unidades “conglomerados”. No conoce el investigador la distribución variable y
las inferencias no son tan confiables como las de muestreo aleatorio.
o
Estratificados: se caracteriza por la subdivisión
de la población en subgrupos o estratos, debido a que las variables principales
que deben someterse a estudio presentan cierta variabilidad o distribución
conocida que puede afectar a los resultados. Por ejemplo, tengo una población
de 250 habitantes (N=250) y quiero seleccionar a 50 (n=50), averiguo que
distribución por sexo hay en la población (180 mujeres y 70 hombres en
enfermería, un porcentaje de 72% de mujeres y un 28% de varones) y forzamos ese
mismo porcentaje en la población selecciona (en la de 50) y habría entonces de
esos 50, 36 hombres y 14 mujeres).
o Aleatorios sistemáticos: similar al simple, en donde como
unidad del universo tiene la misma posibilidad de ser seleccionada.
o
Aleatorios simples: cada unidad tiene la
probabilidad equitativa de ser incluida en la muestra. El procedimiento más
básico es el de sorteo o rifa, pero tiene una desventaja que no puede usarse
cuando el universo es grande. La tabla de números aleatorios es más económica y
requiere menor tiempo. Es el más fiable.
No hay comentarios:
Publicar un comentario