INTRODUCCIÓN |
Hasta ahora, hemos estudiado estadística descriptiva, una serie de procedimientos y técnicas, que permitían un conocimiento descriptivo de las características básicas de una población.
Pero en general, no podremos casi nunca tratar con poblaciones al completo. Ya sea porque la población a estudiar es muy grande, ya sea por motivos económicos, de falta de personal cualificado, o para una mayor rapidez en la recogida y presentación de los datos, lo que se suele hacer es obtener los datos, de tan sólo una muestra de la población.
No podemos estudiar todos los coches que salen de una cadena de producción para determinar su calidad, ni es posible ensayar un medicamento en todas las personas, ni podemos costearnos preguntar a todos los españoles sobre una cuestión cualquiera (salvo en referendums, votaciones, o en el censo, siendo estos los pocos casos en que un estudio comprende a toda la población).
En consecuencia, deberemos contentarnos con utilizar muestras, que sean capaces de revelarnos algo acerca de la población de las que han sido extraídas. De la forma de elegirlas, y las condiciones que han de verificar, hablaremos en el siguiente epígrafe.
La Estadística inferencial se ocupa de extender o extrapolar a toda una población, informaciones obtenidos de una muestra, así como de la toma de decisiones.
Observa desde muy de cerca la imágen de la derecha. Observar esa imágen de esta manera, es equivalente a tomar una muestra de una población. En principio solo tienes en tu mente un conjunto de datos, que no te dicen nada. Sin embargo, si te alejas unos 5 metros y observas de nuevo la imágen, empezarás a extraer más información, y posiblemente adivines que representa esta imágen ( puedes ver la imágen original haciendo clic sobre ella) . Habrás hecho una inferencia de los datos muestrales, para tener una imágen del conjunto. Esta es en resumidas cuentas el objeto de las técnicas que se describen en este curso: Obtener muestras e inferir datos sobre la población |
Así por ejemplo, cuando se pretende conocer de antemano los resultados de unas elecciones, se suelen hacer encuestas sobre intención de voto, a una muestra de ciudadanos. Se trata en este caso, de extrapolar para toda la población, los resultados derivados de la encuesta. La Estadística Inferencial nos ayuda en este caso, aunque siempre existirá una probabilidad de equivocarse, y un margen de error en los resultados obtenidos.
En otros casos, lo que se pretende es tomar decisiones, ya sea a partir de la estimación o de la contrastación de un test, y aquí también la estadística inferencial nos lo permite, siempre con un margen controlado de error.
En los próximos epígrafes iremos desgranando todos estos aspectos.
TEORÍA DE MUESTRAS |
Como ya hemos dicho, nuestro objetivo va a ser a partir de ahora, el tratamiento estadístico de muestras.
¿Pero bajo que condiciones, resulta apropiada una muestra?.Existen una serie de factores que inciden en la respuesta de esta pregunta, y que resultan fundamentales en estadística inferencial.
Una primera cuestión, es el tamaño que ha de tener. Parece evidente, que a mayor tamaño, más se acercaran los parámetros que calculemos, a los de la población ( y es cierto siempre que se tenga en cuenta la representatividad de la muestra, que es un aspecto que desarrollaremos ahora). En la práctica real, el número de elementos de una muestra está determinado por una serie de factores: grado de fiabilidad deseado, dificultad en la elección de los elementos que la compongan, tiempo necesario para la elección, gastos originados,...
La segunda y más importante cuestión es ¿cómo deben ser elegidos los elementos que la compongan?. Para ser válidas,las muestras han de ser representativas, esto es, si queremos inferir de los resultados de una muestra, en ella se ha de reproducir en igual porcentaje el carácter estudiado, que en la población total. Por tanto, será necesario, que en el momento de la elección de los elementos de la muestra, verifiquemos que todos los elementos de la población tiene igual probabilidad de ser elegidos para la muestra.
Cuando no se tienen en cuenta estos dos principios básicos, las inferencias realizadas son deficientes. Existe una variedad de "mentiras estadísticas", procedentes de afirmaciones basadas en pequeñas muestras , o en muestras no representativas. Así por ejemplo,si se dice "7 de cada 10 dentistas consultados recomiendan el dentífrico X", no debemos inferir que el 70% de los dentistas los recomiendan, hasta saber de que forma fueron elegidos los dentistas consultados,y cuántos fueron en total.
Las consideraciones referentes al tamaño de la muestra, se estudiarán más adelante. Las referentes a la forma de elegir la muestra, serán estudiadas ahora.
TIPOS DE MUESTREOS
Existen básicamente dos tipos de muestreo, los aleatorios y los no aleatorios.
En los primeros, el aspecto principal, es que todos los miembros de la muestra han sido elegidos al azar, de forma que cada miembro de la población tuvo igual oportunidad de salir en la muestra. Este tipo de muestreo, que es el más consistente, es al mismo tiempo el que resulta más costoso, y el que utilizaremos siempre en el desarrollo de los próximos epígrafes. Los centros oficiales como el INE, utilizan siempre muestreos aleatorios.
Los segundos, carecen del grado de representatividad de los primeros, pero permiten un gran ahorro en los costes. Se eligen los elementos, en función de que sean representativos, según la opinión del investigador. Es el método que utilizan generalmente las empresas privadas, y presenta el inconveniente de que la precisión de los resultados no es muy grandes, y es difícil medir el error de muestreo.
MUESTREOS ALEATORIOS
SIMPLE
Su utilización es muy sencilla, una vez que todos los elementos de la población han sido identificados y numerados ( y éste es probablemente su mayor inconveniente ). A partir de aquí, decidido el tamaño n de la muestra, los elementos que la compongan se han de elegir aleatoriamente entre los N de la población.
El método más adecuado para la elección en nuestro caso, es la utilización de tablas de números aleatorios.
Si queremos elegir una muestra formada por 40 elementos de una población de 600, iremos tomando cifras aleatorias de tres en tres. Si la cifra considerada es menor de 600, ya tendremos elegido un elemento de la muestra. Siguiendo este proceso, y saltándonos las cifras superiores a 600, podremos elegir todos los elementos que compondrán la muestra.
SISTEMÁTICO
Es análogo al anterior, aunque resulta más cómoda la elección de los elementos. Si hemos de elegir 40 elementos de un grupo de 600, se comienza por calcular el cociente 600/40 que nos dice que existen 40 grupos de 15 elementos entre los 600. Se elige un elemento de salida entre los 15 primeros, y suponiendo que sea el k-simo, el resto de los elementos serán los k-simos de cada grupo. En concreto, si el elemento de partida es el número 6, los restantes serán los que tengan los números: 15+6 ,2x15+6,......,39x15+6
Este procedimiento simplifica enormemente la elección de elementos, pero puede dar al traste con la representatividad de la muestra, cuando los elementos se hayan numerados por algún criterio concreto, y los k-simos tienen todos una determinada característica, que haga conformarse una muestra no representativa.
ESTRATIFICADO
A veces nos interesa, cuando las poblaciones son muy grandes, dividir éstas en subpoblaciones o estratos, sin elementos comunes, y que cubran toda la población.
Una vez hecho esto podemos elegir, por muestreo aleatorio simple, de cada estrato, un número de elementos igual o proporcional al tamaño del estrato.
Este procedimiento tiene la gran ventaja de que se puede obtener una mayor precisión en poblaciones no homogéneas (aunque en este curso no estudiaremos los métodos necesarios)
Si decidiéramos hacer una encuesta sobre la incidencia del tabaco en nuestro centro, podríamos razonar de la siguiente forma:
Nuestro centro tiene 2000 alumnos, 720 en 3º de ESO, 700 en 4º de ESO, 340 en 1º de Bachillerato, y 240 en 2º de Bachillerato.
Si deseamos tomar una muestra de 100 alumnos, para analizar la incidencia del tabaco en la adolescencia, bastaría tomar un número igual de alumnos de cada estrato, es decir 25.
Si embargo, si lo que se quiere es hacer una encuesta para conocer la opinión que tiene el alumnado sobre una medida que ha tomado el Consejo Escolar, es más representativo elegir de cada estrato, y en número proporcional a su tamaño, los elementos que compondrán la muestra. Si 3º de ESO representa al 36% del alumnado, el 36% de la muestra (es decir 36 alumnos) se elegirán de este estrato por muestreo aleatorio simple, 35 para 4º de ESO, y así hasta completar los 100 elementos de la muestra.
POR CONGLOMERADOS
A veces, para simplificar los procesos de toma de datos, se empieza por elegir ciertos conglomerados (que pueden ser bloques de viviendas, municipios, urnas electorales,...) y dentro de ellos se realiza el muestreo aleatorio.
ACTIVIDADES |
1.-Encuentra en un periódico o revista, un artículo o información en la que a tu juicio se esté haciendo uso de una muestra. 2.-Utilizando una tabla de números aleatorios, elige 15 elementos de una población numerada del 1 al 89. 3.- Dí de que forma elegirías una muestra de 50 alumnos de tu instituto, por muestreo aleatorio simple, sistemático y estratificado (cada estrato una clase, o un nivel). 4.- Establece un método para elegir una muestra de vecinos de una calle. 5.- De los 500 directores de complejos turísticos de nuestras Islas, 300 corresponden a complejos de 20 o menos habitaciones, 150 a complejos de entre 20 y 50 habitaciones y por último 50 corresponden a complejos de más de 50 habitaciones 6. Si pretendieras hacer una encuesta a una muestra de tamaño 50, ¿cómo la tomarías?, ¿sería indiferente el aspecto estadístico que tuvieras que estudiar? 6.- Un hospital dispone de un listado de los pacientes, organizados por áreas de atención (neurología, traumatología,....). Dí que tipos de muestreo podrían realizarse, y como los harías. 7.- Para realizar una encuesta sobre el consumo de un producto en una ciudad, se tomó una muestra de forma que de cada barrio se consultaba a un número de personas proporcional a la superficie ocupada por el barrio. ¿Te parece un método fiable?. Escribe un comentario. 8.- Un mayorista de alimentos, quiere enviar muestras de sus productos, a una muestra de supermercados. Elige de las 5 grandes cadenas de supermercados , una muestra de cada, y manda sus productos para ponerlos a prueba. ¿Qué tipo de muestreo está utilizando? |
Aunque hemos descrito los más importantes métodos de muestreo aleatorio, en lo que sigue supondremos siempre que el muestreo utilizado es el aleatorio simple.
TOMA DE DATOS: LA ENCUESTA
Una vez decidido el tamaño y la forma de elegir la muestra, aparece el problema de cómo realizar la toma de datos. La encuesta es el instrumento idóneo para este fín.
Se debe establecer en primer lugar el objetivo de la encuesta, desmenuzando el problema a investigar, eliminando lo que resulte superfluo, y centrándonos en los aspectos más relevantes.
A partir de aquí, se elabora un cuestionario, formado por un conjunto de preguntas que han de ser respondidas por los encuestados.
De la calidad de éste último depende en gran parte el resultado del trabajo. Existen una serie de factores que se han de tener en cuenta a la hora de redactar el cuestionario, entre los que destacan los siguientes:
• Las preguntas han de ser pocas (no más de 30) y cortas.
• Cerradas ( es decir que aparezcan todas las posibles repuestas ). Si preguntamos a un encuestado si le gustan las matemáticas, no podemos dejar que aparezcan respuestas de todo índole, sino que responda de acuerdo a una escala numérica o de valor. Por ejemplo podemos valorar su gusto de 1 a 5, o bien : Nada, Poco, Normal, Mucho, Muchísimo.
• Numéricas o al menos codificables ( es decir que podamos traducir las respuestas a números, por ejemplo asignando números del 1 al 5 a las respuestas del apartado anterior).
• Deben ser redactadas de forma concreta y precisa (sin palabras abstractas o ambiguas), de manera que las repuestas puedan ser inequívocas.
A partir de aquí, debe ser realizado el "trabajo de campo", es decir las entrevistas previstas, por medio de los encuestadores. Este trabajo también ha de hacerse bajo unas ciertas condiciones, que garanticen que las respuestas sean sinceras.
Una vez recopilados todos los datos, se procede a tabularlos, y describirlos, utilizando las técnicas que ya conoces de cursos anteriores.
ACTIVIDADES |
Confecciona una pequeña encuesta encaminada a conocer los gustos de tu clase sobre algún aspecto de tu elección, haciendo uso de las técnicas descritas |