Las muestras deben ser aleatorias

Una muestra aleatoria es un subconjunto de una población seleccionado mediante un proceso según el cual todas las muestras de un tamaño determinado tienen las mismas probabilidades de ocurrir. En estadística, una muestra aleatoria se utiliza para hacer generalizaciones, o inferencias, sobre una población.

Sin embargo, una muestra debe recogerse de forma aleatoria para que represente fielmente a toda la población de la que proviene. Usted debe planificar cuidadosamente su proceso de recolección de datos para asegurarse de que la muestra sea aleatoria. Además, el proceso o la población de donde se toman los datos debe ser estable.

Las muestras deben ser aleatorias para eliminar el sesgo de selección. Sesgo de selección significa que algunos sujetos tienen más probabilidades que otros de estar en la muestra. Si la muestra es sesgada, usted solo podrá hacer inferencias acerca de los sujetos de la muestra, no acerca de toda la población.

Supongamos que usted desea iniciar una nueva campaña publicitaria, pero no está seguro de si la prensa, la radio o la televisión es la mejor manera de llegar a sus clientes. Aunque no resulta práctico ni económico encuestar a todos sus clientes, es posible encuestar a una muestra aleatoria. En principio, usted se inclina por encuestar solo a los clientes que han respondido a una oferta de reembolso por correo, porque es más probable que estos clientes respondan a una encuesta. Sin embargo, esta muestra no representa a toda la población, porque cada cliente no tiene la misma posibilidad de ser seleccionado. Esto podría conducir a decisiones de negocio poco acertadas. En lugar de ello, usted decide seleccionar de manera aleatoria a los clientes que encuestará usando una lista alfabética de todos los clientes. A partir de estos datos, puede hacer inferencias acerca de su clientela para determinar la mejor manera de invertir su presupuesto de publicidad.

Determinar si una muestra es aleatoria usando una prueba de corridas

Después de recoger los datos, una manera de comprobar si los datos son aleatorios es mediante el uso de una prueba de corridas para buscar un patrón en los datos con el tiempo. Para realizar una prueba de corridas en Minitab, elija Estadísticas > No paramétricos > Prueba de corridas.

También hay otras gráficas que pueden identificar si una muestra es aleatoria.

Ejemplo del uso de una gráfica de series de tiempo para determinar que los datos no son aleatorios

Supongamos que un entrevistador selecciona 30 personas aleatoriamente y a cada una le hace una pregunta para la cual hay cuatro respuestas posibles. Las respuestas se codifican como 0, 1, 2, 3. El entrevistador crea una gráfica de series de tiempo para verificar la aleatoriedad de las respuestas.

Gráfica de series de tiempo de las respuestas

El patrón en los datos indica que los datos no son aleatorios. El entrevistador investiga para determinar si existe un sesgo en la redacción de las preguntas o en la selección de los sujetos.