Skip to content

Valores Outliers (2 de 3)

octubre 13, 2008

Por Macario Hernández Garza
Sistemas de Optimización y Estadística, S. C. Copyright © 2008. Todos los derechos reservados.

Uno de los usos fundamentales de los gráficos o charts, es el de reconocer patrones en los datos. Particularmente, podemos utilizar esta característica para detectar rápidamente valores outliers, valores que sospechamos no pertenecen al conjunto de datos, y que se han registrado producto de un error de medición, un error de transcripción al momento de registrarse los datos, o bien debido a una conducta torcida, con el propósito de engañar.

En este sentido, los gráficos de corridas (Run Charts, un gráfico de líneas en Excel), es un gráfico que nos puede servir para tener una primera impresión de los datos, y eventualmente hacer una depuración y corrección de los mismos.

En el siguiente gráfico, tenemos las votaciones obtenidas por el Partido Nueva Alianza en las votaciones para Presidente en el 2006, en el cuarto distrito electoral de Nuevo León México.

Como podemos ver del gráfico anterior, a simple vista los valores de 196 votos y 114 votos, están bajo fuerte sospecha de ser valores outliers, no solamente valores outliers normales, sino valores outliers extremos.

En la siguiente figura se muestra los límites inferior y superior para los valores outlier normales, y las fórmulas mediante las cuales se calcularon:

En la siguiente figura se muestra los límites inferior y superior para los valores outlier extremos, y también, las fórmulas mediante las cuales se calcularon:

Enseguida se tiene el gráfico de corridas anterior, pero ahora se le ha agregado una línea, que es el límite superior para detectar los valores outliers extremos, cuyo valor es 15 (como se muestra en la fórmula anterior). Los valores superiores a 15, son valores outliers extremos.

En el gráfico anterior se muestran cuatro valores outliers extremos, cuyos valores mayores son el de 196 votos y el de 114 votos. Respecto al final de esta historia podré decir, que tras el recuento ordenado por el IFE, de estas dos casillas con valores sospechosos de votos, solamente se ordenó el recuento de la casilla correspondiente a estos 196 votos, después de recuento se comprobó que solamente tenía 8 votos. La otra casilla de los 114 votos, inexplicablemente no entró dentro de las casillas de recuento ordenadas por el TRIFE. Cabe recordar que en un distrito correspondiente a Guadalupe Nuevo León, hubo 600 votos de más para el Partido Acción Nacional (PAN), que fue una casilla “emblemática” dentro de las casillas con irregularidades.

Con lo que hemos visto aquí, se ve que se pueden aplicar técnicas relativamente sencillas para la limpieza de una elección, sólo que frecuentemente no hay voluntad política para hacer esto.

No comments yet

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: