Skip to content

Valores Outliers (1 de 3)

octubre 4, 2008

Por Macario Hernández Garza
Sistemas de Optimización y Estadística, S. C. Copyright © 2008. Todos los derechos reservados.

El trabajar con datos producto de algún proceso de medición o conteo y de la captura de los mismos. Generalmente se producen datos “extraños” que pueden ser resultado de errores de captura, o de las operaciones aritméticas de quienes operan con ellos.

En estadística a estos valores se les llama “outliers”, los cuales son sospechosos de no pertenecer al conjunto de datos de donde proceden, o ser producto de algún suceso sumamente extraño. Podemos tener valores outliers moderados y extremos.

La Estadística proporciona criterios para detectar estos valores outliers. Incluso los paquetes estadísticos especializados proporcionan rutinas para detectar estos valores.

También se pueden diseñar procedimientos para detectar estos valores en Excel de Microsoft, mediante la utilización de fórmulas y el uso de formato condicional.

Existen diversos criterios para detectar a los valores outliers en un conjunto determinado de datos. Uno de los métodos más utilizados es el que utiliza el concepto de cuartil de un conjunto de datos.

Si tenemos un conjunto de datos y lo ordenaremos de menor a mayor, el Cuartil 1, llamémosle Q1, es el valor tal que desde ese valor hacia su izquierda se encuentran la primera cuarta parte de los valores de este conjunto de datos.

El Cuartil 2, llamémosle Q2, es el valor tal que desde ese valor hacia su izquierda se encuentran la primera mitad de los valores de este conjunto de datos. Y así sucesivamente.

Para detectar valores outliers moderados, tendríamos:

LímInf = Q1- 1.5(Q3-Q1)
LímSup = Q3 + 1.5(Q3-1)

Los valores que sean menores que LímInf o mayores que LímSup se consideran valores outliers.

Para detectar valores outliers extremos, tendríamos:

LímInf = Q1- 3 (Q3-Q1)
LímSup = Q3 + 3 (Q3-1)

Los valores que sean menores que LímInf o mayores que LímSup se consideran valores outliers.

En Excel de Microsoft se pueden calcular los cuartiles, mediante las fórmulas siguientes:

Se puede utilizar la opción de Formato Condicional de Excel, con el fin de que se señale con un font de un color determinado (por ejemplo, rojo) los valores outliers.

Obviamente, se puede también utilizar los gráficos para detectar valores outliers a simple vista, que pueden resultar de varias situaciones, como pudiera ser el de cometer un error de “dedo” al momento de registrar el valor por escrito en papel o en la computadora.

11 comentarios leave one →
  1. Macario Hernández permalink*
    noviembre 26, 2009 10:04 pm

    Hola Samuel

    Por el momento no tengo nada relacionado a Capacidad de Proceso, espero pronto empezar a postear temas al recpecto.

    Saludos

    Macario

  2. Ladidi permalink
    enero 4, 2010 9:12 am

    En caso de detectar outliers, ¿es recomendable excluirlos del conjunto de datos para no sesgar la media?

  3. Macario Hernández permalink*
    enero 4, 2010 10:47 pm

    Hola Ladidi

    El concepto de outlier sirve para que quien está trabajando con los datos le llame la atención valores que puderan ser errores de captura u otro etipo de error o intento de manipulación de los mismos.

    En determinadas circunstancias, es demasiado claro que el valor outlier definitivamente no pertenece al conjunto de datos, y se puede eliminar. Pero en general debemos hacer esto con cuidado, ya que hay situaciones en las cuales el outlier realmente pertenece a los datos y debemos eliminar el outlier. Debemos tener una actitud cuidadosa.

    En el siguiente post (cuyo link pongo) podrás ver que a veces la probabilidad de observar un outlier no es tan pequeña en ciertas distribuciones, lo cual podría indicar que puede pertenecer a los datos originales de la misma.

    https://optyestadistica.wordpress.com/2009/02/17/valores-outliers-3-de-3/

    Recibe saludos cordiales.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: