Skip to content

Detección de valores outliers mediante formato condicional de Excel

enero 21, 2009

Por Macario Hernández Garza
Sistemas de Optimización y Estadística, S. C. Copyright © 2009. Todos los derechos reservados.

En dos post anteriores hablamos sobre los valores outliers de un conjunto de datos. Estos posts los puede usted encontrar en los siguientes links: aquí y aquí.

Podemos detectar los valores outliers de un conjunto de datos utilizando el formato condicional de Excel. Para ello debemos seleccionar las opciones de menú: Format-> Conditional Format

formatcondoutlier1Figura 1

Cuando aparece la forma de formato condicional, debemos introducir una fórmula la cual cuando sea verdadera, formatee el valor de la forma que el usuario lo desee, en este caso se escogió el que ponga el color rojo al valor, cuando este sea un valor outlier.

De los post anteriores sobre los valores outliers recordamos que los valores de un conjunto de datos son valores outliers cuando estos son menores que LímInf o mayores que LimSup.

LímInf = Q1- 1.5(Q3-Q1)
LímSup = Q3 + 1.5(Q3-1)

Donde Q1 es el primer cuartil y Q3 es el tercer cuartil de los datos. El concepto de cuartil se definió en el primer post sobre valores outlier, y se encuentra aquí. En ese mismo post se explica mediante que fórmula de Excel se puede calcular los cuartiles.

Al aparecer la forma de formato condicional, debemos de introducir dos fórmulas. Una para que detecte los valores menores que LímInf y otra para que detecte los valores mayores que LímSup.

En la siguiente figura se muestra la forma, después de haber introducido las fórmulas.

formatcondoutlier2Figura 2

En este caso el rango de datos está en el rango N5:N453. Las fórmulas no se ven completas en la forma anterior, pero las pondré en seguida.

formatcondoutlier4
En este caso, opté por poner de color rojo los valores outliers, sin embargo cada usuario puede hacer la selección que desee.

En la siguiente figura se ve parte del rango de valores con un valor outlier con font rojo como se definió en el formato condicional.

formatcondoutlier3

Figura 4

Obviamente se pueden detectar también valores outliers extremos, en este caso debemos sustituir el 1.5 por 3, en las dos fórmulas anteriores.

 

 

 

2 comentarios leave one →
  1. Pablo permalink
    mayo 22, 2009 5:25 pm

    Muy interesante tu página,
    les comparto esta dirección donde se encuentra un documento muy interesante respecto a los outliers:

    http://www.psc.state.ut.us/utilities/gas/02docs/0205702/30708Exhibit%20K%20Artie%20Powell.doc

    saludos

  2. Macario Hernández permalink*
    mayo 22, 2009 5:37 pm

    Hola Pablo

    Gracias por tú opinión sobre el Blog y gracias por tú aportación.

    Saludos

    Macario Hernández

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: