Valor atípico

En estadística, tales como muestras estratificadas, un valor atípico (en inglés outlier) es una observación que es numéricamente distante del resto de los datos. Las estadísticas derivadas de los conjuntos de datos que incluyen valores atípicos serán frecuentemente engañosas. Por ejemplo, en el cálculo de la temperatura media de 10 objetos en una habitación, si la mayoría tienen entre 20 y 25 °C, pero hay un horno a 350 °C, la mediana de los datos puede ser 23, pero la temperatura media será 55. En este caso, la mediana refleja mejor la temperatura de la muestra al azar de un objeto que la media. Los valores atípicos pueden ser indicativos de datos que pertenecen a una población diferente del resto de las muestras establecidas.

Los valores atípicos son en ocasiones una cuestión subjetiva, y existen numerosos métodos para clasificarlos. El método más impartido académicamente por su sencillez y resultados es el test de Tukey, que toma como referencia la diferencia entre el primer cuartil Q 1 {\displaystyle Q_{1}} y el tercer cuartil Q 3 {\displaystyle Q_{3}} , o rango intercuartílico. En un diagrama de caja se considera un valor atípico el que se encuentra 1,5 veces esa distancia de uno de esos cuartiles (atípico leve) o a 3 veces esa distancia (atípico extremo).

Valor atípico leve

Siendo Q 1 {\displaystyle Q_{1}} y Q 3 {\displaystyle Q_{3}} el primer y tercer cuartil, y I Q R {\displaystyle IQR} el rango intercuartil ( Q 3 Q 1 {\displaystyle Q_{3}-Q_{1}} ), un valor atípico leve será aquel que:

q < Q 1 1.5 I Q R , {\displaystyle q<Q_{1}-1.5\cdot \mathrm {IQR} ,}

o

q > Q 3 + 1.5 I Q R . {\displaystyle q>Q_{3}+1.5\cdot \mathrm {IQR} .}

Q 1 {\displaystyle Q_{1}} y Q 3 {\displaystyle Q_{3}} determinan, pues, los llamados límites interiores, a partir de los cuales la observación se considera un atípico leve.

Valor atípico extremo

Los atípicos extremos son observaciones más allá de los límites externos:

q < Q 1 3 I Q R , {\displaystyle q<Q_{1}-3\cdot \mathrm {IQR} ,}

o

q > Q 3 + 3 I Q R . {\displaystyle q>Q_{3}+3\cdot \mathrm {IQR} .}

Véase también

Control de autoridades
  • Proyectos Wikimedia
  • Wd Datos: Q779824
  • Commonscat Multimedia: Outliers / Q779824

  • Identificadores
  • BNF: 12127529t (data)
  • GND: 4510494-3
  • LCCN: sh85096171
  • NLI: 987007553465305171
  • SUDOC: 029709113
  • Identificadores médicos
  • MeSH: D016311
  • UMLS: C0079958
  • Wd Datos: Q779824
  • Commonscat Multimedia: Outliers / Q779824