Table des matières:

Le résumé à 5 chiffres inclut-il les valeurs aberrantes ?
Le résumé à 5 chiffres inclut-il les valeurs aberrantes ?

Vidéo: Le résumé à 5 chiffres inclut-il les valeurs aberrantes ?

Vidéo: Le résumé à 5 chiffres inclut-il les valeurs aberrantes ?
Vidéo: Traitement Données (Manquantes, aberrantes, doublons …) (Partie 1) 2024, Peut
Anonim

Les Résumé des cinq chiffres est une méthode pour résumer une distribution de données. Les cinq chiffres sont le minimum, la valeur du premier quartile (Q1), la médiane, la valeur du troisième quartile (Q3) et le maximum. Ceci est très différent du reste des données. C'est un valeur aberrante et doit être retiré.

A ce propos, en quoi consiste un résumé à 5 chiffres ?

Cinq- résumés de nombres A cinq - résumé du numéro est particulièrement utile dans les analyses descriptives ou lors de l'enquête préliminaire d'un grand ensemble de données. UNE résumé se compose de cinq valeurs: les valeurs les plus extrêmes de l'ensemble de données (les valeurs maximales et minimales), les quartiles inférieurs et supérieurs et la médiane.

De plus, comment détectez-vous si une nouvelle observation est aberrante ? Certaines des méthodes les plus populaires pour la détection des valeurs aberrantes sont:

  1. Z-Score ou analyse des valeurs extrêmes (paramétrique)
  2. Modélisation probabiliste et statistique (paramétrique)
  3. Modèles de régression linéaire (PCA, LMS)
  4. Modèles basés sur la proximité (non paramétriques)
  5. Modèles de théorie de l'information.

Ici, comment interprétez-vous l'intervalle interquartile ?

Interprétation des résultats: quartiles et intervalle interquartile

  1. Les centiles sont utiles pour donner la position relative d'un individu dans un groupe.
  2. La médiane est le 50e centile.
  3. Les quartiles divisent les données en quatre groupes, chacun contenant un nombre égal de valeurs.
  4. La différence entre le 75e et le 25e centile est appelée intervalle interquartile.

Qu'est-ce que la règle 1.5 IQR ?

Utilisation de l'interquartile Régner pour trouver des valeurs aberrantes Multipliez l'intervalle interquartile ( IQR ) par 1.5 (une constante utilisée pour discerner les valeurs aberrantes). Ajouter 1.5 X ( IQR ) au troisième quartile. Tout nombre supérieur à celui-ci est une valeur aberrante suspectée. Soustraire 1.5 X ( IQR ) à partir du premier quartile. Tout nombre inférieur à celui-ci est une valeur aberrante suspectée.

Conseillé: