Sommario:

Cosa sono gli outlier nell'analisi dei dati?
Cosa sono gli outlier nell'analisi dei dati?

Video: Cosa sono gli outlier nell'analisi dei dati?

Video: Cosa sono gli outlier nell'analisi dei dati?
Video: 37 - Non Normalità dei Dati: OUTLIERS 2024, Maggio
Anonim

In statistica, an valore anomalo è un dati punto che differisce significativamente da altre osservazioni. Un valore anomalo può essere dovuto alla variabilità della misurazione o può indicare un errore sperimentale; questi ultimi sono talvolta esclusi dal dati set. Un valore anomalo può causare seri problemi in analisi statistiche.

Considerando questo, come si trovano gli outlier nei dati?

Un punto che cade al di fuori del dati le recinzioni del set sono classificate come minor valore anomalo , mentre uno che cade al di fuori delle recinzioni esterne è classificato come maggiore valore anomalo . Per trovare le recinzioni interne per te dati impostare, prima, moltiplicare l'intervallo interquartile per 1,5. Quindi, aggiungi il risultato a Q3 e sottrailo da Q1.

Oltre a quanto sopra, devo rimuovere i valori anomali dai miei dati? Per il la maggior parte, se i tuoi dati è affetto da questi casi estremi, tu Potere limite il input a un rappresentante storico di i tuoi dati che esclude valori anomali . Determinare caso per caso cosa il effetto di i valori anomali era. E da lì, decidi se vuoi rimuovere , cambia o mantieni theoutlier valori.

Rispetto a questo, come si comporta l'analisi dei dati con gli outlier?

Ecco quattro approcci:

  1. Elimina i record anomali. Nel caso di Bill Gates, o di un altro vero valore anomalo, a volte è meglio rimuovere completamente quel record dal tuo set di dati per impedire a quella persona o evento di distorcere la tua analisi.
  2. Limita i tuoi dati anomali.
  3. Assegna un nuovo valore.
  4. Prova una trasformazione.

Qual è un esempio di outlier?

valori anomali . more Un valore che "si trova al di fuori" (tanto più piccolo o più grande) della maggior parte degli altri valori in un insieme di dati. Per esempio nei punteggi 25, 29, 3, 32, 85, 33, 27, 28 sia 3 che 85 sono " valori anomali ".

Consigliato: