Formuła wartości odstających - Jak obliczyć wartości odstające (szablon Excel)

Spisie treści:

Anonim

Formuła wartości odstających (spis treści)

  • Formuła wartości odstających
  • Przykłady formuły wartości odstających (z szablonem Excel)

Formuła wartości odstających

W statystykach wartości odstające są dwoma skrajnie odległymi nietypowymi punktami w danych zbiorach. Ekstremalnie wysoka i bardzo niska wartość są wartościami odstającymi zestawu danych. Jest to bardzo przydatne w wykrywaniu wszelkich błędów i pomyłek. Jak sama nazwa wskazuje, wartości odstające to wartości leżące poza resztą wartości w zbiorze danych. Przykład: rozważ studentów inżynierii i wyobraź sobie, że mieli krasnoludy w swojej klasie. Tak więc krasnoludy to ludzie, którzy mają wyjątkowo niski wzrost w porównaniu z innymi ludźmi o normalnym wzroście. To jest wartość odstająca w tej klasie. Wartości odstające można obliczyć przy użyciu metody Tukeya.

Wzór na wartości odstające -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Przykłady formuły wartości odstających (z szablonem Excel)

Weźmy przykład, aby lepiej zrozumieć obliczanie wzoru na wartości odstające.

Możesz pobrać ten szablon wartości odstających tutaj - szablon wartości odstających

Formuła wartości odstających - przykład nr 1

Rozważ następujący zestaw danych i oblicz wartości odstające dla zestawu danych.

Zestaw danych = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Rosnąco uporządkowany zestaw danych:

Mediana zbioru danych zamówienia rosnącego jest obliczana jako:

W tym zestawie danych całkowita liczba danych wynosi 11. Więc n = 11. Mediana = 11 + 1/2 = 12/2 = 6. Stąd wartością, która znajduje się na 6. pozycji w tym zestawie danych jest mediana.

Zatem wartość mediany = 34.

Podziel zestaw danych na 2 połowy za pomocą mediany.

Mediana zbioru danych dolnej połowy i górnej połowy jest obliczana jako:

  • W dolnej połowie 2, 5, 6, 7, 23, jeśli znajdziemy medianę podobną do tej z kroku 2, mediana będzie wynosić 6. Zatem Q1 = 6.
  • W górnej połowie 45, 56, 89, 98 309, jeśli znajdziemy medianę podobną do tej z kroku 2, wartość mediany wyniesie 89. Zatem Q3 = 89.

IQR jest obliczany przy użyciu poniższego wzoru

IQR = Q3 - Q1

  • IQR = 89–6
  • IQR = 83

Dolna wartość odstająca jest obliczana przy użyciu poniższego wzoru

Dolna wartość odstająca = Q1 - (1, 5 * IQR)

  • Dolna wartość odstająca = 6 - (1, 5 * 83)
  • Dolna wartość odstająca = -118, 5

Wyższa wartość odstająca jest obliczana przy użyciu poniższego wzoru

Wyższa wartość odstająca = Q3 + (1, 5 * IQR)

  • Wyższa wartość odstająca = 89 + (1, 5 * 83)
  • Wyższa wartość odstająca = 213, 5

Teraz pobierz te wartości z zestawu danych -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213, 5, 309. Wartości, które spadają poniżej dolnej wartości i powyżej górnej są wartością odstającą. Dla tego zestawu danych wartość 309 jest wartością odstającą.

Formuła wartości odstających - przykład 2

Rozważ następujący zestaw danych i oblicz wartości odstające dla zestawu danych.

Zestaw danych = 45, 21, 34, 90, 109.

Rosnąco uporządkowany zestaw danych:

Mediana zbioru danych zamówienia rosnącego jest obliczana jako:

W tym zestawie danych całkowita liczba danych wynosi 5. Więc n = 5. Mediana = 5 + 1/2 = 6/2 = 3. Stąd wartością, która znajduje się na 3. pozycji w tym zestawie danych jest mediana.

Zatem wartość mediany = 45.

Podziel zestaw danych na 2 połowy za pomocą mediany.

Mediana zbioru danych dolnej połowy i górnej połowy jest obliczana jako:

  • Q1 = 27, 5
  • Q3 = 89

IQR jest obliczany przy użyciu poniższego wzoru

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Dolna wartość odstająca jest obliczana przy użyciu poniższego wzoru

Dolna wartość odstająca = Q1 - (1, 5 * IQR)

  • Dolna wartość odstająca = 27, 5 - (1, 5 * 72)
  • Dolna wartość odstająca = -80, 5

Wyższa wartość odstająca jest obliczana przy użyciu poniższego wzoru

Wyższa wartość odstająca = Q3 + (1, 5 * IQR)

  • Wyższa wartość odstająca = 99, 5 + (1, 5 * 72)
  • Wyższa wartość odstająca = 207, 5

Wyjaśnienie

Krok 1: Ułóż wszystkie wartości w danym zestawie danych w porządku rosnącym.

Krok 2: Znajdź wartość mediany dla sortowanych danych. Medianę można znaleźć za pomocą następującego wzoru. Poniższe obliczenia przedstawiają po prostu pozycję wartości mediany, która znajduje się w zestawie dat.

Mediana = (n + 1) / 2

Gdzie n jest całkowitą liczbą danych dostępnych w zbiorze danych.

Krok 3: Znajdź niższą wartość kwartylu Q1 ze zbioru danych. Aby to znaleźć, używając wartości mediany podziel zestaw danych na dwie połowy. Z dolnej połowy zestawu wartości znajdź medianę dla tego niższego zestawu, którym jest wartość Q1.

Krok 4: Znajdź górną wartość kwartylu Q3 ze zbioru danych. Jest dokładnie tak jak powyższy krok. Zamiast dolnej połowy musimy postępować zgodnie z tą samą procedurą, co zestaw wartości górnej połowy.

Krok 5: Znajdź wartość IQR zakresu międzykwartylowego. Aby znaleźć wartość Odliczenia Q1 z Q3.

IQR = Q3-Q1

Krok 6: Znajdź wartość Inner Extreme. Koniec, który wypada poza dolną stronę, który można również nazwać niewielką wartością odstającą. Pomnóż wartość IQR przez 1, 5 i odejmij tę wartość od Q1, otrzymując wewnętrzną dolną skrajność.

Dolna wartość odstająca = Q1 - (1, 5 * IQR)

Krok 7: Znajdź wartość Outer Extreme. Koniec, który wypada poza wyższą stronę, który można również nazwać dużą wartością odstającą. Pomnożenie wartości IQR przez 1, 5 i zsumowanie tej wartości z Q3 daje Outer Higher Extreme.

Wyższa wartość odstająca = Q3 + (1, 5 * IQR)

Krok 8: Wartości, które wykraczają poza te skrajności wewnętrzne i zewnętrzne, są wartościami odstającymi dla danego zestawu danych.

Formuła przydatności i zastosowań wartości odstających

Wartości odstające są bardzo ważne w każdym problemie z analizą danych. Wartość odstająca wykazuje niespójność w dowolnym zbiorze danych, ponieważ jest zdefiniowany jako niezbyt odległe wartości w zbiorze danych od jednego do drugiego. Jest to bardzo przydatne w znajdowaniu jakichkolwiek błędów, które wystąpiły w zbiorze danych. Ponieważ po umieszczeniu błędu w zbiorze danych wpływa to na średnią, a zatem mediana może powodować duże odchylenia w wyniku, jeśli wartości odstające znajdują się w zbiorze danych. Dlatego konieczne jest ustalenie wartości odstających z zestawu danych, aby uniknąć poważnych problemów w analizie statystycznej.

Polecane artykuły

To był przewodnik po formule wartości odstających. Tutaj omawiamy sposób obliczania wartości odstających wraz z praktycznymi przykładami i szablonem programu Excel do pobrania. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -

  1. Przewodnik po formule Midrange
  2. Przykłady wzoru wynagrodzenia
  3. Kalkulator Formuły DPMO
  4. Jak obliczyć rozkład T?
  5. Wzór na odchylenie kwartylowe | Przykłady