ANOVA (Analiza wariancji)

ANOVA oznacza analizę wariancji. ANOVA została założona przez Ronalda Fishera w 1918 roku. Nazwa Analiza wariancji została wyprowadzona na podstawie podejścia, w którym metoda wykorzystuje wariancję do określenia środków, czy są one różne czy równe.

Jest to metoda statystyczna stosowana do testowania różnic między dwoma lub więcej średnimi. Służy do testowania różnic ogólnych, a nie konkretnych różnic między środkami. Ocenia znaczenie jednego lub więcej czynników poprzez porównanie średnich zmiennych odpowiedzi na różnych poziomach czynników.

Hipoteza zerowa stwierdza, że ​​wszystkie średnie liczby ludności są równe. Alternatywna hipoteza dowodzi, że co najmniej jedna średnia populacji jest inna

Zapewnia to sposób na przetestowanie różnych hipotez zerowych jednocześnie.

Ogólny cel ANOVA

Powodem wykonania ANOVA jest sprawdzenie, czy istnieje jakaś różnica między grupami w jakiejś zmiennej. Dzisiaj naukowcy używają ANOVA na wiele sposobów. Zastosowanie ANOVA zależy całkowicie od projektu badań.

Możesz użyć testu t do porównania średnich z dwóch próbek, ale jeśli do porównania są więcej niż dwie próbki, najlepszą metodą do zastosowania jest ANOVA.

Założenia ANOVA

Istnieją cztery główne założenia

  • Oczekiwane wartości błędów wynoszą zero
  • Wariancje wszystkich błędów są sobie równe
  • Błędy są niezależne
  • Zwykle są dystrybuowane

Rodzaje ANOVA

  1. Jedna droga między grupami

ANOVA jednokierunkowa służy do sprawdzenia, czy istnieje jakakolwiek znacząca różnica między średnimi trzech lub więcej niepowiązanych grup. Testuje głównie hipotezę zerową.

H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ

Gdzie µ oznacza średnią grupy, a x oznacza liczbę grup. ANOVA jednokierunkowa daje znaczący wynik. Jednym ze sposobów ANOVA jest statystyka testu zbiorczego i nie da ona znać, które konkretne grupy różnią się od siebie. Aby poznać konkretną grupę lub grupy, które różnią się od innych, musisz wykonać test post hoc.

Przykład jednokierunkowej ANOVA

Wybrano 20 osób do przetestowania efektu pięciu różnych ćwiczeń. 20 osób jest podzielonych na 4 grupy po 5 członków. Ich wagi są rejestrowane po kilku dniach. Porównano wpływ ćwiczeń na 5 grup mężczyzn. Tutaj waga jest jedynym czynnikiem.

Założenia

Zmienna zależna jest zwykle rozkładana w każdej grupie

Istnieje jednorodność wariancji

Niezależność obserwacji

  1. ANOVA powtórzyła jeden sposób

Powtarzane miary ANOVA jest mniej więcej równa jednokierunkowej ANOVA, ale jest stosowana do złożonych grup. Powtarzane pomiary badają 1. zmiany średnich wyników w trzech lub więcej punktach czasowych

2. różnice średnich wyników w różnych warunkach.

Przykład powtarzanych środków

Możesz zbadać wpływ 6-miesięcznego programu ćwiczeń na zmniejszenie masy ciała u niektórych osób. Obliczasz wagę w trzech różnych momentach podczas okresu treningowego, aby opracować przebieg czasowy dla dowolnego efektu ćwiczeń.

Możesz pozwolić tej samej osobie na zjedzenie innego rodzaju produktów zmniejszających wagę i oceń ją według smaku.

W tym przykładzie ten sam zestaw ludzi jest mierzony więcej niż jeden raz na tej samej zmiennej zależnej.

  1. Dwukierunkowy między grupami

Dwukierunkowa ANOVA porównuje średnią różnicę między grupami podzielonymi na dwa czynniki. Głównym celem dwukierunkowej analizy wariancji ANOVA jest sprawdzenie, czy istnieje jakakolwiek interakcja między dwiema zmiennymi niezależnymi na zmiennych zależnych. Informuje również, czy wpływ jednej ze zmiennych niezależnych na zmienną zależną jest taki sam dla wszystkich wartości drugiej zmiennej niezależnej.

Przykład

Badanie wpływu nawozów na plon ryżu. Stosujesz pięć nawozów różnej jakości na pięciu poletkach, każdy uprawia ryż. Wydajność z każdej działki jest rejestrowana i obserwowana jest różnica między każdą działką. Tutaj można również zbadać wpływ żyzności działek. Istnieją zatem dwa czynniki: nawóz i płodność.

Założenia

Przed rozpoczęciem dwukierunkowej ANOVA dane powinny przejść przez sześć założeń, aby upewnić się, że posiadane dane są wystarczające do przeprowadzenia dwukierunkowej ANOVA. Sześć założeń wymieniono poniżej

  • Zmienna zależna powinna być mierzona na poziomie ciągłym
  • Twoja dwie niezależne zmienne powinny zawierać dwie lub więcej kategorycznych niezależnych grup dla każdej
  • Powinieneś mieć niezależność obserwacji
  • Unikaj wartości odstających
  • Zmienna zależna powinna być normalnie rozłożona dla każdej kombinacji grup dwóch zmiennych niezależnych
  • Jednorodność wariancji
  1. Dwukierunkowe powtarzane pomiary

Dwukierunkowe powtarzanie mierzy średnie różnice między grupami, które zostały podzielone na dwie części w obrębie zmiennych niezależnych. Dwukierunkowo powtarzana miara jest często stosowana w badaniach, w których zmienna zależna jest mierzona więcej niż dwa razy w dwóch lub więcej warunkach.

Przykład

Badacz zdrowia chce znaleźć najlepszy sposób na zmniejszenie przewlekłego bólu stawów odczuwanego przez ludzi. Badacz wybiera dwa różne rodzaje zabiegów, aby zmniejszyć poziom bólu. Te dwa rodzaje leczenia są znane jako „warunki”. Leczenie A to program masażu, a Leczenie B to program akupunktury. Oba zabiegi są podawane wszystkim pacjentom przez 8 tygodni.

Pacjenci są badani w trzech punktach czasowych - na początku programu, w środku programu i na końcu programu.

Badacz wybiera 30 pacjentów do wzięcia udziału w badaniu. Ale kiedy pierwszych 15 pacjentów przechodzi leczenie A, pozostałych 15 pacjentów przechodzi leczenie B i odwrotnie.

Pod koniec 8 tygodni badacz stosuje ANOVA z powtarzanymi dwukierunkowymi pomiarami, aby dowiedzieć się, czy występuje jakakolwiek zmiana w bólu w wyniku interakcji między rodzajem leczenia a momentem.

Założenia

Twoje dane powinny przejść pięć założeń, które są potrzebne do dwukrotnej ANOVA z powtarzanymi pomiarami, aby dać dokładny wynik.

  • Zmienna zależna powinna być mierzona na poziomie ciągłym
  • Twoje dwa czynniki tematyczne powinny składać się z co najmniej dwóch kategorycznie powiązanych grup
  • Nie powinno być żadnych wartości odstających
  • Zmienna zależna powinna być normalnie rozdzielona między każdą kombinację powiązanych grup
  • Różnice między wszystkimi kombinacjami powiązanych grup powinny być równe

Parametryczny i nieparametryczny test ANOVA

Jeżeli informacja o populacji jest całkowicie znana za pomocą jej parametrów, wówczas przeprowadzony test statystyczny nazywa się testem parametrycznym.

Jeśli informacja o populacji lub parametrach nie jest znana, ale nadal jest wymagana do przetestowania hipotezy, wówczas nazywa się to testem nieparametrycznym.

Jeśli masz dane kategoryczne, nie możesz użyć metody ANOVA, musisz użyć testu Chi kwadrat, który dotyczy interakcji ANOVA.

Procedura testowania hipotez - ANOVA jednokierunkowa

  1. Sprawdź wszelkie niezbędne założenia i napisz hipotezę zerową i alternatywną

Aby wykonać ANOVA w jeden sposób, należy przyjąć pewne założenia. Założenia są następujące

  • Każda próbka jest niezależną próbą losową
  • Rozkład zmiennej odpowiedzi jest zgodny z rozkładem normalnym
  • Wariancje populacji są równe we wszystkich odpowiedziach na poziomie grupy. Można to ustalić, dzieląc największe odchylenie standardowe próbki przez najmniejszy standard próbki i nie jest ono większe niż dwa, zakładając, że wariancje populacji są równe.
  1. Oblicz odpowiednią statystykę testu

Jeden ze sposobów ANOVA wykorzystuje statystyki testu F. Obliczenia ręczne wymagają wielu kroków do obliczenia współczynnika F, ale oprogramowanie statystyczne, takie jak SPSS, obliczy współczynnik F dla Ciebie i utworzy tabelę źródłową ANOVA.

Tabela ANOVA poda informacje o zmienności między grupami i wewnątrz grup. Tabela da ci całą formułę. Poniżej znajduje się przykład jednokierunkowej tabeli ANOVA

ŹródłoSSDFStwardnienie rozsianefa
ZabiegiSSTk-1SST / (k-1)MST / MSE
BłądSSENkSSE / (Nk)
Razem (poprawione)SSN-1

SST oznacza sumę kwadratów zabiegów, SSE oznacza sumę kwadratów błędów

DFT, który jest k-1, oznacza stopnie swobody leczenia, DFE, który jest Nk, oznacza stopnie swobody błędów.

  1. Określ wartość ap związaną ze statystyką testową
  2. Określ hipotezę zerową i alternatywną

Jeśli hipoteza zerowa jest fałszywa, MST powinno być większe niż MSE

  1. Podaj wniosek

Na podstawie swojego wyniku napisz wniosek zgodny z pytaniem badawczym anova.

Wiele testów porównawczych

Jeśli okaże się, że istnieje znacząca różnica między grupami, która nie jest związana z błędem próbkowania, konieczne jest przeprowadzenie kilku testów t w celu przetestowania średnich między grupami. Przeprowadzono kilka testów w celu kontroli poziomu błędu typu 1.

  • Test Scheffe'a
  • Zmodyfikowany test Bonferroniego
  • Test Dunnette
  • Test Tukeya

Obliczenia

Obliczenia ANOVA można wykonać na trzy sposoby - obliczenia ręczne, arkusz Excel i oprogramowanie SPSS. Pozwala poznać szczegółowo wszystkie obliczenia poniżej

  1. Obliczenia ręczne ANOVA

  • Krok 1

Oblicz CM

CM = (suma wszystkich obserwacji) 2 / N ogółem

  • Krok 2

Oblicz całkowite SS

Total SS = Suma kwadratów wszystkich obserwacji - CM

  • Krok 3

Oblicz SST (suma kwadratów do leczenia)

SST = ∑ 3 i = 1 T2i / n i - CM

  • Krok 4

Oblicz SSE (suma kwadratów dla błędów)

SSE = SS (ogółem) - SST

  • Krok 5

Oblicz MST, MSE i ich stosunek F

MST = SST / k-1

MSE = SSE / Nk

F = MST / MSE

  1. ANOVA przy użyciu programu Excel

Aby wykonać ANOVA z jednym czynnikiem w programie Excel, wykonaj te proste kroki

  • Przejdź do zakładki Dane
  • Kliknij Analiza danych
  • Wybierz Anova: Pojedynczy czynnik i kliknij OK (istnieją również inne opcje, takie jak Anova: dwa czynniki z replikacją i Anova: dwa czynniki bez replikacji)
  • Kliknij pole Zakres wejściowy i wybierz zakres
  • Kliknij pole Zakres wyjściowy, wybierz zakres wyjściowy i kliknij Ok
  • Otrzymasz wynik wyświetlony w arkuszu programu Excel
  • Jeśli F jest większy niż Fryt, hipoteza zerowa jest odrzucana
  1. ANOVA przy użyciu SPSS

Najpierw pobierz oprogramowanie SPSS, aby wykonać ANOVA. Tutaj możemy zobaczyć, jak wykonać ANOVA jednokierunkową za pomocą SPSS

SPSS zawsze zakłada, że ​​zmienna niezależna jest reprezentowana numerycznie. W przykładowym zestawie danych MAJOR jest ciągiem. Najpierw przekonwertuj zmienną łańcuchową na zmienną numeryczną. Po zakończeniu konwersji jesteś gotowy wykonać ANOVA

  • Otwórz oprogramowanie SPSS
  • Kliknij przycisk Analizuj à Porównaj środki à Jednokierunkowa ANOVA
  • Jednokierunkowe okno dialogowe ANOVA pojawia się na ekranie
  • Po lewej stronie okna dialogowego zobaczysz listę wszystkich zmiennych zależnych, które zostały zmierzone przez Ciebie. Przenieś go na listę Zależne po prawej stronie, używając przycisku strzałki w górę
  • W ten sam sposób przenieś zmienną niezależną z listy po lewej stronie do pola Czynnik po prawej stronie.
  • Kliknij przycisk Post Hoc, aby wybrać typ wielokrotnego porównania, który chcesz wykonać.
  • Wybierz dowolny test post hoc, który pasuje do twoich badań, klikając pole wyboru obok testu
  • Kliknij Kontynuuj, aby przejść do okna dialogowego ANOVA Jednokierunkowe
  • Wybierz dowolne statystyki i kliknij pola wyboru po lewej stronie opcji, aby je wybrać
  • Kliknij opcję Wykres działania, aby uzyskać wykres anowy średnich warunków
  • Kliknij Kontynuuj i kliknij OK

Pojawi się okno wyjściowe SPSS z sześcioma głównymi sekcjami

  • Sekcja opisowa
  • Test jednorodności wariancji
  • ANOVA
  • Wiele porównań
  • Średnią ocen
  • Wykres

Rzeczy, które należy wziąć pod uwagę, uruchamiając ANOVA

Poziom danych i założenia odgrywają kluczową rolę w ANOVA.

Badacz powinien dowiedzieć się, czy dane są skrzyżowane czy zagnieżdżone. Jeśli dane zostaną przekroczone, wszystkie grupy otrzymają wszystkie aspekty.

Jeśli dane są zagnieżdżone, wówczas każda grupa otrzyma inną metodę ANOVA.

Ważniejsze jest obliczenie wielkości efektu anova. Wielkość efektu może powiedzieć, w jakim stopniu hipoteza zerowa jest fałszywa. Średni rozmiar efektu jest zawsze preferowany

Mam nadzieję, że ten artykuł zawiera krótkie omówienie analizy ANOVA i interpretacji wyników za jej pomocą.

Powiązane kursy: -

  1. ANOVA Korzystanie z programu Minitab
  2. Kurs R Studio Anova Techniques

Kategoria: