ANOVA (Analiza wariancji)
ANOVA oznacza analizę wariancji. ANOVA została założona przez Ronalda Fishera w 1918 roku. Nazwa Analiza wariancji została wyprowadzona na podstawie podejścia, w którym metoda wykorzystuje wariancję do określenia środków, czy są one różne czy równe.
Jest to metoda statystyczna stosowana do testowania różnic między dwoma lub więcej średnimi. Służy do testowania różnic ogólnych, a nie konkretnych różnic między środkami. Ocenia znaczenie jednego lub więcej czynników poprzez porównanie średnich zmiennych odpowiedzi na różnych poziomach czynników.
Hipoteza zerowa stwierdza, że wszystkie średnie liczby ludności są równe. Alternatywna hipoteza dowodzi, że co najmniej jedna średnia populacji jest inna
Zapewnia to sposób na przetestowanie różnych hipotez zerowych jednocześnie.
Ogólny cel ANOVA
Powodem wykonania ANOVA jest sprawdzenie, czy istnieje jakaś różnica między grupami w jakiejś zmiennej. Dzisiaj naukowcy używają ANOVA na wiele sposobów. Zastosowanie ANOVA zależy całkowicie od projektu badań.
Możesz użyć testu t do porównania średnich z dwóch próbek, ale jeśli do porównania są więcej niż dwie próbki, najlepszą metodą do zastosowania jest ANOVA.
Założenia ANOVA
Istnieją cztery główne założenia
- Oczekiwane wartości błędów wynoszą zero
- Wariancje wszystkich błędów są sobie równe
- Błędy są niezależne
- Zwykle są dystrybuowane
Rodzaje ANOVA
-
Jedna droga między grupami
ANOVA jednokierunkowa służy do sprawdzenia, czy istnieje jakakolwiek znacząca różnica między średnimi trzech lub więcej niepowiązanych grup. Testuje głównie hipotezę zerową.
H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ
Gdzie µ oznacza średnią grupy, a x oznacza liczbę grup. ANOVA jednokierunkowa daje znaczący wynik. Jednym ze sposobów ANOVA jest statystyka testu zbiorczego i nie da ona znać, które konkretne grupy różnią się od siebie. Aby poznać konkretną grupę lub grupy, które różnią się od innych, musisz wykonać test post hoc.
Przykład jednokierunkowej ANOVA
Wybrano 20 osób do przetestowania efektu pięciu różnych ćwiczeń. 20 osób jest podzielonych na 4 grupy po 5 członków. Ich wagi są rejestrowane po kilku dniach. Porównano wpływ ćwiczeń na 5 grup mężczyzn. Tutaj waga jest jedynym czynnikiem.
Założenia
Zmienna zależna jest zwykle rozkładana w każdej grupie
Istnieje jednorodność wariancji
Niezależność obserwacji
-
ANOVA powtórzyła jeden sposób
Powtarzane miary ANOVA jest mniej więcej równa jednokierunkowej ANOVA, ale jest stosowana do złożonych grup. Powtarzane pomiary badają 1. zmiany średnich wyników w trzech lub więcej punktach czasowych
2. różnice średnich wyników w różnych warunkach.
Przykład powtarzanych środków
Możesz zbadać wpływ 6-miesięcznego programu ćwiczeń na zmniejszenie masy ciała u niektórych osób. Obliczasz wagę w trzech różnych momentach podczas okresu treningowego, aby opracować przebieg czasowy dla dowolnego efektu ćwiczeń.
Możesz pozwolić tej samej osobie na zjedzenie innego rodzaju produktów zmniejszających wagę i oceń ją według smaku.
W tym przykładzie ten sam zestaw ludzi jest mierzony więcej niż jeden raz na tej samej zmiennej zależnej.
-
Dwukierunkowy między grupami
Dwukierunkowa ANOVA porównuje średnią różnicę między grupami podzielonymi na dwa czynniki. Głównym celem dwukierunkowej analizy wariancji ANOVA jest sprawdzenie, czy istnieje jakakolwiek interakcja między dwiema zmiennymi niezależnymi na zmiennych zależnych. Informuje również, czy wpływ jednej ze zmiennych niezależnych na zmienną zależną jest taki sam dla wszystkich wartości drugiej zmiennej niezależnej.
Przykład
Badanie wpływu nawozów na plon ryżu. Stosujesz pięć nawozów różnej jakości na pięciu poletkach, każdy uprawia ryż. Wydajność z każdej działki jest rejestrowana i obserwowana jest różnica między każdą działką. Tutaj można również zbadać wpływ żyzności działek. Istnieją zatem dwa czynniki: nawóz i płodność.
Założenia
Przed rozpoczęciem dwukierunkowej ANOVA dane powinny przejść przez sześć założeń, aby upewnić się, że posiadane dane są wystarczające do przeprowadzenia dwukierunkowej ANOVA. Sześć założeń wymieniono poniżej
- Zmienna zależna powinna być mierzona na poziomie ciągłym
- Twoja dwie niezależne zmienne powinny zawierać dwie lub więcej kategorycznych niezależnych grup dla każdej
- Powinieneś mieć niezależność obserwacji
- Unikaj wartości odstających
- Zmienna zależna powinna być normalnie rozłożona dla każdej kombinacji grup dwóch zmiennych niezależnych
- Jednorodność wariancji
-
Dwukierunkowe powtarzane pomiary
Dwukierunkowe powtarzanie mierzy średnie różnice między grupami, które zostały podzielone na dwie części w obrębie zmiennych niezależnych. Dwukierunkowo powtarzana miara jest często stosowana w badaniach, w których zmienna zależna jest mierzona więcej niż dwa razy w dwóch lub więcej warunkach.
Przykład
Badacz zdrowia chce znaleźć najlepszy sposób na zmniejszenie przewlekłego bólu stawów odczuwanego przez ludzi. Badacz wybiera dwa różne rodzaje zabiegów, aby zmniejszyć poziom bólu. Te dwa rodzaje leczenia są znane jako „warunki”. Leczenie A to program masażu, a Leczenie B to program akupunktury. Oba zabiegi są podawane wszystkim pacjentom przez 8 tygodni.
Pacjenci są badani w trzech punktach czasowych - na początku programu, w środku programu i na końcu programu.
Badacz wybiera 30 pacjentów do wzięcia udziału w badaniu. Ale kiedy pierwszych 15 pacjentów przechodzi leczenie A, pozostałych 15 pacjentów przechodzi leczenie B i odwrotnie.
Pod koniec 8 tygodni badacz stosuje ANOVA z powtarzanymi dwukierunkowymi pomiarami, aby dowiedzieć się, czy występuje jakakolwiek zmiana w bólu w wyniku interakcji między rodzajem leczenia a momentem.
Założenia
Twoje dane powinny przejść pięć założeń, które są potrzebne do dwukrotnej ANOVA z powtarzanymi pomiarami, aby dać dokładny wynik.
- Zmienna zależna powinna być mierzona na poziomie ciągłym
- Twoje dwa czynniki tematyczne powinny składać się z co najmniej dwóch kategorycznie powiązanych grup
- Nie powinno być żadnych wartości odstających
- Zmienna zależna powinna być normalnie rozdzielona między każdą kombinację powiązanych grup
- Różnice między wszystkimi kombinacjami powiązanych grup powinny być równe
Parametryczny i nieparametryczny test ANOVA
Jeżeli informacja o populacji jest całkowicie znana za pomocą jej parametrów, wówczas przeprowadzony test statystyczny nazywa się testem parametrycznym.
Jeśli informacja o populacji lub parametrach nie jest znana, ale nadal jest wymagana do przetestowania hipotezy, wówczas nazywa się to testem nieparametrycznym.
Jeśli masz dane kategoryczne, nie możesz użyć metody ANOVA, musisz użyć testu Chi kwadrat, który dotyczy interakcji ANOVA.
Procedura testowania hipotez - ANOVA jednokierunkowa
- Sprawdź wszelkie niezbędne założenia i napisz hipotezę zerową i alternatywną
Aby wykonać ANOVA w jeden sposób, należy przyjąć pewne założenia. Założenia są następujące
- Każda próbka jest niezależną próbą losową
- Rozkład zmiennej odpowiedzi jest zgodny z rozkładem normalnym
- Wariancje populacji są równe we wszystkich odpowiedziach na poziomie grupy. Można to ustalić, dzieląc największe odchylenie standardowe próbki przez najmniejszy standard próbki i nie jest ono większe niż dwa, zakładając, że wariancje populacji są równe.
- Oblicz odpowiednią statystykę testu
Jeden ze sposobów ANOVA wykorzystuje statystyki testu F. Obliczenia ręczne wymagają wielu kroków do obliczenia współczynnika F, ale oprogramowanie statystyczne, takie jak SPSS, obliczy współczynnik F dla Ciebie i utworzy tabelę źródłową ANOVA.
Tabela ANOVA poda informacje o zmienności między grupami i wewnątrz grup. Tabela da ci całą formułę. Poniżej znajduje się przykład jednokierunkowej tabeli ANOVA
Źródło | SS | DF | Stwardnienie rozsiane | fa |
Zabiegi | SST | k-1 | SST / (k-1) | MST / MSE |
Błąd | SSE | Nk | SSE / (Nk) | |
Razem (poprawione) | SS | N-1 |
SST oznacza sumę kwadratów zabiegów, SSE oznacza sumę kwadratów błędów
DFT, który jest k-1, oznacza stopnie swobody leczenia, DFE, który jest Nk, oznacza stopnie swobody błędów.
- Określ wartość ap związaną ze statystyką testową
- Określ hipotezę zerową i alternatywną
Jeśli hipoteza zerowa jest fałszywa, MST powinno być większe niż MSE
- Podaj wniosek
Na podstawie swojego wyniku napisz wniosek zgodny z pytaniem badawczym anova.
Wiele testów porównawczych
Jeśli okaże się, że istnieje znacząca różnica między grupami, która nie jest związana z błędem próbkowania, konieczne jest przeprowadzenie kilku testów t w celu przetestowania średnich między grupami. Przeprowadzono kilka testów w celu kontroli poziomu błędu typu 1.
- Test Scheffe'a
- Zmodyfikowany test Bonferroniego
- Test Dunnette
- Test Tukeya
Obliczenia
Obliczenia ANOVA można wykonać na trzy sposoby - obliczenia ręczne, arkusz Excel i oprogramowanie SPSS. Pozwala poznać szczegółowo wszystkie obliczenia poniżej
-
Obliczenia ręczne ANOVA
- Krok 1
Oblicz CM
CM = (suma wszystkich obserwacji) 2 / N ogółem
- Krok 2
Oblicz całkowite SS
Total SS = Suma kwadratów wszystkich obserwacji - CM
- Krok 3
Oblicz SST (suma kwadratów do leczenia)
SST = ∑ 3 i = 1 T2i / n i - CM
- Krok 4
Oblicz SSE (suma kwadratów dla błędów)
SSE = SS (ogółem) - SST
- Krok 5
Oblicz MST, MSE i ich stosunek F
MST = SST / k-1
MSE = SSE / Nk
F = MST / MSE
-
ANOVA przy użyciu programu Excel
Aby wykonać ANOVA z jednym czynnikiem w programie Excel, wykonaj te proste kroki
- Przejdź do zakładki Dane
- Kliknij Analiza danych
- Wybierz Anova: Pojedynczy czynnik i kliknij OK (istnieją również inne opcje, takie jak Anova: dwa czynniki z replikacją i Anova: dwa czynniki bez replikacji)
- Kliknij pole Zakres wejściowy i wybierz zakres
- Kliknij pole Zakres wyjściowy, wybierz zakres wyjściowy i kliknij Ok
- Otrzymasz wynik wyświetlony w arkuszu programu Excel
- Jeśli F jest większy niż Fryt, hipoteza zerowa jest odrzucana
-
ANOVA przy użyciu SPSS
Najpierw pobierz oprogramowanie SPSS, aby wykonać ANOVA. Tutaj możemy zobaczyć, jak wykonać ANOVA jednokierunkową za pomocą SPSS
SPSS zawsze zakłada, że zmienna niezależna jest reprezentowana numerycznie. W przykładowym zestawie danych MAJOR jest ciągiem. Najpierw przekonwertuj zmienną łańcuchową na zmienną numeryczną. Po zakończeniu konwersji jesteś gotowy wykonać ANOVA
- Otwórz oprogramowanie SPSS
- Kliknij przycisk Analizuj à Porównaj środki à Jednokierunkowa ANOVA
- Jednokierunkowe okno dialogowe ANOVA pojawia się na ekranie
- Po lewej stronie okna dialogowego zobaczysz listę wszystkich zmiennych zależnych, które zostały zmierzone przez Ciebie. Przenieś go na listę Zależne po prawej stronie, używając przycisku strzałki w górę
- W ten sam sposób przenieś zmienną niezależną z listy po lewej stronie do pola Czynnik po prawej stronie.
- Kliknij przycisk Post Hoc, aby wybrać typ wielokrotnego porównania, który chcesz wykonać.
- Wybierz dowolny test post hoc, który pasuje do twoich badań, klikając pole wyboru obok testu
- Kliknij Kontynuuj, aby przejść do okna dialogowego ANOVA Jednokierunkowe
- Wybierz dowolne statystyki i kliknij pola wyboru po lewej stronie opcji, aby je wybrać
- Kliknij opcję Wykres działania, aby uzyskać wykres anowy średnich warunków
- Kliknij Kontynuuj i kliknij OK
Pojawi się okno wyjściowe SPSS z sześcioma głównymi sekcjami
- Sekcja opisowa
- Test jednorodności wariancji
- ANOVA
- Wiele porównań
- Średnią ocen
- Wykres
Rzeczy, które należy wziąć pod uwagę, uruchamiając ANOVA
Poziom danych i założenia odgrywają kluczową rolę w ANOVA.
Badacz powinien dowiedzieć się, czy dane są skrzyżowane czy zagnieżdżone. Jeśli dane zostaną przekroczone, wszystkie grupy otrzymają wszystkie aspekty.
Jeśli dane są zagnieżdżone, wówczas każda grupa otrzyma inną metodę ANOVA.
Ważniejsze jest obliczenie wielkości efektu anova. Wielkość efektu może powiedzieć, w jakim stopniu hipoteza zerowa jest fałszywa. Średni rozmiar efektu jest zawsze preferowany
Mam nadzieję, że ten artykuł zawiera krótkie omówienie analizy ANOVA i interpretacji wyników za jej pomocą.
Powiązane kursy: -
- ANOVA Korzystanie z programu Minitab
- Kurs R Studio Anova Techniques