ANOVA dwukierunkowa w R - Dwukierunkowy test ANOVA w R Łatwy przewodnik - Przykłady

Spisie treści:

Anonim

Przegląd dwukierunkowej ANOVA w R.

Dwukierunkowa ANOVA (Analiza wariancji) pomaga nam zrozumieć związek między jedną ciągłą zmienną zależną a dwiema kategorycznie zmiennymi niezależnymi. W tym temacie dowiemy się o Two Way ANOVA w R.

Poniżej znajduje się hipoteza zainteresowania w ramach dwukierunkowej ANOVA

  1. H₀: Nazwij to głównym efektem, który jest pierwszym czynnikiem zależnym od zmiennej ciągłej
  2. H₀: efekt główny dotyczy również wpływu na drugą zmienną na zależną zmienną ciągłą.
  3. H₀: Interakcja jest połączonym efektem obu zmiennych pierwszego, drugiego czynnika na zmienną zależną

Poniżej znajdują się normy, które musi spełniać dwukierunkowa ANOVA.

  1. Obserwacje muszą być niezależne
  2. Obserwacje powinny być normalnie rozpowszechniane.
  3. Obserwacje powinny mieć jednakową wariancję
  4. Brak odstających wartości w projekcie
  5. Błędy powinny być niezależne.

Uwaga

Musimy przekształcić nasze dane, jeśli naruszona zostanie normalność i równa wariancja.

Przykład dwukierunkowej ANOVA w R.

Wykonajmy jednokierunkowy test ANOVA na zestawie danych o poziomach raka, który zawiera 48 wierszy i 3 zmienne danych:

Czas potrzebny na przeżycie: czas przeżycia zwierzęcia

Różne poziomy raka 1 - 3

Leczenie: Zabiegi stosowane od 1-3

Przed przetestowaniem potrzebujemy następujących danych.

  • Importowanie danych
  • Usuń niepotrzebną zmienną
  • Konwertuj zmienne (poziomy raka) na poziom uporządkowany.

Poniżej znajduje się zestaw danych.

Obserwacje: 48

Zmienne: 3

czas przeżycia 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…

poziomy raka 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…

Leczenie A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …

Cele

  1. H₀: brak zmiany średniego czasu przeżycia między grupami
  2. H₀: czas przeżycia jest różny dla co najmniej jednej grupy.

Kroki

  • Sprawdź poziomy raka. Widzimy trzy wartości znaków, ponieważ przekształcamy je w czynniki za pomocą zmutowanego czasownika.

levels(df$cancerlevels)
output: (1) "1" "2" "3"

  • Oblicz zarówno średnią, jak i odchylenie standardowe

df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)

Wynik:

Tibble: 3 x 4

Rak Poziomy Count_Cancerlevels Mean_time sd_time

1 1 16 0, 617500 0, 20942779

2 2 16 0, 544375 0, 28936641

3 3 16 0, 276250 0, 06227627

  • W kroku trzecim możesz graficznie sprawdzić, czy istnieje różnica między rozkładami. Pamiętaj, że dołączasz roztrzęsioną kropkę.
  • Uruchom test za pomocą polecenia AOV.

aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used

Składnia:

y ~ X1 + X2 +… + Xn (X1 + X2 +… odnosi się do zmiennych niezależnych)

y ~. Użyj wszystkich pozostałych zmiennych jako zmiennych niezależnych

Pamiętaj, aby zapisać model i wydrukować podsumowanie.

Kod

  • aov (czas ~ poziomy raka, dane = df): Uruchom test ANOVA z następującą formułą
  • podsumowanie (anova_one_way): wydrukuj podsumowanie testu

Df Sum Sq Średnia wartość Sq F Pr (> F)

Poziomy raka 2 1, 033 0, 5165 11, 79 7, 66e-05 ***

Pozostałości 45 1, 972 0, 0438

-

Signif. kody: 0 „***” 0, 001 ”**„ 0, 01 ”*„ 0, 05 ”.” 0, 1 '' 1

Wartość p jest niższa niż próg 0, 05. Różnica statystyczna oznaczona jest „*” w powyższym przypadku.

Test w jedną stronę do dwukierunkowej Anova w R.

Zobaczmy, jak test jednostronny można rozszerzyć na dwukierunkową ANOVA. Test jest podobny do jednostronnej analizy wariancji ANOVA, ale formuła różni się i dodaje do formuły kolejną zmienną grupy.

y = x1 + x2

  • H0 : Średnie są równe dla obu zmiennych (zmienne czynnikowe)
  • H3 : Średnie są różne dla obu zmiennych

Dodajesz zmienne Treat do naszego modelu. Ta zmienna wskazuje leczenie podane pacjentowi. Jesteś zainteresowany, aby sprawdzić, czy istnieje statystyczna zależność między poziomem raka a leczeniem udzielonym pacjentowi.

Dostosowujemy nasz kod, dodając traktat z inną niezależną zmienną.

Df Sum Sq Średnia wartość Sq F Pr (> F)

Poziomy raka 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***

Treat 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***

Pozostałości 42 1, 0509 0, 0250

Zarówno poziomy raka, jak i leczenie różnią się statystycznie od 0. Dzięki temu możemy odrzucić hipotezę NULL. Potwierdź również, że zmiana leczenia lub rodzaju raka wpływa na czas przeżycia.

Test

ANOVA jednokierunkowa: H3 - średnia jest różna dla co najmniej jednej grupy

Dwukierunkowa ANOVA: H3- Średnia jest różna dla obu grup.

Różnica między jednokierunkową a dwukierunkową ANOVA

Różnice między ANOVA jednokierunkową a ANOVA dwukierunkową

ANOVA w jedną stronęDwukierunkowa ANOVA
Zaprojektowany, aby umożliwić testowanie równości między 3 lub więcej środkamiZaprojektowany do oceny wzajemnych zależności dwóch zmiennych niezależnych od zmiennej zależnej.
Obejmuje jedną zmienną niezależnąObejmuje dwie niezależne zmienne
Analizowane w 3 lub więcej kategorycznych grupach.Porównuje wiele grup dwóch czynników
Musi spełniać dwie zasady - replikacja i randomizacjaMusi spełniać trzy zasady, którymi są replikacja, randomizacja i kontrola lokalna.

Zalety dwukierunkowej ANOVA

  • W powyższym przykładzie wiek i płeć w naszym przykładzie - pomaga zmniejszyć zmienność błędów, dzięki czemu projekt jest bardziej wydajny.
  • Dwukierunkowa ANOVA umożliwia nam testowanie działania dwóch czynników jednocześnie.

Zastosowania ANOVA

  1. Porównywanie przebiegu różnych pojazdów, paliw i rodzajów dróg.
  2. Poznanie wpływu temperatury, ciśnienia lub stężenia chemicznego na niektóre reakcje chemiczne (reaktory energetyczne, zakłady chemiczne itp.)
  3. Wpływ różnych katalizatorów na szybkość reakcji chemicznej
  4. Zrozumienie wpływu reklam i różnej liczby odpowiedzi klientów.
  5. Wpływ wydajności, jakości i szybkości produkcji w biologii (proces oparty na liczbie komórek, na które dzielą się)

Polecane artykuły

Jest to przewodnik po ANOVA Two Way w R. Tutaj omawiamy przykłady, cele, kroki i różnice między ANOVA One Way i dwukierunkowym. Możesz także zapoznać się z następującymi artykułami, aby dowiedzieć się więcej -

  1. ANOVA w R.
  2. Jak interpretować wyniki za pomocą testu ANOVA
  3. Regresja vs ANOVA
  4. GLM w R.