Regresja wielowymiarowa - Przykłady regresji wielowymiarowej

Spisie treści:

Anonim

Wprowadzenie do regresji wielowymiarowej

  • Termin wielowymiarowy oznacza model z więcej niż jedną zmienną
  • Regresja wielowymiarowa jest częścią statystyki wielowymiarowej.
  • Regresja wielowymiarowa jest techniką stosowaną do oszacowania modelu pojedynczej regresji, gdy istnieje więcej niż jedna zmienna wyniku.
  • W regresji wielowymiarowej często stosowano algorytm uczenia maszynowego, który jest algorytmem uczenia nadzorowanego.

Dlaczego model pojedynczej regresji nie będzie działał?

  • Jak wiadomo, analiza regresji służy głównie do badania zależności między zmienną zależną i niezależną.
  • W świecie rzeczywistym istnieje wiele sytuacji, w których wiele zmiennych niezależnych ma wpływ na inne zmienne, dlatego musimy przejść do innych opcji niż jeden model regresji, który może przyjąć tylko jedną zmienną niezależną.

Co to jest regresja wielowymiarowa?

  • Regresja wielowymiarowa pomaga w pomiarze kąta więcej niż jednej zmiennej niezależnej i więcej niż jednej zmiennej zależnej. Znajduje relację między zmiennymi (liniowo powiązane).
  • Służył do przewidywania zachowania zmiennej wynikowej i powiązania zmiennych predykcyjnych oraz zmian zmiennych predykcyjnych.
  • Może być stosowany w wielu praktycznych dziedzinach, takich jak polityka, ekonomia, medycyna, prace badawcze i wiele różnych rodzajów przedsiębiorstw.
  • Regresja wielowymiarowa jest prostym rozszerzeniem regresji wielokrotnej.
  • Regresja wielokrotna służy do przewidywania i wymiany wartości jednej zmiennej na podstawie zbiorczej wartości więcej niż jednej wartości zmiennych predykcyjnych.
  • Najpierw weźmiemy przykład, aby zrozumieć zastosowanie regresji wielowymiarowej, a następnie szukamy rozwiązania tego problemu.

Przykłady regresji wielowymiarowej

  • Jeśli firma e-commerce zebrała dane swoich klientów, takie jak wiek, kupiona historia klienta, płeć i firma chcą znaleźć związek między tymi różnymi osobami zależnymi i zmiennymi niezależnymi.
  • Trener siłowni zebrał dane swojego klienta, który przychodzi na jego siłownię i chce obserwować pewne rzeczy klienta, które są zdrowie, nawyki żywieniowe (jakiego rodzaju klient konsumuje co tydzień), wagę klienta. To chce znaleźć związek między tymi zmiennymi.

Jak widzieliśmy w powyższych dwóch przykładach, w obu sytuacjach istnieje więcej niż jedna zmienna, niektóre są zależne, a niektóre niezależne, więc pojedyncza regresja nie wystarczy do analizy tego rodzaju danych.

Oto regresja wielowymiarowa, która pojawia się na zdjęciu.

1. Wybór funkcji -

Wybór funkcji odgrywa najważniejszą rolę w regresji wielowymiarowej.

Znalezienie funkcji potrzebnej do znalezienia zmiennej zależnej od tej funkcji.

2. Funkcje normalizujące -

Aby uzyskać lepszą analizę, należy skalować funkcje, aby umieścić je w określonym zakresie. Możemy również zmienić wartość każdej funkcji.

3. Wybierz funkcję straty i hipotezę -

Funkcja straty oblicza stratę, gdy hipoteza przewiduje złą wartość.

A hipoteza oznacza przewidywaną wartość ze zmiennej cechy.

4. Ustaw parametry hipotezy -

Ustaw parametr hipotezy, który może zmniejszyć funkcję utraty i może przewidzieć.

5. Zminimalizuj funkcję utraty

Minimalizowanie strat przy użyciu algorytmu minimalizacji strat i użycie go w zbiorze danych, który może pomóc w dostosowaniu parametrów hipotezy. Po zminimalizowaniu straty można ją wykorzystać do prognozowania.

Istnieje wiele algorytmów, które można wykorzystać do zmniejszenia strat, takich jak opadanie gradientu.

6. Sprawdź funkcję hipotezy -

Sprawdź funkcję hipotezy, jak poprawnie prognozuje wartości, przetestuj ją na danych testowych.

Kroki, które należy wykonać w przypadku archiwizacji Regresja wielowymiarowa

1) Zaimportuj niezbędne wspólne biblioteki, takie jak numpy, pandy

2) Przeczytaj zestaw danych za pomocą biblioteki pand

3) Jak już wspomniano powyżej, musimy znormalizować dane, aby uzyskać lepsze wyniki. Po co normalizacja, ponieważ każda funkcja ma inny zakres wartości.

4) Utwórz model, który może archiwizować regresję, jeśli używasz równania regresji liniowej

Y = mx + c

W którym x otrzymuje dane wejściowe, m jest linią nachylenia, c jest stałą, y jest zmienną wyjściową.

5) Wytrenuj model, używając hiperparametru. Zapoznaj się z hiperparametrem ustaw go zgodnie z modelem. Takich jak tempo uczenia się, epoki, iteracje.

6) Jak omówiono powyżej, jak hipoteza odgrywa ważną rolę w analizie, sprawdza hipotezę i mierzy funkcję straty / kosztu.

7) Funkcja straty / kosztu pomoże nam zmierzyć, jak wartość hipotezy jest prawdziwa i dokładna.

8) Minimalizacja funkcji straty / kosztu pomoże modelowi poprawić przewidywanie.

9) Równanie strat można zdefiniować jako sumę kwadratowej różnicy między wartością przewidywaną a wartością rzeczywistą podzieloną przez dwukrotność wielkości zbioru danych.

10) Aby zminimalizować opadanie gradientu za pomocą funkcji utraty / kosztu, zaczyna się od wartości losowej i znajduje punkt, w którym funkcja straty jest najmniejsza.

Postępując zgodnie z powyższym, możemy wdrożyć regresję wielowymiarową

Zalety regresji wielowymiarowej

  • Technika wielowymiarowa pozwala znaleźć związek między zmiennymi lub cechami
  • Pomaga znaleźć korelację między zmiennymi niezależnymi i zależnymi.

Zalety regresji wielowymiarowej

  • Techniki wielowymiarowe są nieco złożonymi i wysokopoziomowymi obliczeniami matematycznymi
  • Dane wyjściowe modelu regresji wielowymiarowej nie są łatwe do interpretacji, a czasem dlatego, że niektóre dane wyjściowe strat i błędów nie są identyczne.
  • Nie można go zastosować do małego zestawu danych, ponieważ wyniki są prostsze w większych zestawach danych.

Wniosek - regresja wielowymiarowa

  • Głównym celem zastosowania regresji wielowymiarowej jest, gdy dostępna jest więcej niż jedna zmienna, aw takim przypadku pojedyncza regresja liniowa nie będzie działać.
  • Głównie świat rzeczywisty ma wiele zmiennych lub cech, gdy stosuje się wiele zmiennych / cech, które są używane do regresji wielowymiarowej.

Polecane artykuły

Jest to przewodnik po regresji wielowymiarowej. Tutaj omawiamy wprowadzenie, przykłady regresji wielowymiarowej wraz z zaletami i wadami. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Formuła regresji
  2. Kurs Data Science w Londynie
  3. Operatorzy SAS
  4. Techniki nauki danych
  5. Zmienne w JavaScript
  6. Najważniejsze różnice w regresji a klasyfikacja