Wprowadzenie do regresji wielomianowej

Regresję definiuje się jako metodę znajdowania zależności między zmiennymi niezależnymi i zależnymi w celu przewidywania wyniku. Pierwszy model regresji wielomianowej został użyty w 1815 r. Przez Gergonne. Służy do znalezienia linii najlepszego dopasowania za pomocą linii regresji do przewidywania wyników. Istnieje wiele rodzajów technik regresji, regresja wielomianowa jest jedną z nich. Przed zrozumieniem tego wskazane jest posiadanie odpowiedniej wiedzy na temat regresji liniowej, dzięki czemu łatwo będzie zaznaczyć różnice między nimi.

Dlaczego regresja wielomianowa?

  • Jest to jedna z technik regresji stosowana przez profesjonalistów do przewidywania wyniku. Jest zdefiniowany jako związek między zmiennymi niezależnymi i zależnymi, gdy zmienna zależna jest powiązana ze zmienną niezależną mającą n-ty stopień. Nie wymaga, aby związek między zmiennymi zależnymi i niezależnymi był liniowy, więc jeśli linia jest krzywą, może mieć dowolny składnik wielomianowy.
  • Główną różnicą między regresją liniową i wielomianową jest to, że regresja liniowa wymaga, aby zmienne zależne i niezależne były liniowo powiązane, podczas gdy może to lepiej pasować do linii, jeśli uwzględnimy w równaniu większy stopień względem zmiennej zmiennej niezależnej. Równanie regresji wielomianowej o n-tym stopniu można zapisać jako:

Y = b0 + a1x + a2x 2 + a3x 3 +… anx n

  • Jeśli dodamy wyższe stopnie, takie jak kwadratowe, wówczas zamienia linię w krzywą, która lepiej pasuje do danych. Zasadniczo jest on stosowany, gdy punkty w zestawie danych są rozproszone, a model liniowy nie jest w stanie jasno opisać wyniku. Zawsze powinniśmy mieć oko na przeregulowanie i niedopasowanie, biorąc pod uwagę te stopnie do równania.
  • Lepiej jest wziąć pod uwagę stopień, który przechodzi przez wszystkie punkty danych, ale czasami przyjęcie wyższego stopnia, takiego jak 10 lub 20, może przejść przez wszystkie punkty danych i zmniejszyć błąd, ale także wychwytuje szum danych, który przekracza model i można tego uniknąć, dodając więcej próbek do zestawu danych treningowych. Dlatego zawsze zaleca się wybór optymalnego stopnia do modelu.

Istnieją dwie techniki decydujące o stopniu równania:

  • Wybór do przodu: Jest to metoda zwiększania stopnia, aż będzie wystarczająco znacząca, aby zdefiniować model.
  • Selekcja wstecz: Jest to metoda zmniejszania stopnia, aż będzie wystarczająco znacząca, aby zdefiniować model.

Procedura stosowania regresji wielomianowej

Poniżej znajdują się kroki lub procedura zastosowania regresji wielomianowej do dowolnego zestawu danych:

Krok 1: Zaimportuj odpowiedni zestaw danych na dowolną platformę (R lub Python) i zainstaluj wymagane pakiety wymagane do zastosowania modelu.

Krok 2: Podziel zestaw danych na zestawy szkoleniowe i testowe, abyśmy mogli zastosować algorytm do zestawu danych szkoleniowych i przetestować go przy użyciu zestawu danych testowych.

Krok 3: Zastosuj metody analizy danych eksploracyjnych, aby zbadać tło danych, takie jak średnia, mediana, tryb, pierwszy kwartyl, drugi kwartyl itp.

Krok 4: Zastosuj algorytm regresji liniowej do zestawu danych i przestudiuj model.

Krok 5: Zastosuj algorytm regresji wielomianowej do zbioru danych i przestudiuj model, aby porównać wyniki RMSE lub R kwadrat między regresją liniową a regresją wielomianową.

Krok 6: Wizualizuj i przewiduj wyniki regresji liniowej i wielomianowej oraz określ, który model przewiduje zbiór danych z lepszymi wynikami.

Zastosowania regresji wielomianowej

  • Jest wykorzystywany w wielu procedurach eksperymentalnych do uzyskania wyniku przy użyciu tego równania.
  • Zapewnia doskonale zdefiniowany związek między zmiennymi niezależnymi i zależnymi.
  • Służy do badania izotopów osadów.
  • Służy do badania wzrostu różnych chorób w dowolnej populacji.
  • Służy do badania generacji dowolnej syntezy.

Cechy regresji wielomianowej

  • Jest to rodzaj metody regresji nieliniowej, która mówi nam o związku między zmienną niezależną i zależną, gdy zmienna zależna jest powiązana ze zmienną niezależną n-tego stopnia.
  • O najlepszej linii dopasowania decyduje stopień równania regresji wielomianowej.
  • Na model wyprowadzony z regresji wielomianowej wpływają wartości odstające, dlatego zawsze lepiej jest traktować wartości odstające przed zastosowaniem algorytmu do zestawu danych.
  • Funkcja Polynomialfeature () przekształca się w cechę macierzy w zależności od stopnia równania.
  • Charakter krzywej można badać lub wizualizować za pomocą prostego wykresu rozrzutu, który da ci lepsze pojęcie o liniowości zależności między zmiennymi i odpowiednio podejmie decyzję.

Wniosek

Regresja wielomianowa jest stosowana w wielu organizacjach, gdy identyfikują nieliniowy związek między zmiennymi niezależnymi i zależnymi. Jest to jedna z trudnych technik regresji w porównaniu z innymi metodami regresji, więc posiadanie dogłębnej wiedzy na temat podejścia i algorytmu pomoże osiągnąć lepsze wyniki.

Polecane artykuły

Jest to przewodnik po regresji wielomianowej. Tutaj omawiamy Funkcje i zastosowania Regresji Wielomianowej. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -

  1. Algorytm SVM
  2. Metody jądra
  3. Funkcja REGLINP Excel
  4. Algorytmy uczenia maszynowego
  5. Regresja liniowa a regresja logistyczna | Najważniejsze różnice

Kategoria: