Różnica między uczeniem maszynowym a analizą predykcyjną
Uczenie maszynowe to dziedzina informatyki, która w dzisiejszych czasach rośnie. Ostatnie postępy w technologiach sprzętowych, które doprowadziły do ogromnego wzrostu mocy obliczeniowej, takiej jak GPU (procesory graficzne) i postęp w sieciach neuronowych, uczenie maszynowe stało się modnym słowem. Zasadniczo, korzystając z technik uczenia maszynowego, możemy budować algorytmy do wydobywania danych i wyświetlania z nich ważnych ukrytych informacji. Analityka predykcyjna jest również częścią dziedziny uczenia maszynowego, która ogranicza się do przewidywania przyszłych wyników na podstawie danych opartych na poprzednich wzorcach. Chociaż analityka predykcyjna jest używana od ponad dwóch dekad głównie w sektorze bankowym i finansowym, zastosowanie uczenia maszynowego zyskało na znaczeniu w ostatnim czasie dzięki algorytmom takim jak wykrywanie obiektów na podstawie obrazów, klasyfikacja tekstu i systemy rekomendacji.
Nauczanie maszynowe
Uczenie maszynowe wewnętrznie wykorzystuje statystyki, matematykę i podstawy informatyki do budowania logiki dla algorytmów, które potrafią klasyfikować, przewidywać i optymalizować zarówno w czasie rzeczywistym, jak i w trybie wsadowym. Klasyfikacja i regresja to dwie główne klasy problemu związanego z uczeniem maszynowym. Przyjrzyjmy się szczegółowo zarówno uczeniu maszynowemu, jak i analizie predykcyjnej.
Klasyfikacja
W ramach tego segmentu problemu mamy tendencję do klasyfikowania obiektu na podstawie jego różnych właściwości do jednej lub więcej klas. Na przykład klasyfikacja klienta bankowego jako kwalifikującego się do kredytu mieszkaniowego lub nie w oparciu o jego historię kredytową. Zwykle dysponujemy danymi transakcyjnymi dla klienta, takimi jak jego wiek, dochód, wykształcenie, jego doświadczenie zawodowe, branża, w której pracuje, liczba osób na utrzymaniu, miesięczne wydatki, wcześniejsze pożyczki, jeśli takie istnieją, jego schemat wydatków, historia kredytowa itp. Na podstawie tych informacji obliczylibyśmy, czy powinien otrzymać pożyczkę, czy nie.
Istnieje wiele standardowych algorytmów uczenia maszynowego używanych do rozwiązania problemu klasyfikacji. Regresja logistyczna jest jedną z takich metod, prawdopodobnie najczęściej stosowaną i najbardziej znaną, również najstarszą. Oprócz tego mamy również jedne z najbardziej zaawansowanych i skomplikowanych modeli, od drzewa decyzyjnego po losowy las, AdaBoost, doładowanie XP, maszyny wektorów wsparcia, naiwny baize i sieć neuronową. Od ostatnich lat głębokie uczenie się jest najważniejsze. Zazwyczaj sieć neuronowa i głębokie uczenie się są wykorzystywane do klasyfikacji obrazów. Jeśli istnieje sto tysięcy zdjęć kotów i psów i chcesz napisać kod, który może automatycznie rozdzielać zdjęcia kotów i psów, możesz zdecydować się na metody głębokiego uczenia się, takie jak splotowa sieć neuronowa. Pochodnia, kawiarnia, czujnik przepływu itp. To niektóre z popularnych bibliotek w Pythonie do głębokiego uczenia się.
Aby zmierzyć dokładność modeli regresji, stosuje się takie wskaźniki, jak współczynnik fałszywie dodatni, współczynnik fałszywie ujemny, czułość itp.
Regresja
Regresja to kolejna klasa problemów w uczeniu maszynowym, w której próbujemy przewidzieć ciągłą wartość zmiennej zamiast klasy, w przeciwieństwie do problemów z klasyfikacją. Techniki regresji są zwykle stosowane do przewidywania ceny akcji, ceny sprzedaży domu lub samochodu, popytu na określony przedmiot itp. Gdy w grę wchodzą również właściwości szeregów czasowych, problemy z regresją stają się bardzo interesujące do rozwiązania. Regresja liniowa ze zwykłym najmniejszym kwadratem jest jednym z klasycznych algorytmów uczenia maszynowego w tej dziedzinie. Dla wzorca opartego na szeregach czasowych stosuje się ARIMA, wykładniczą średnią ruchomą, ważoną średnią ruchomą i prostą średnią ruchomą.
Aby zmierzyć dokładność modeli regresji, stosuje się mierniki takie jak średni błąd kwadratowy, bezwzględny średni błąd kwadratowy, błąd pierwiastkowy kwadratowy itp.
Analityka predykcyjna
Istnieje kilka obszarów nakładających się między uczeniem maszynowym a analizą predykcyjną. Podczas gdy popularne techniki, takie jak logistyka i regresja liniowa, podlegają zarówno uczeniu maszynowemu, jak i analizom predykcyjnym, zaawansowane algorytmy, takie jak drzewo decyzyjne, losowy las itp., Są zasadniczo uczeniem maszynowym. Zgodnie z analizą predykcyjną cel problemów pozostaje bardzo wąski, gdy celem jest obliczenie wartości określonej zmiennej w przyszłym momencie. Analityka predykcyjna jest mocno obciążona statystykami, podczas gdy uczenie maszynowe jest raczej połączeniem statystyki, programowania i matematyki. Typowy analityk predykcyjny spędza czas obliczając t-kwadrat, statystyki f, Innova, chi-kwadrat lub zwykły najmniejszy kwadrat. Pytania takie jak to, czy dane są normalnie dystrybuowane, czy wypaczane, czy należy zastosować rozkład t studenta lub krzywą dzwonkową, czy należy przyjmować wartość alfa przy 5% lub 10% błąd cały czas. Szukają diabła w szczegółach. Inżynier uczący się maszyn nie przejmuje się wieloma z tych problemów. Ból głowy jest zupełnie inny, utknęli na poprawie dokładności, minimalizacji fałszywie dodatnich częstości, obsłudze wartości odstających, normalizacji zakresu lub walidacji k-krotności.
Analityk predykcyjny korzysta głównie z narzędzi takich jak Excel. Scenariusz lub dążenie do celu są ich ulubionymi. Czasami używają VBA lub micros i prawie nie piszą długiego kodu. Inżynier uczący się maszynowo poświęca cały swój czas na pisanie skomplikowanego kodu, który nie jest do końca znany, używa narzędzi takich jak R, Python, Saas. Programowanie to ich główna praca, codzienne rutynowe usuwanie błędów i testowanie różnych krajobrazów.
Różnice te wnoszą także zasadniczą różnicę w popycie i wynagrodzeniu. Podczas gdy analitycy predykcyjni są tak wczoraj, uczenie maszynowe to przyszłość. Typowy inżynier uczenia maszynowego lub badacz danych (jak to się obecnie nazywa) otrzymują 60-80% więcej niż typowy inżynier oprogramowania lub analityk predykcyjny w tym zakresie i są oni kluczowym motorem we współczesnym świecie z technologią. Uber, Amazon, a teraz samochody samojezdne są również możliwe tylko z ich powodu.
Bezpośrednie porównanie między uczeniem maszynowym a analizą predykcyjną (infografiki)
Poniżej znajduje się 7 najlepszych porównań między uczeniem maszynowym a analizą predykcyjną
Uczenie maszynowe a tabela porównawcza analizy predykcyjnej
Poniżej znajduje się szczegółowe wyjaśnienie uczenia maszynowego a analizy predykcyjnej
Nauczanie maszynowe | Analityka predykcyjna |
Jest to ogólny termin obejmujący różne podpola, w tym analizy predykcyjne. | Może być traktowany jako podpola uczenia maszynowego. |
Mocno zorientowany na kodowanie. | Przeważnie zorientowany na oprogramowanie, w którym użytkownik nie musi dużo kodować |
Uważa się, że jest generowany z informatyki, tzn. Informatykę można tutaj traktować jako rodzic. | Statystyka może być tutaj traktowana jako rodzic. |
To technologia jutra. | Tak jest wczoraj. |
Jest to maszyna zdominowana przez wiele technik, które są trudne do zrozumienia, ale działają jak urok jak głębokie uczenie się. | Jest zdominowany przez użytkownika za pomocą technik, które muszą być intuicyjne, aby użytkownik mógł je zrozumieć i wdrożyć. |
Wykorzystywane są narzędzia takie jak R, Python, SaaS. | Używane są Excel, SPSS, Minitab. |
Jest bardzo szeroki i stale się rozwija. | Ma bardzo ograniczony zakres i zastosowanie. |
Wniosek - uczenie maszynowe a analiza predykcyjna
Z powyższej dyskusji zarówno na temat uczenia maszynowego, jak i analizy predykcyjnej, jasno wynika, że analiza predykcyjna jest w zasadzie sub-dziedziną uczenia maszynowego. Uczenie maszynowe jest bardziej wszechstronne i jest w stanie rozwiązać szeroki zakres problemów.
Polecany artykuł
Jest to przewodnik po uczeniu maszynowym a analizie predykcyjnej, ich znaczeniu, porównaniu bezpośrednim, kluczowych różnicach, tabeli porównawczej i wnioskach. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -
- Dowiedz się Big Data vs. Machine Learning
- Różnica między nauką o danych a uczeniem maszynowym
- Porównanie analizy predykcyjnej z nauką o danych
- Analiza danych a analiza predykcyjna - która z nich jest przydatna