Różnice między uczeniem nadzorowanym a uczeniem głębokim
W uczeniu nadzorowanym dane szkoleniowe podawane do algorytmu zawierają pożądane rozwiązania, zwane etykietami. Typowym nadzorowanym zadaniem uczenia się jest klasyfikacja. Filtr spamu jest dobrym tego przykładem: jest szkolony z wieloma przykładowymi wiadomościami e-mail wraz z ich klasą (spam lub szynka) i musi nauczyć się, jak klasyfikować nowe wiadomości e-mail.
Głębokie uczenie się jest próbą naśladowania aktywności w warstwach neuronów w korze nowej, która stanowi około 80% mózgu, w którym występuje myślenie (w ludzkim mózgu jest około 100 miliardów neuronów i 100 ~ 1000 bilionów synaps). Nazywa się to głębokim, ponieważ ma więcej niż jedną ukrytą warstwę neuronów, które pomagają uzyskać wiele stanów nieliniowej transformacji cech
Bezpośrednie porównanie nadzorowanego uczenia się z głębokim uczeniem się (infografiki)
Poniżej znajduje się porównanie 5 najlepszych między nadzorowanym uczeniem się a głębokim uczeniem się
Kluczowe różnice między uczeniem nadzorowanym a uczeniem głębokim
Zarówno nauka nadzorowana, jak i nauka głęboka są popularnymi wyborami na rynku; omówmy niektóre z głównych różnic między uczeniem nadzorowanym a uczeniem głębokim:
● Główne modele -
Ważne nadzorowane modele to:
○ k-Najbliżsi sąsiedzi - Używany do klasyfikacji i regresji
○ Regresja liniowa - do prognozowania / regresji
Ression Regresja logistyczna - do klasyfikacji
○ Obsługa maszyn wektorowych (SVM) - służy do klasyfikacji i regresji
Trees Drzewa decyzyjne i losowe lasy - zarówno zadania klasyfikacji, jak i regresji
Najpopularniejsze głębokie sieci neuronowe:
● Perceptrony wielowarstwowe (MLP) - najbardziej podstawowy typ. Sieć ta jest zasadniczo początkową fazą budowy innej, bardziej zaawansowanej sieci głębokiej i może być wykorzystywana do wszelkich nadzorowanych problemów z regresją lub klasyfikacją
● Autoencodery (AE) - sieć ma algorytmy uczenia bez nadzoru do uczenia się funkcji, zmniejszania wymiarów i wykrywania wartości odstających
● Convolution Neural Network (CNN) - szczególnie nadaje się do danych przestrzennych, rozpoznawania obiektów i analizy obrazów z wykorzystaniem wielowymiarowych struktur neuronów. Jednym z głównych powodów popularności ostatnio głębokiego uczenia się są CNN.
● Recurrent Neural Network (RNN) - RNN są używane do sekwencjonowanej analizy danych, takich jak szeregi czasowe, analiza nastrojów, NLP, tłumaczenie języka, rozpoznawanie mowy, podpisywanie obrazów. Jednym z najczęstszych typów modeli RNN jest sieć Long Short-Term Memory (LSTM).
● Dane szkoleniowe - jak wspomniano wcześniej, nadzorowane modele potrzebują danych szkoleniowych z etykietami. Głębokie uczenie się może obsługiwać dane z etykietami lub bez. Niektóre architektury sieci neuronowych mogą być bez nadzoru, takie jak autokodery i ograniczone maszyny Boltzmanna
● Wybór funkcji - niektóre nadzorowane modele są w stanie analizować funkcje i wybrany podzbiór funkcji w celu ustalenia celu. Ale przez większość czasu musi to być obsługiwane na etapie przygotowania danych. Ale w Deep Neural Networks pojawiają się nowe funkcje, a niepożądane funkcje są odrzucane w miarę postępu nauki.
● Reprezentacja danych - W klasycznych modelach nadzorowanych abstrakcja wysokiego poziomu funkcji wejściowych nie jest tworzona. Ostateczny model próbujący przewidzieć dane wyjściowe poprzez zastosowanie przekształceń matematycznych w podzbiorze cech wejściowych.
Ale w głębokich sieciach neuronowych abstrakcje cech wejściowych są tworzone wewnętrznie. Na przykład podczas tłumaczenia tekstu sieć neuronowa najpierw konwertuje tekst wejściowy na kodowanie wewnętrzne, a następnie przekształca tę abstrakcyjną reprezentację na język docelowy.
● Framework - Modele ML nadzorowane są obsługiwane przez wiele ogólnych ram ML w różnych językach - niektóre z nich to Apache Mahout, Scikit Learn, Spark ML.
Większość platform do głębokiego uczenia zapewnia abstrakcję przyjazną dla programistów, aby łatwo utworzyć sieć, zająć się dystrybucją obliczeń i ma wsparcie dla procesorów graficznych. Popularne są frameworki: Caffe, Caffe2, Theano, Torch, Keras, CNTK, TensorFlow. teraz z aktywnym wsparciem społeczności.
Tabela nadzorowana w porównaniu do uczenia głębokiego
Poniżej znajduje się kluczowe porównanie między uczeniem nadzorowanym a uczeniem głębokim
Podstawa porównania między uczeniem nadzorowanym a uczeniem głębokim | Nadzorowana nauka | Głęboka nauka |
Szkolenie modelowe | Główne zadania w szkoleniu -
| Główne zadania w szkoleniu -
|
Potencjał systemu | Służy do rozwiązywania stosunkowo prostych zadań, w których związek z cechami wejściowymi i celem jest wykrywalny przez człowieka, a inżynieria cech jest bezpośrednia. Np .:
| Głębokie uczenie się może wykonywać naprawdę inteligentne zadania, takie jak
|
Elastyczność | Modele są bardziej elastyczne, co pozwala łatwo dostroić model ML. Istnieją dobrze zdefiniowane metody, takie jak wyszukiwanie siatki z walidacją krzyżową w celu znalezienia odpowiednich hiperparametrów | Mniej elastyczny, ponieważ istnieje wiele hiperparametrów do dostosowania, takich jak liczba warstw, liczba neuronów na warstwę, rodzaj funkcji aktywacji do użycia w każdej warstwie, logika inicjalizacji masy i wiele innych. |
Reprezentacja funkcji | Funkcje pochodne lub abstrakcyjne, które należy utworzyć jawnie. Na przykład cechy wielomianowe jako dane wejściowe dla modelu regresji liniowej | Abstrakcyjna reprezentacja danych generowana automatycznie w ukrytych warstwach. Dlatego wyszkolona sieć neuronowa CNN może wykryć kota na obrazie. |
Modele generatywne | Nie można wygenerować niczego oryginalnego, ponieważ nie ma automatycznej reprezentacji danych abstrakcyjnych | Po przeszkoleniu określony rodzaj głębokiej sieci neuronowej może generować powiedz nowe obrazy, piosenki lub teksty. Są to tak zwane GNN (Generative Neural Network) lub GAN (Generative Adversarial Networks)
Niektóre wdrożenia tego typu sieci są wykorzystywane do tworzenia nawet nowych projektów mody |
Wniosek - uczenie nadzorowane a uczenie głębokie
Dokładność i możliwości DNN (Deep Neural Network) znacznie wzrosły w ciągu ostatnich kilku lat. Właśnie dlatego DNN są obecnie obszarem aktywnych badań i, naszym zdaniem, ma potencjał do opracowania Ogólnego Inteligentnego Systemu. Jednocześnie trudno jest zrozumieć, dlaczego DNN daje określoną moc wyjściową, co bardzo utrudnia dostrojenie sieci. Jeśli więc problem można rozwiązać za pomocą prostych modeli ML, zdecydowanie zaleca się jego użycie. Z tego powodu prosta regresja liniowa będzie miała znaczenie, nawet jeśli ogólny inteligentny system zostanie opracowany przy użyciu DNN.
Polecany artykuł
Jest to przewodnik po najważniejszych różnicach między nauczaniem nadzorowanym a uczeniem głębokim. W tym miejscu omawiamy również kluczowe różnice między uczeniem się nadzorowanym a uczeniem się głębokim za pomocą infografiki i tabeli porównawczej. Możesz także zapoznać się z następującymi artykułami -
- Uczenie nadzorowane a uczenie się wzmacniające
- Uczenie nadzorowane a uczenie się bez nadzoru
- Sieci neuronowe a głębokie uczenie się
- Uczenie maszynowe a analiza predykcyjna
- TensorFlow vs Caffe: jakie są różnice
- Co to jest nauka nadzorowana?
- Co to jest nauka zbrojenia?
- Top 6 porównań między CNN a RNN