Wprowadzenie do rodzajów algorytmów uczenia maszynowego

Typy algorytmów uczenia maszynowego lub obliczenia AI to programy (matematyczne i racjonalne), które modyfikują się, by osiągać lepsze wyniki, gdy są przedstawiane większej ilości informacji. „Dostosowanie” części sztucznej inteligencji oznacza, że ​​projekty te zmieniają sposób przetwarzania informacji po pewnym czasie, podobnie jak ludzie zmieniają sposób przetwarzania informacji przez naukę. Tak więc uczenie maszynowe lub obliczanie AI to program ze szczególną metodą zmiany własnych parametrów, skrytykowany w związku z oczekiwaniami dotyczącymi zestawu danych w przeszłości.

Wszystkie rodzaje algorytmów uczenia maszynowego

Ich różnorodne sposoby charakteryzowania rodzajów typów algorytmów uczenia maszynowego, ale zwykle można je podzielić na klasy zgodnie z ich motywacją, a podstawowe klasyfikacje są następujące:

  1. Nadzorowana nauka
  2. Uczenie się bez nadzoru
  3. Nauka częściowo nadzorowana
  4. Nauka wzmocnienia

Co to jest nauka nadzorowana

Uczenie nadzorowane to takie, w którym można rozważyć nauczanie prowadzone przez instruktora. Mamy zestaw danych, który zajmuje się edukacją, a jego zadaniem jest przygotowanie modelu lub maszyny. Kiedy model się przygotowuje, może rozpocząć ustalanie na podstawie oczekiwań lub wyboru, gdy zostaną mu przekazane nowe informacje.

Przykład nadzorowanego uczenia się:

  1. Dostajesz dużo zdjęć z danymi na temat tego, co jest na nich, a następnie trenujesz model, aby postrzegać nowe zdjęcia.
  2. Masz dużo danych na temat cen domów w oparciu o ich wielkość i lokalizację, karmisz je modelem i trenujesz, a następnie możesz przewidzieć cenę innych domów na podstawie danych, które karmisz.
  3. jeśli chcesz przewidzieć, że twoja wiadomość jest spamem lub nie jest oparta na starszej wiadomości, możesz przewidzieć, że nowa wiadomość jest spamem, czy nie.

Algorytm uczenia nadzorowanego jest następujący:

1) Regresja liniowa

regresja liniowa jest cenna dla odkrycia związku między dwoma trwałymi czynnikami. Jedna jest zmienną predykcyjną lub autonomiczną, a drugą zmienną reakcji lub zmiennej totemicznej. Poszukuje mierzalnego związku, ale nie związku deterministycznego. Mówi się, że związek między dwoma czynnikami jest deterministyczny, ponieważ jedna zmienna może być precyzyjnie przekazana przez drugą. Na przykład, wykorzystując temperaturę w stopniach Celsjusza, możliwe jest dokładne przewidywanie Fahrenheita. Faktyczny związek nie jest precyzyjny w podejmowaniu decyzji o związku między dwoma czynnikami. Na przykład połączenie gdzieś w zakresie wysokości i wagi. Główną myślą jest uzyskanie linii najlepiej pasującej do informacji. Linia najlepszego dopasowania to ta, w przypadku której błąd ogólny prognozowania (wszystkie informacje koncentruje się) jest tak mały, jak można by się spodziewać w danych okolicznościach. Błąd polega na oddzieleniu punktu od linii regresji.

2) Drzewa decyzyjne

Drzewo decyzyjne to gadżet ułatwiający podejmowanie decyzji, który korzysta z drzewiastego diagramu lub modelu decyzji i ich potencjalnych wyników, w tym wyników zdarzeń losowych, kosztów zasobów i użyteczności. Przeglądaj obraz, aby uzyskać sentyment do tego, co przypomina.

3) Naiwna klasyfikacja Bayesa

Naiwna klasyfikacja Bayesa Grupa podstawowych klasyfikatorów probabilistycznych zależnych od zastosowania teorii Bayesa z silnym (niewyszukanym) samorządem cechuje Naive Bayes. Ta klasyfikacja Niektóre z certyfikowanych modeli to:

Aby oznaczyć wiadomość e-mail jako spam lub nie spam

Zamów wiadomość o innowacjach, kwestiach rządowych lub sporcie

Sprawdź odrobinę substancji wywołującej pozytywne emocje lub negatywne uczucia?

Wykorzystywany do programowania potwierdzania twarzy.

4) Regresja logistyczna

Regresja logistyczna jest przełomową faktyczną metodą wykazania wyniku dwumianowego z co najmniej jednym czynnikiem informacyjnym. Określa związek między bezwzględną zmienną totemu i co najmniej jednym wolnym czynnikiem poprzez ocenę prawdopodobieństw z wykorzystaniem zdolności logistycznej, która jest połączonym zawłaszczeniem logistycznym.

Zwykle regresje będą przydatne w prawdziwym życiu, np .:

Ocena kredytowa

Miara wskaźnika sukcesu rynku lub firmy

Aby przewidzieć przychody dowolnej firmy lub dowolnego produktu

Czy któregoś dnia nastąpi trzęsienie ziemi?

5) Zwykła regresja metodą najmniejszych kwadratów

Najmniejsze kwadraty to strategia przeprowadzania regresji bezpośredniej. regresja bezpośrednia polega na dopasowaniu linii przez wiele obszarów. Istnieją różne potencjalne procedury, aby to zrobić, a system „zwykłych najmniejszych kwadratów” działa w ten sposób - możesz narysować linię, a następnie dla wszystkich centrów danych zmierzyć pionowe oderwanie między punktem a linią i uwzględnić je w górę; dopasowana linia byłaby miejscem, w którym agregacja przegród jest tak skromna, jak mogłaby być normalna w świetle obecnej sytuacji.

Co to jest nauka bez nadzoru?

Model uczy się poprzez percepcję i odkrywa struktury informacji. Gdy model otrzymuje zestaw danych, w konsekwencji wykrywa przykłady i połączenia w zestawie danych, tworząc w nim pęczki. To, czego nie może zrobić, to dodać znaki do kiści, podobnie jak nie można powiedzieć, że to zbiór jabłek lub mango, jednak izoluje każde jabłko od mango.

Załóżmy, że pokazaliśmy zdjęcia jabłek, bananów i mango do modelu, więc to, co robi, w świetle niektórych przykładów i połączeń powoduje, że pęczki i partycje są zestawem danych w te grupy. Obecnie, jeśli w modelu jest wzmocniona inna informacja, dodaje ją do jednej z wykonanych wiązek.

Przykład uczenia się bez nadzoru

  1. Masz dużo zdjęć 6 osób, ale bez danych o tym, kto jest na którym, i musisz wyizolować ten zestaw danych na 6 hałd, każde ze zdjęciami jednej osoby.
  2. Masz cząstki, niektóre z nich są lekami, a część nie, jednak nie zdajesz sobie sprawy, które będą, i potrzebujesz kalkulacji, aby znaleźć leki.

Algorytm uczenia bez nadzoru jest następujący

Grupowanie

Grupowanie jest istotnym pomysłem w odniesieniu do uczenia się bez pomocy. Przeważnie udaje mu się znaleźć strukturę lub przykład w zbiorze nieskategoryzowanych informacji. Obliczenia klastrowe przetwarzają twoje informacje i odkryją charakterystyczne klastry (grupy) w przypadku ich istnienia w informacjach. Możesz również zmienić liczbę wiązek, które powinny być rozróżnione w obliczeniach. Umożliwia zmianę granulacji tych spotkań.

Istnieje wiele rodzajów klastrów, których możesz użyć

  1. Selektywne (podział)
  2. Model: K-oznacza
  3. Aglomeracyjny
  4. Model: Hierarchiczne grupowanie
  5. Pokrycie
  6. Model: Fuzzy C-oznacza
  7. Probabilistyczny

Typy algorytmów grupowania

  1. Hierarchiczne grupowanie
  2. K-oznacza grupowanie
  3. K-NN (k najbliższych sąsiadów)
  4. Analiza głównych składowych
  5. Rozkład wartości samotnej
  6. Niezależna analiza komponentów
  7. Hierarchiczne grupowanie
Hierarchiczne grupowanie

Hierarchiczne grupowanie jest obliczeniem, które konstruuje kolejność dziobania grup. Zaczyna się od każdej informacji, która trafia do ich własnej grupy. Tutaj dwie bliskie grupy będą w podobnej grupie. Obliczenia zamykają się, gdy pozostała tylko jedna grupa.

K-oznacza Clustering

K oznacza, że ​​jest to iteracyjne obliczanie skupień, które zachęca do znalezienia najbardziej godnej uwagi zachęty do każdego nacisku. Najpierw wybierana jest idealna liczba grup. W tej technice klastrowania musisz zebrać informacje, które skupiają się na k spotkaniach. Większe k oznacza podobnie mniejsze spotkania o większej ziarnistości. Niższe k oznacza większe spotkania o mniejszej ziarnistości.

Wydajność obliczeń to zbiór „nazw”. Pozwala to na punkt informacyjny na jednym z k spotkań. W grupowaniu k-średnich każde zgromadzenie charakteryzuje się utworzeniem centroidu dla każdego zebrania. Centroidy są jak rdzeń grona, który chwyta ogniska znajdujące się najbliżej nich i dodaje je do grupy.

Klastry średnich w K charakteryzują ponadto dwie podgrupy

  1. Grupowanie aglomeracyjne
  2. Dendrogram
Grupowanie aglomeracyjne

Ten rodzaj K oznacza grupowanie rozpoczyna się od stałej liczby wiązek. Wyznacza wszystkie informacje na dokładną liczbę grup. Ta strategia grupowania nie wymaga liczby grup K jako informacji. Procedura aglomeracji rozpoczyna się od ukształtowania każdego układu odniesienia jako pojedynczej grupy.

Ta strategia wykorzystuje pewną miarę separacji, zmniejsza liczbę pęczków (jedna na każdy nacisk) poprzez połączenie procesu. Podsumowując, mamy jedną główną grupę, która zawiera każdy z artykułów.

Dendrogram

W technice klastrowania Dendrogram każdy poziom będzie mówił do wyobrażalnej grupy. Wysokość dendrogramu pokazuje stopień podobieństwa między dwoma wiązkami. Im bliżej podstawy procedury, są one progresywnie porównywalną wiązką, która polega na znalezieniu zebrania z dendrogramu, co nie jest charakterystyczne i w większości abstrakcyjne.

K-Najbliżsi sąsiedzi

Najbliższy sąsiad K jest najprostszym ze wszystkich klasyfikatorów AI. Różni się od innych procedur AI tym, że nie dostarcza modelu. Jest to proste obliczenie, które przechowuje każdy dostępny przypadek i charakteryzuje nowe przykłady w zależności od miary podobieństwa.

Działa bardzo dobrze, gdy występuje rozdział między modelami. Szybkość uczenia się jest umiarkowana, gdy zestaw przygotowawczy jest ogromny, a ustalenie separacji nie jest łatwe.

Analiza głównych składników

Przy małej szansie, że potrzebujesz przestrzeni o wyższych wymiarach. Musisz wybrać przyczynę tego miejsca i tylko 200 najważniejszych wyników tej przesłanki. Ta baza jest znana jako główny składnik. Podzbiór, który wybierzesz, to kolejna przestrzeń o niewielkich rozmiarach kontrastująca z unikalną przestrzenią. Podtrzymuje jednak tak wiele różnorodnych aspektów informacji, jak można się było spodziewać.

Co to jest nauka zbrojenia?

To zdolność specjalisty do współpracy z ziemią i odkrycia, jaki jest najlepszy wynik. Realizuje ideę uderzenia i techniki wstępnej. Operator jest wynagradzany lub karany punktem za słuszną lub nieuczciwą odpowiedź, a na podstawie pozytywnych nagród skupionych na modelu pociągów. Raz jeszcze przygotowany przygotowuje się do przewidzenia nowych informacji.

Przykład nauki o wzmocnieniu

  1. Wyświetlanie reklam według użytkowników nie lubi optymalizacji na długi okres
  2. Poznaj budżet reklam używany w czasie rzeczywistym
  3. nauka odwrotnego wzmacniania, aby lepiej poznać klientów, którzy nie lubią

Co to jest nauka częściowo nadzorowana?

Półnadzorowany rodzaj uczenia się, obliczenia są przygotowywane na podstawie kombinacji nazwanych i nieznakowanych informacji. Zwykle ta mieszanka będzie zawierać ograniczoną liczbę nazwanych informacji i wiele informacji nieznakowanych. Podstawowa zastosowana metoda polega na tym, że najpierw inżynier oprogramowania zgrupuje porównywalne informacje, wykorzystując obliczenia uczenia się bez pomocy, a następnie wykorzysta bieżące nazwane informacje, aby nazwać resztę informacji nieznakowanych. Zwykłe przypadki użycia tego rodzaju obliczeń mają między sobą typową właściwość - Pozyskiwanie nieznakowanych informacji jest ogólnie skromne, a nazywanie wspomnianych informacji jest zbyt drogie. Oczywiście, można wyobrazić sobie trzy rodzaje obliczeń uczenia się: nadzorowane realizowanie, gdy asystent znajduje się pod nadzorem instruktora zarówno w domu, jak i w szkole, nie nadzorowane, kiedy asystent musi rozumieć pomysł samodzielnie i częściowo nadzorowane, gdy wychowawca pokazuje kilka pomysłów w klasie i udziela zapytań w formie zadań szkolnych, które zależą od porównywalnych pomysłów.

Przykład częściowo nadzorowanego uczenia się

To niezwykłe, że więcej informacji = lepsza jakość modeli w głębokim uczeniu się (wyraźnie do określonego punktu zamknięcia, ale często nie mamy tak wielu informacji). Mimo to zdobycie oznaczonej informacji jest kosztowne. W przypadku, gdy musisz przygotować model do odróżnienia skrzydlatych zwierząt, możesz ustawić wiele aparatów, aby w ten sposób robić zdjęcia ptactwu. To jest ogólnie skromne. Umawianie osób do oznaczania tych zdjęć jest kosztowne. Rozważ możliwość, że masz ogromną liczbę zdjęć skrzydlatych zwierząt, ale po prostu umów osoby, aby oznaczyć niewielki podzbiór zdjęć. Jak się okazało, zamiast po prostu trenować modele na zaznaczonym podzbiorze, możesz wstępnie trenować model na całym zestawie szkoleniowym, zanim dostosujesz go za pomocą nazwanego podzbioru, i wykażesz oznaki wykonania ulepszeń wzdłuż tych linii. To jest nauka częściowo nadzorowana. Odkłada na bok twoją gotówkę.

Wniosek

Istnieje wiele rodzajów algorytmów uczenia maszynowego i na podstawie różnych warunków musimy użyć algorytmu najlepszego dopasowania, aby uzyskać najlepszy wynik. Istnieje wiele algorytmów, które znajdują najlepszą dokładność każdego typu algorytmu uczenia maszynowego i która jest najwyższą dokładnością, jakiej musimy użyć tego algorytmu. Możemy zminimalizować błąd każdego algorytmu, redukując szum w danych. W końcu powiem, że nie ma jednego algorytmu uczenia maszynowego, który zapewnia 100-procentową dokładność, nawet ludzki mózg nie może tego zrobić, więc znajdź najlepszy algorytm jodły dla swoich danych.

Polecane artykuły

Jest to przewodnik po typach algorytmów uczenia maszynowego. Tutaj omawiamy Czym jest algorytm uczenia maszynowego ?, a jego typy obejmują uczenie nadzorowane, uczenie bez nadzoru, uczenie częściowo nadzorowane, uczenie wzmacniające. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -

  1. Metody uczenia maszynowego
  2. Biblioteki uczenia maszynowego
  3. Modele uczenia maszynowego
  4. Ramy uczenia maszynowego
  5. Uczenie maszynowe hiperparametrów
  6. Hierarchiczne grupowanie | Grupowanie aglomeracyjne i dzielące
  7. Utwórz drzewo decyzyjne | Jak stworzyć | Zalety
  8. Cykl życia uczenia maszynowego | 8 najlepszych etapów

Kategoria: