Wprowadzenie do uczenia maszynowego bez nadzoru

Czy kiedykolwiek myślałeś o tym, jak dziecko jest w stanie odróżnić jabłka od pomarańczy, gdy nie wie, jakie są w rzeczywistości, jak smakują, ale na podstawie koloru i wielkości może je podzielić na 2 grupy bez wcześniejszej informacji? Czy możemy oczekiwać takiej samej segmentacji, jak dziecko, od maszyn, jeśli otrzymamy informacje o kolorze i rozmiarze? Zobaczmy, jak możemy to zrobić! W tym temacie dowiemy się o uczeniu maszynowym bez nadzoru.

„Uczenie maszynowe”, jak sugeruje to termin, uczymy maszyny wykonywać zadania podobne do ludzkich i jak ludzie uczą się od kogoś lub przez obserwację. Tak jak ludzie, sposób uczenia się maszyny.

Uczenie maszynowe można podzielić na 3 części:

  1. Nadzorowana nauka
  2. Uczenie się bez nadzoru
  3. Uczenie się przez wzmocnienie

Rodzaje uczenia maszynowego

Uczenie się przez wzmacnianie to uczenie się oparte na agentach, które wiąże się z nagrodą i karą za działania podejmowane przez agenta. Ostatecznym celem jest maksymalizacja ogólnej nagrody w procesie uczenia się od środowiska.

Jeśli masz dane wejściowe i wyjściowe, w skrócie, na przykład dane oznaczone, przy danej wysokości i wadze w celu ustalenia, czy dana osoba jest mężczyzną czy kobietą, można uznać za nadzorowane zadanie uczenia się (od kogoś w przypadku ludzi).

Ale w wielu rzeczywistych sytuacjach te oznaczone lub opatrzone adnotacjami dane nie zawsze są dostępne. Wiele razy napotykamy problemy z segmentowaniem obiektów na podstawie ich właściwości, które nie zostały wyraźnie wymienione. Jak rozwiązać ten problem? Cóż, nauka bez nadzoru jest rozwiązaniem.

Wikipedia twierdzi, że nauka bez nadzoru jest rodzajem samoorganizującego się nauki języka hebrajskiego, która pomaga znaleźć nieznane wcześniej wzorce w zbiorze danych bez wcześniejszych etykiet. W uczeniu się bez nadzoru nie mamy żadnych informacji na temat etykiet, ale nadal chcemy uzyskać wgląd w dane na podstawie ich różnych właściwości.

Rodzaje uczenia maszynowego bez nadzoru

Zadania edukacyjne bez nadzoru można podzielić na 3 kategorie:

  1. Eksploracja reguł asocjacyjnych
  2. Grupowanie
  3. System rekomendacji

1. Wydobywanie reguł asocjacyjnych

Kiedy mamy dane transakcyjne dotyczące czegoś, mogą dotyczyć sprzedawanych produktów lub dowolnych danych transakcyjnych w tym zakresie, chcę wiedzieć, czy istnieje jakiś ukryty związek między kupującym a produktami lub produktem do produktu, tak że mogę w jakiś sposób wykorzystać te informacje aby zwiększyć moją sprzedaż. Wyodrębnienie tych relacji jest podstawą eksploracji reguł asocjacyjnych. Możemy wykorzystywać algorytmy wzrostu AIS, SETM, Apriori, FP do wydobywania relacji.

2. Grupowanie

Grupowanie można wykonać na dowolnych danych, w których nie mamy informacji o klasie ani etykiecie. Chcemy pogrupować dane w taki sposób, aby obserwacje o podobnych właściwościach należały do ​​tej samej grupy / grupy, a odległość między grupami powinna być maksymalna. Natomiast odległość wewnątrz gromady powinna być minimalna. Możemy grupować dane wyborcy, aby uzyskać opinię na temat rządu lub produktów klastrowych, w oparciu o ich funkcje i wykorzystanie. Segmentuj populację na podstawie cech dochodu lub stosuj klastry w sprzedaży i marketingu.

Możemy używać K-Means, K-Means ++, K-Medoids, Fuzzy C-znaczy (FCM),

Expectation-Maximization (EM), Aglomerative Clustering, DBSCAN, typy Hierarchical Clustering jako single linkage, full linking, mediana linking, Ward's method algorytm for clustering.

3. System rekomendacji

System rekomendacji jest w zasadzie rozszerzeniem eksploracji reguł asocjacyjnych w tym sensie, że w ARM wyodrębniamy relacje, aw systemie rekomendacji używamy tych relacji do rekomendowania czegoś, co ma większe szanse akceptacji przez użytkownika końcowego. Systemy rekomendacji zyskały na popularności po tym, jak Netflix ogłosił nagrodę główną w wysokości 1 000 000 USD w 2009 roku.

Systemy rekomendacji działają na danych transakcyjnych, takich jak transakcje finansowe, handel elektroniczny lub transakcje w sklepie spożywczym. Obecnie wielcy gracze w branży e-commerce przyciągają klientów, tworząc dostosowane rekomendacje dla każdego użytkownika w oparciu o jego historię zakupów i podobne dane o zakupach od innych użytkowników.

Metody opracowywania systemów rekomendacji można ogólnie podzielić na Filtrowanie oparte na współpracy i Filtrowanie oparte na treści. W filtrowaniu grupowym znów mamy filtrowanie grupowe między użytkownikami oraz filtrowanie grupowe przedmiotów i przedmiotów, które są podejściami opartymi na pamięci, a rozkład na macierze i rozkład pojedynczej wartości (SVD) są oparte na modelach.

Zastosowania uczenia się bez nadzoru

Ponieważ światowe dane ogromnie rosną każdego dnia, uczenie się bez nadzoru ma wiele zastosowań. Zawsze tworzymy dane za pomocą platform mediów społecznościowych lub niektórych treści wideo na YouTube i wiele razy nawet tego nie robimy celowo. Wszystkie te dane są nieustrukturyzowane, a oznaczanie ich nadzorowanymi zadaniami edukacyjnymi będzie męczące i kosztowne.

Oto niektóre fajne zastosowania uczenia maszynowego bez nadzoru.

  1. Sklep spożywczy lub sklep / rynek e-commerce: Wyodrębnij reguły stowarzyszenia z danych transakcyjnych klientów i rekomendacje dla konsumentów dotyczące zakupu produktów.
  2. Platforma mediów społecznościowych: wyodrębnij relacje z różnymi użytkownikami, aby zaproponować produkty lub usługi. Polecaj nowe osoby do kontaktów społecznościowych.
  3. Usługi: rekomendacje usług turystycznych, rekomendacje domów do wynajęcia lub usługi kojarzeń.
  4. Bankowość: klienci klastrów na podstawie ich transakcji finansowych. Klastrowa nieuczciwa transakcja w celu wykrycia oszustwa.
  5. Polityka: opinie wyborców klastra o szansach wygranej dla określonej partii.
  6. Wizualizacja danych: dzięki klastrowaniu i t-rozproszonemu osadzaniu Stochastic Neighbor Embedding (t-SNE) możemy wizualizować dane wielowymiarowe. Można to również wykorzystać do zmniejszenia wymiarów.
  7. Rozrywka: rekomendacje dotyczące filmów, muzyki, podobnie jak Netflix i Amazon.
  8. Segmentacja obrazu: fragmentuje obrazy w oparciu o najbliższe wartości w pikselach.
  9. Treść: spersonalizowane gazety, rekomendacje stron internetowych, aplikacje e-learningowe i filtry e-mail.
  10. Wykrywanie strukturalne: dzięki klastrowaniu możemy odkryć dowolną ukrytą strukturę danych, a dane twitterów klastrowych do analizy nastrojów.

Wniosek

Uczenie maszynowe bez nadzoru nie jest zbyt policzalne, ale może rozwiązać wiele problemów, w których zawodzą nadzorowane algorytmy. Istnieje wiele aplikacji do nauki bez nadzoru w wielu domenach, w których mamy nieustrukturyzowane i nieoznaczone dane. Możemy zastosować techniki uczenia się bez nadzoru, aby nauczyć nasze maszyny wykonywania lepszej pracy niż my. W ostatnich latach maszyny przewyższały ludzi pod względem zadań, które są uważane za rozwiązywane przez ludzi od stuleci. Mam nadzieję, że dzięki temu artykułowi zrozumiałeś, co to jest i jak można wykorzystać nienadzorowane techniki uczenia maszynowego do rozwiązywania rzeczywistych problemów.

Polecane artykuły

Jest to przewodnik po uczeniu maszynowym bez nadzoru. Tutaj omawiamy rodzaje uczenia maszynowego i typy uczenia maszynowego bez nadzoru wraz z jego aplikacjami. Możesz także zapoznać się z następującymi artykułami, aby dowiedzieć się więcej -

  1. Algorytmy uczenia maszynowego
  2. Co to jest uczenie maszynowe?
  3. Wprowadzenie do uczenia maszynowego
  4. Narzędzia do uczenia maszynowego
  5. Grupowanie w uczenie maszynowe
  6. Uczenie maszynowe hiperparametrów
  7. Hierarchiczny algorytm grupowania
  8. Hierarchiczne grupowanie | Grupowanie aglomeracyjne i dzielące
  9. 8 najważniejszych etapów cyklu uczenia maszynowego

Kategoria: