Grupowanie w uczenie maszynowe Najpopularniejsze metody i aplikacje

Spisie treści:

Anonim

Wprowadzenie do klastrowania w uczeniu maszynowym

Najpierw zrozumiemy uczenie maszynowe. Widzimy szybko rosnące dane wokół nas. Dane występują w różnych formach, takich jak wideo, audio, zdjęcia itp. Klastrowanie w uczeniu maszynowym wykorzystuje te dane do odpowiedzi na pytanie. Na przykład (wykrywanie chorób skóry) lekarz wykorzysta uczenie maszynowe, aby zrozumieć znak na skórze i przewidzieć, jaki to rodzaj choroby. Klastrowanie to nic innego jak grupowanie nieznakowanych zestawów danych. Weźmy przykład twojego filmu (chcesz obejrzeć). Możesz lubić filmy romantyczne, ale twoja siostra lubi filmy komediowe. Możesz polubić romantyczne filmy z Bollywood lub romantyczne filmy z Hollywood. Ale twoja siostra lubi filmy komediowe Telegu, tutaj możesz zobaczyć siebie, a twoja siostra ma inny wybór filmów. Oboje odkryliście głębokie informacje o filmach. Tutaj zgrupowaliśmy nieoznaczony zestaw danych (filmy), aby obejrzeć film.

Jak działa klastrowanie w uczeniu maszynowym?

W klastrowaniu grupujemy nieoznaczony zestaw danych, który jest znany jako uczenie się bez nadzoru. Kiedy po raz pierwszy grupujemy dane nieznakowane, musimy znaleźć podobną grupę. Tworząc grupę, musimy zrozumieć cechy zestawów danych, tj. Podobne rzeczy. Jeśli tworzymy grupę według jednej lub dwóch cech, łatwo jest zmierzyć podobieństwo.

  • Przykład 1: Filmy reżysera. Po zakończeniu klastrowania do każdego klastra przypisywany jest numer klastra, który jest znany jako ClusterID. System uczenia maszynowego, taki jak YouTube, wykorzystuje klasterID do najłatwiejszego reprezentowania złożonych danych.
  • Przykład 2: YouTube korzysta z naszej historii wyszukiwania lub historii oglądania i sugeruje filmy, które mogą nam się spodobać. Zestaw danych funkcji na Facebooku zawiera osoby, które obserwujemy, strony, które obserwujemy, komentarze, które zamieszczamy, zdjęcia lub filmy, które lubimy, zdjęcia lub zdjęcia, na których oznaczamy tag. Klastrowanie wideo lub zdjęcia z Facebooka zastąpi zestaw funkcji pojedynczym identyfikatorem klastra z powodu kompresji danych.

Top 4 metody klastrowania w uczeniu maszynowym

Poniżej znajdują się metody klastrowania w uczeniu maszynowym:

1. Hierarchiczny

Klaster nazw określa sposób działania, metoda ta tworzy klaster w sposób hierarchiczny. Nowy klaster jest tworzony przy użyciu wcześniej utworzonej struktury. Musimy zrozumieć różnice między podejściem dzielącym a podejściem aglomeracyjnym. Aglomeracja jest podejściem oddolnym, zaczyna się od pojedynczych punktów w klastrze i łączy dowolne. Dzielenie rozpoczyna się od jednego klastra, wszystkie punkty w klastrze i dzieli go na wiele klastrów.

2. Na podstawie gęstości

W tej metodzie gęsty region jest uważany za klaster, który ma pewne podobieństwa. Różni się od dolnego gęstego obszaru przestrzeni obiektowej. DBSCAN jest znany jako przestrzenne grupowanie aplikacji z hałasem. Dla orientacji obiektowej danych DBSCAN szuka epsilonu, ustawiliśmy promień epsilonu i minimalną liczbę punktów. W promieniu, jeśli przekroczymy minimalną liczbę punktów, oceniamy klaster o wysokiej gęstości. W ten sposób możemy rozpatrywać dane z regionem o dużej gęstości. DBSCAN różni się od metody skupiania centroidów, ponieważ nie jest to ścisłe podejście. Punkty hałasu to punkty w obszarach o niskiej gęstości, które są nieoznaczone lub oznaczone jako wartości odstające. To dlatego nie wymagamy określonego K. Możemy określić minimalne punkty dla regionu o wysokiej gęstości i promienia, jaki chcemy, aby region był lub skupienia.

3. Partycjonowanie

Kiedy mamy zbiór danych o liczbie N obiektów. Ta metoda konstruuje „K” jako partycję danych. Ta partycja to klaster, tzn. Konstrukcja K, partycja (K <= N).

Wymagania, które należy spełnić:

  • Każda grupa lub zestaw danych musi zawierać co najmniej jeden obiekt.
  • Każdy obiekt powinien należeć tylko do jednej grupy.

Jednym z przykładów partycjonowania jest klastrowanie typu K-oznacza.

4. Na podstawie siatki

Przestrzeń obiektów, skończona liczba komórek tworzy strukturę siatki. Ta metoda zapewnia szybkie przetwarzanie klastra. Są one niezależne od przestrzeni obiektów.

Zastosowania klastrowania w uczeniu maszynowym

Poniżej znajdują się zastosowania klastrowania w uczeniu maszynowym:

1. Medycyna

Lekarz może użyć algorytmu grupowania, aby znaleźć wykrycie choroby. Weźmy przykład choroby tarczycy. Zestaw danych dotyczących chorób tarczycy można zidentyfikować za pomocą algorytmu grupowania, gdy zastosujemy uczenie bez nadzoru w zestawie danych, który zawiera zestaw danych o tarczycy i nie-tarczycy. Grupowanie pozwoli zidentyfikować przyczynę choroby i zapewni skuteczne wyszukiwanie wyników.

2. Sieć społecznościowa

Jesteśmy pokoleniem ery Internetu, możemy spotkać się z każdą osobą lub dowiedzieć się o każdej indywidualnej tożsamości za pośrednictwem Internetu. Serwisy społecznościowe używają klastrowania do zrozumienia treści, twarzy lub lokalizacji użytkownika. Gdy nauka społecznościowa jest nadzorowana bez nadzoru, jest przydatna przy tłumaczeniu języka. Na przykład Instagram i Facebook zapewniają funkcję tłumaczenia języka.

3. Marketing

Widzimy lub obserwujemy, że obok nas rośnie inna technologia, a ludzie przyciągają takie technologie, jak chmura, marketing cyfrowy. Aby przyciągnąć większą liczbę klientów, każda firma opracowuje łatwe w użyciu funkcje i technologie. Aby zrozumieć klienta, możemy użyć klastrowania. Klastrowanie pomoże firmie zrozumieć segment użytkowników, a następnie skategoryzować każdego klienta. W ten sposób możemy zrozumieć klienta i znaleźć podobieństwa między klientami i pogrupować ich.

4. Bankowość

Zauważyliśmy, że wokół nas dochodzi do oszustwa pieniężnego i firma ostrzega klientów o tym. Za pomocą klastrowania firmy ubezpieczeniowe mogą znaleźć oszustwo, docenić klientów i zrozumieć zasady wprowadzone przez klienta.

5. Google

Google jest jedną z wyszukiwarek używanych przez ludzi. Weźmy przykład, gdy szukamy pewnych informacji, takich jak sklep zoologiczny w okolicy, Google zapewni nam różne opcje. Jest to wynik grupowania, grupowania podobnych wyników, które są dostarczane.

Wniosek

Dowiedzieliśmy się o klastrowaniu i uczeniu maszynowym. Sposób grupowania działa w uczeniu maszynowym. Informacje o uczeniu się bez nadzoru. Wykorzystanie uczenia się bez nadzoru w czasie rzeczywistym. Metody grupowania i sposób działania każdej metody w uczeniu maszynowym.

Polecany artykuł

Jest to przewodnik po klastrowaniu w uczeniu maszynowym. Tutaj omawiamy 4 najlepsze metody klastrowania w uczeniu maszynowym wraz z aplikacjami. Możesz także przejrzeć nasze inne sugerowane artykuły, aby dowiedzieć się więcej -
  1. Ramy uczenia maszynowego Top 10
  2. K- oznacza algorytm grupowania z zaletami
  3. Wprowadzenie do technik uczenia maszynowego
  4. Modele uczenia maszynowego | 5 najlepszych typów
  5. Biblioteka uczenia maszynowego C ++