Różnica między Data Science a Data Mining
Data Mining polega na wyszukiwaniu trendów w zbiorze danych. I wykorzystując te trendy do identyfikowania przyszłych wzorców. Jest to ważny krok w procesie odkrywania wiedzy. Często obejmuje analizę ogromnej ilości danych historycznych, które wcześniej były ignorowane. Data Science to dziedzina badań, która obejmuje wszystko od analizy dużych zbiorów danych, eksploracji danych, modelowania predykcyjnego, wizualizacji danych, matematyki i statystyki. Data Science nazwano czwartym paradygmatem nauki. (pozostałe trzy to teoretyczne, empiryczne i obliczeniowe). Academia często prowadzi ekskluzywne badania w dziedzinie Data Science.
Perspektywa historyczna
Zanim przejdziemy do opisów technicznych, spójrzmy na ewolucję terminów. Historyczne dochodzenie wyjaśni, w jaki sposób obecnie używane są te warunki.
- Słowo „Data Science” pochodzi z lat 60. XX wieku, ale wówczas było używane jako alternatywa dla „Informatyki”. Obecnie ma zupełnie inne znaczenie.
- W 2008 roku DJ Patil i Jeff Hammerbacher jako pierwsi nazwali siebie „Data Scientists”, aby opisać swoją rolę odpowiednio na LinkedIn i Facebooku.
- W 2012 r. Artykuł Harvard Business Review cytował Data Scientist jako „Najseksowniejszą pracę XXI wieku”.
- Termin Data Mining ewoluował równolegle. Stało się powszechne wśród społeczności baz danych w latach 90.
- Data Mining zawdzięcza swój początek KDD (Knowledge Discovery in Databases). KDD to proces wyszukiwania wiedzy na podstawie informacji zawartych w bazach danych. A Data Mining to główny podproces w KDD.
- Data Mining jest często używany zamiennie wraz z KDD.
Chociaż nazwy te pojawiły się niezależnie, często okazują się tak komplementarne, ponieważ w końcu są ściśle związane z analizą danych.
Bezpośrednie porównanie między Data Science a Data Mining (Infografika)
Poniżej znajduje się 9 najlepszych porównań Data Science vs. Data Mining
Przykład użycia przypadku
Rozważ scenariusz, w którym jesteś głównym sprzedawcą w Indiach. Masz 50 sklepów działających w 10 dużych miastach w Indiach i działasz od 10 lat.
Powiedzmy, że chcesz przestudiować dane z ostatnich 8 lat, aby znaleźć liczbę sprzedaży słodyczy podczas świątecznych sezonów 3 miast. Jeśli to jest twój cel, polecam zatrudnić osobę z doświadczeniem w eksploracji danych. Data Miner prawdopodobnie przejrzałby informacje historyczne przechowywane w starszych systemach i zastosowałby algorytmy do wydobywania trendów.
Rozważ inny przypadek, w którym chcesz wiedzieć, które słodycze otrzymały więcej pozytywnych recenzji. W takim przypadku źródła danych mogą nie być ograniczone do baz danych, mogą obejmować witryny społecznościowe lub komunikaty zwrotne od klientów. W tym przypadku proponuję ci zatrudnić specjalistę ds. Danych. Osoba zatrudniona jako Data Scientist jest bardziej odpowiednia do stosowania algorytmów i przeprowadzania tej analizy społeczno-obliczeniowej.
Kluczowe różnice między Data Science a Data Mining
Poniżej przedstawiono różnicę między analizą danych a eksploracją danych
- Data Mining jest działaniem, które jest częścią szerszego procesu odkrywania wiedzy w bazach danych (KDD), podczas gdy Data Science to dziedzina badań podobnie jak matematyka stosowana lub informatyka.
- Często na Data Science patrzy się w szerokim znaczeniu, podczas gdy Data Mining jest uważana za niszę.
- Niektóre działania w ramach Data Mining, takie jak analiza statystyczna, pisanie przepływów danych i rozpoznawanie wzorców, mogą krzyżować się z Data Science. Dlatego Data Mining staje się podzbiorem Data Science.
- Uczenie maszynowe w eksploracji danych jest bardziej wykorzystywane w rozpoznawaniu wzorców, natomiast w Data Science ma bardziej ogólne zastosowanie.
Uwaga
- Nauki o danych i eksploracji danych nie należy mylić z Big Data Analytics, a zarówno górnicy, jak i naukowcy mogą pracować nad dużymi zbiorami danych.
Data Science vs. Data Mining Tabela porównawcza
Podstawa do porównania | Data Mining | Data Science |
Co to jest? | Technika | Obszar |
Skupiać | Proces biznesowy | Badania naukowe |
Cel | Uczyń dane bardziej użytecznymi | Budowanie produktów zorientowanych na dane dla organizacji |
Wynik | Wzory | Urozmaicony |
Cel, powód | Znalezienie trendów wcześniej nieznanych | Analiza społeczna, budowanie modeli predykcyjnych, odkrywanie nieznanych faktów i wiele innych |
Perspektywa zawodowa | Osoba znająca się na nawigacji po danych i rozumieniu statystycznym może przeprowadzić eksplorację danych | Osoba musi zrozumieć uczenie maszynowe, programowanie, techniki graficzne i posiadać wiedzę w dziedzinie, aby zostać naukowcem danych |
Stopień | Eksploracja danych może być podzbiorem nauki o danych, ponieważ działalność wydobywcza jest częścią potoku nauki o danych | Multidyscyplinarne - Data Science składa się z wizualizacji danych, obliczeniowych nauk społecznych, statystyki, eksploracji danych, przetwarzania języka naturalnego i tak dalej |
Zajmuje się (typ danych) | Głównie zbudowany | Wszystkie formy danych - ustrukturyzowane, częściowo ustrukturyzowane i nieustrukturyzowane |
Inne mniej popularne nazwy | Archeologia danych, zbieranie informacji, odkrywanie informacji, ekstrakcja wiedzy | Nauka oparta na danych |
Wniosek - Data Science vs. Data Mining
A więc proszę bardzo! Jestem pewien, że teraz jesteś bardziej świadomy, jakie są kluczowe różnice między nimi i w jakim kontekście należy je wykorzystać. Należy pamiętać, że nie ma formalnych i precyzyjnych definicji Data Science i Data Mining. Wciąż toczą się dyskusje między środowiskiem akademickim i przemysłem na temat tego, co stanowi dokładną definicję. Jednak wszyscy są na tej samej stronie w odniesieniu do różnic wysokiego poziomu i opisów dwóch terminów, które zbadaliśmy w tym artykule.
Polecany artykuł
Jest to przewodnik po Data Science vs. Data Mining, ich znaczeniu, bezpośrednim porównaniu, kluczowych różnicach, tabeli porównawczej i wnioskach. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej -
- Nauka o danych i jej rosnące znaczenie
- 7 ważnych technik eksploracji danych dla najlepszych rezultatów
- Analityka predykcyjna a analiza danych - poznaj 8 przydatnych porównań
- 8 ważnych technik eksploracji danych dla udanego biznesu