Jak zainstalować NLTK?

Poniższy artykuł Zainstaluj NLTK zawiera zarys instalacji NLTK. NLTK to zestaw bibliotek do przetwarzania języka naturalnego. Jest to platforma do budowania programów w języku Python do przetwarzania języka naturalnego. NLTK jest napisany w języku programowania Python. Został opracowany przez Stevena Birda i Edwarda Lopera. Wspiera badania i nauczanie w NLP lub blisko powiązanych obszarach, w tym kognitywistykę, językoznawstwo empiryczne, wyszukiwanie informacji, sztuczną inteligencję i uczenie maszynowe. NLTK zapewnia łatwy w użyciu interfejs.

NLTK (Natural Language Toolkit)

  • Przetwarzanie języka naturalnego (NLP) jest częścią sztucznej inteligencji, która przetwarza język używany przez ludzi. W ten sposób pomaga ludziom wchodzić w interakcje z komputerami, nawet jeśli nie mają wiedzy o tym, jak z nich korzystać. Korzystając z NLP, ludzie muszą dyktować polecenie komputerom. Dzięki możliwości uczenia maszynowego przetwarzanie języka naturalnego staje się popularne i łatwiejsze do wdrożenia. Jest to w zasadzie technika interakcji z ludźmi i wykonywania poleceń głosowych.
  • Umożliwia to korzystanie z urządzeń nawet początkującym, którzy nie znają technologii. Ale wdrożenie przetwarzania języka naturalnego nie jest łatwe, ponieważ język używany przez ludzi nie ma określonej struktury. Jest niejednoznaczny i zależy od słów kontekstowych, które mogą mieć inne znaczenie.
  • NLTK ma ponad 50 korpusów i źródeł leksykalnych, takich jak WordNet, Problem Report Corpus, Penn Treebank Corpus itp. Zawiera również przewodnik, który wyjaśnia pojęcia przetwarzania języka przez zestaw narzędzi i podstawy programowania w Pythonie, co ułatwia ludziom którzy nie mają głębokiej wiedzy na temat programowania. Ma szeroką gamę pakietów, co czyni go jednym z potężnych zestawów narzędzi dla NLP. Tokenizacja, lematyzacja, stemowanie, analiza, liczba znaków, interpunkcja, liczba słów to tylko niektóre z tych pakietów.

Zainstaluj NLTK dla Windows

Poniżej znajdują się instrukcje instalacji NLTK w systemie Windows. Opierają się one na założeniu, że Python nie jest zainstalowany w systemie. NLTK wymaga wersji Python 2.7, 3.5 i nowszych.

Krok 1: Pobierz najnowszą wersję Python na Windows z poniższego linku

https://www.python.org/downloads/

Krok 2: Kliknij pobrany plik .exe, aby go uruchomić.

Krok 3: Wybierz dostosuj instalację.

Krok 4: Sprawdź wszystkie funkcje, szczególnie „pip”, ponieważ pomaga zainstalować NLTK i kliknij Dalej.

Krok 5: Na następnym ekranie wybierz opcje zaawansowane, wybierz ścieżkę i kliknij zainstaluj.

Krok 6: Po pomyślnym zakończeniu instalacji zamknij okno.

Krok 7: Skopiuj ścieżkę folderu Skrypty, aby zainstalować NLTK w tym samym folderze.

NLTK można łatwo zainstalować za pomocą instalatora „pip”. Musimy również zainstalować „numpy”.

Krok 8: Aby zainstalować NLTK, otwórz wiersz polecenia i wpisz poniżej polecenie.

Upewnij się, że instalacja się powiodła.

Po udanej instalacji nadszedł czas na użycie NLTK do przetwarzania języka naturalnego.

Krok 9: Otwórz powłokę Pythona i wpisz poniżej polecenie.

Jeśli jest importowany bez żadnego błędu, oznacza to, że NLTK jest poprawnie zainstalowany.

Zainstaluj NLTK dla systemu Mac / Linux

W przeciwieństwie do Windows, systemy Linux mają zainstalowany w nim Python. Aby zainstalować NLTK w systemie Linux / Mac, używany jest instalator pakietów Pip Pythona. Aby zainstalować pip lub zaktualizować, wpisz poniżej polecenia w wierszu polecenia.

Aby zainstalować Pythona w systemie Linux, użyj poniższych poleceń.

Krok 1: Aby zaktualizować indeks pakietu, użyj poniższego polecenia.

Krok 2: Aby zainstalować Python w systemie Linux, skorzystaj z poniższej instrukcji.

Krok 3: Wpisz poniższe polecenie, aby zainstalować „pip” dla Python 3.

Krok 4: Po pomyślnym zainstalowaniu „Pipa” użyj następujących poleceń, aby zainstalować NLTK.

Zestaw danych NLTK

NLTK ma wiele zestawów danych dostępnych do przetwarzania w języku naturalnym, na przykład WordNet, WikiCorpus, Gutenberg, Leksykon opinii, Tweebank itp. Te zestawy danych nazywane są korpusami. Zasadniczo zestaw danych NLTK zawiera zestaw plików lub dokumentów. Każdy plik / dokument zawiera zbiór słów, liter lub tekstu w jednym języku. Korpus to zatem głównie biblioteki do rozumienia / uczenia się języka. Ma zasady gramatyki i strukturę języka.

Po pomyślnym zainstalowaniu NLTK możesz go zaimportować, a także pobrać jego korpus za pomocą następującego polecenia.

Narzędzie do pobierania NLTK otwiera okno pobierania zestawów danych. Rozmiar zestawu danych jest duży, więc zajmie to trochę czasu. Aby sprawdzić, czy zestawy danych są poprawnie zainstalowane, spróbuj zaimportować zestaw danych i użyj go.

Przetwarzanie NLTK

Istnieje 5 głównych procesów przetwarzania języka naturalnego. Są to etapy przetwarzania dowolnego tekstu.

  1. Wykrywanie EOS : Wykrywanie końca mowy dzieli tekst na zbiór znaczących zdań. Dzieli długi tekst na części, które mają pewne znaczenie.
  2. Tokenizacja : ten krok dzieli zdania na tokeny. Tokeny zawierają nie tylko słowa, ale również spacje i podziały zdań.
  3. Oznaczanie POS : POS oznacza mowę. Tutaj informacje są przypisywane do tokena. Ta informacja sugeruje, jaki jest to rodzaj mowy jako czas, czasownik, przymiotnik, rzeczownik itp.
  4. Chunking : Chunking oznacza zbieranie tekstu na podstawie tagów.
  5. Wyodrębnianie: Wyodrębnianie jest ciągłym procesem przechodzenia przez fragmenty i oznaczania ich jako nazwanych podmiotów, takich jak ludzie, lokalizacje, organizacje itp.

Wniosek:

NLTK służy do klasyfikacji tekstu, podpisów obrazowych, rozpoznawania mowy, odpowiadania na pytania, modelowania języka, podsumowywania dokumentów i wielu innych operacji. Istnieje wiele innych narzędzi do przetwarzania języka naturalnego. Ale NLTK ma szeroką gamę bibliotek, co czyni go jednym z potężnych narzędzi do przetwarzania języka naturalnego. Jest dokładniejszy niż jakiekolwiek inne narzędzie, ale z powodu dużej liczby bibliotek jest nieco powolny. Wszystko zależy więc od wymagań użytkownika. Jeśli użytkownik chce prędkości, może również preferować inne narzędzia, ale wtedy będzie musiał pójść na kompromis z dokładnością treści. Ale jeśli dokładność jest priorytetem, zdecydowanie powinni wybrać NLTK.

Polecane artykuły:

To był przewodnik po instalacji NLTK. Tutaj omawiamy podstawową koncepcję i różne kroki instalacji NLTK w Windows i Linux \ Mac. Możesz także przejrzeć następujące artykuły, aby dowiedzieć się więcej-

  1. Zainstaluj pulpit nawigacyjny Kubernetes
  2. Jak zainstalować JDK
  3. Zainstaluj Docker
  4. Jak zainstalować Magento?
  5. Wersje Magento | Funkcje wersji Magento