Wprowadzenie do cyfrowego przetwarzania obrazu

Cyfrowe przetwarzanie obrazu to proces wykonywania algorytmów przetwarzania obrazów na obrazach cyfrowych. Cyfrowe przetwarzanie obrazu obejmuje przetwarzanie obrazów, takie jak odczytywanie, analizowanie i manipulowanie obrazem oraz wykonywanie dowolnego rodzaju operacji na nim, takich jak poprawianie reprezentacji informacyjnej obrazu, przetwarzanie danych obrazu w celu przechowywania, przesyłania i reprezentacji. Cyfrowe przetwarzanie obrazu jest stosowane w projektach dotyczących klasyfikacji, ekstrakcji cech, rozpoznawania wzorów itp. Techniki stosowane w cyfrowym przetwarzaniu obrazu to edycja obrazu, przywracanie obrazu, filtrowanie liniowe, pikselacja, dopasowywanie cech punktowych, analiza głównych składników, analiza niezależnych składników itd.

Co to jest obraz?

Obraz jest reprezentowany jako funkcja F (a, b), która jest dwuwymiarowa, gdzie aib są współrzędnymi przestrzennymi lub płaskimi. Zakres „F” w dowolnym punkcie (a, b) nazywany jest intensywnością obrazu w tym punkcie. Jeżeli a, b oraz wartości f są skończone, mówi się, że obraz jest obrazem cyfrowym. Obraz cyfrowy składa się z pikseli o określonych lokalizacjach i wartościach. Wartość piksela mieściła się w zakresie od 0 do 255.

Przykład:

Poniższy rysunek pokazuje obraz i odpowiadające mu piksele punktu

Obraz i jego piksele

Wyjaśnij przetwarzanie obrazu

Przetwarzanie obrazu definiuje się jako technikę ulepszania surowych obrazów zarejestrowanych za pomocą różnych czujników wizyjnych do różnych zastosowań, takich jak obrazowanie medyczne, przemysł filmowy, inteligentny transport itp. Aby zastosować techniki przetwarzania obrazu, pierwszym krokiem jest digitalizacja obrazu do pliku obrazu . Ponadto należy zastosować metody zmiany kolejności części obrazu, aby poprawić separację kolorów i poprawić jakość.

Przykład: Aplikacja medyczna wykorzystuje techniki przetwarzania obrazu do ulepszania obrazu, w tomografii i operacjach symulacyjnych. Tomografia to metoda stosowana w fotografii rentgenowskiej.

Rodzaje obrazu

  • Obraz zawierający tylko dwupikselowe elementy, które są 1 i 0, gdzie 1 oznacza biel, a 0 oznacza kolor czarny, nazywane są obrazem binarnym lub monochromatycznym.
  • Obraz składający się z jedynego koloru czarno-białego nazywa się obrazem czarno-białym.
  • Istnieje „8-bitowy obraz w formacie koloru” zawierający 256 różnych odcieni kolorów i zwykle znany jako obraz w skali szarości. W tym 0 oznacza kolor czarny, 127 oznacza kolor szary, a 255 kolor biały.
  • Innym jest „16-bitowy format kolorów”, który zawiera 65 536 różnych kolorów. W tym formacie rozkład kolorów różni się od obrazu w skali szarości.

16-bitowy format jest dalej podzielony na trzy formaty, które są czerwony, zielony i niebieski w skrócie jako format RGB.

Reprezentacja obrazu

Obraz jest reprezentowany jako tablica lub macierz kwadratowych pikseli rozmieszczonych w rzędach i kolumnach. Matlab to bardzo dobra platforma do pobierania, odczytu i przetwarzania obrazów. Posiada również zestaw narzędzi do przetwarzania obrazu. Wiadomo, że obraz jest wyświetlany jako kolumny i wiersze, jak pokazano poniżej:

To równanie jest reprezentacją tablicową obrazu cyfrowego, w którym każdy element nazywany jest pikselem.

Przykład: Aby odczytać obraz, musimy użyć następującego polecenia w MatLab

i=imread('F:\image.jpg.webp');

Po wykonaniu tego polecenia obraz zostanie zapisany w zmiennej I jako trójwymiarowa tablica lub macierz, jak pokazano na poniższym rysunku. Tablica ma rozmiar 225X224X3. Ma różne wartości pikseli w zakresie od 0 do 255.

Reprezentacja tablicowa obrazu

Po wyświetleniu obrazu za pomocą następującego polecenia:

show(i)

Możemy również zobaczyć wartości w pikselach określonego punktu, jak pokazano na poniższym rysunku. Pokazuje pozycję wskazanego piksela jako (X, Y) i wartości RGB, które są szczegółami kolorystycznymi czerwonego, zielonego i niebieskiego.

Pozycja w pikselach i wartości RGB

W MatLab różne funkcje można wykonywać na obrazach, takich jak czytanie, wyświetlanie, zmiana rozmiaru, obracanie, wyostrzanie, dodawanie szumu, usuwanie szumu, filtrowanie, wykrywanie krawędzi, wykrywanie narożników, mapowanie i wiele innych.

Fazy ​​przetwarzania obrazu

  1. Akwizycja: Akwizycja obrazu jest definiowana jako pobieranie lub pobieranie obrazu za pomocą dowolnego rodzaju czujników wizyjnych. Główna praca polega na skalowaniu i konwersji kolorów, czyli RGB na szary lub szary na RGB
  2. Ulepszenie obrazu: Ulepszenie obrazu polega na poprawie jakości obrazu przez wyostrzenie lub rozjaśnienie obrazu. Odbywa się to w celu łatwej identyfikacji jego funkcji.
  3. Przywracanie obrazu: Przywracanie obrazu zajmuje się usuwaniem szumów lub efektem rozmycia obrazu, aby poprawić jego czytelność.
  4. Przetwarzanie wielu rozdzielczości i falowanie: przy użyciu tych technik obrazy mogą być reprezentowane w kilku stopniach.
  5. Kompresja obrazu: Kompresja obrazu dotyczy rozmiaru lub rozdzielczości obrazu. Jest on stosowany do obrazu w celu zmniejszenia kosztów przechowywania i transmisji.
  6. Wykrywanie i rozpoznawanie obiektów: służy do wykrywania i rozpoznawania obrazu oraz przypisywania jego faktycznej etykiety poprzez wykrywanie cech obrazu.

Zastosowanie cyfrowego przetwarzania obrazu

  • Najbardziej znanym i użytecznym zastosowaniem przetwarzania obrazu są głębokie sieci neuronowe. Głębokie sieci neuronowe to sieci, które można trenować i testować do różnych celów przy użyciu danych obrazu. W tym obrazie surowym jest ogólnie dostępny. Dane obrazu muszą być najpierw przetworzone, a następnie mogą zostać wykorzystane do celów szkoleniowych. P.
  • ponowne przetwarzanie obrazu obejmuje redukcję szumów, usunięcie efektu rozmycia, wyrównanie intensywności za pomocą FFT i wiele innych. Dalsze funkcje danych obrazu muszą zostać wyodrębnione i za pomocą tych funkcji można szkolić sieć. Sieć ta może zostać przeszkolona do klasyfikowania wszelkiego rodzaju danych, takich jak ruch drogowy, twarze, sceny itp.
  • Wynik sieci zależy od rodzaju i jakości danych obrazu użytych do szkolenia. Istnieje wiele sieci dostępnych online, takich jak AleNet, GoogleNet, VGG itp., Które zostały przeszkolone na różnych rodzajach obrazów.

Wniosek

W tym omówiono tylko wstępną część przetwarzania obrazu. W dzisiejszym scenariuszu przetwarzanie obrazu jest bardzo szerokie. Na przykład istnieje wiele filtrów, które można zastosować do obrazu. Istnieje wiele technik, które można zastosować do obrazu do różnych celów, takich jak wykrywanie i klasyfikacja obiektów, lokalizacja sceny, rozpoznawanie twarzy, rozpoznawanie wzorów itp.

Polecane artykuły

Jest to przewodnik po cyfrowym przetwarzaniu obrazu. Tutaj omawiamy Wprowadzenie, Co to jest obraz, Rodzaje obrazu i zastosowania cyfrowego przetwarzania obrazu. Możesz także przejrzeć nasze inne powiązane artykuły, aby dowiedzieć się więcej -

  1. Biblioteki uczenia maszynowego
  2. Oprogramowanie do podpisu cyfrowego
  3. Co to jest przetwarzanie danych?
  4. Wersja MATLAB
  5. Jak zaimplementować kolor w Matlabie?

Kategoria: