Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



24.05.2019

Konferencja IT Manager of...

W dniach 12–14 czerwca w Sopocie odbędzie się konferencja IT Manager of Tomorrow 2019. To...
24.05.2019

Ochrona sieci

Fortinet FortiOS 6.2
24.05.2019

Mniejsza złożoność

Rittal VX25 Ri4Power
24.05.2019

All-in-one NAS

QNAP TDS-16489U R2
24.05.2019

Układy SoC

AMD Ryzen Embedded R1000
23.05.2019

Wzmocniony model

Panasonic Toughbook FZ-N1
23.05.2019

Szybsze sieci

D-Link Smart Mesh Wi-Fi AC1900/AC2600/AC3000
23.05.2019

Curved 4K

Samsung LU32R590
14.05.2019

Bezpłatna konferencja OSEC...

Jako patron medialny serdecznie zapraszamy na bezpłatną konferencję OSEC Forum 2019, któa...

Usługi przetwarzania obrazów

Data publikacji: 20-12-2018 Autor: Marcin Szeliga
Rys. 1. Wykryte na wskazanym...

Inteligencję przypisuje się ludziom oraz zwierzętom. Jednak nie jest to pojęcie jednoznaczne. Czy maszyny są zdolne do samodzielnego rozpoznawania obrazów, a jeżeli tak, jak się tego uczą i do czego można wykorzystać tę umiejętność?

 

Psychologowie definiują inteligencję jako zdolność rozwiązywania problemów (Jean Piaget), umiejętność dostrzegania zależności (Charles Spear­man) lub jako zdolność uczenia się (George Ferguson). Nie ma też jednej opinii na temat istoty inteligencji – gdyby uznać za nią zdolność do twórczego, a nie tylko mechanicznego przetwarzania informacji, za inteligentnych należałoby uznać jedynie niektórych ludzi. Z drugiej strony, jeżeli przyjmiemy, że inteligencja polega na zdolności do przetwarzania informacji na poziomie abstrakcyjnych idei, za obdarzonych inteligencją można uznać nie tylko ludzi, ale również zwierzęta i komputery. Na podstawie drugiej definicji możemy określić sztuczną inteligencję (AI) jako dziedzinę zajmującą się tworzeniem obdarzonych inteligencją maszyn. Prekursor sztucznej inteligencji, Alan M. Turing, w swojej pionierskiej, wydanej w 1950 roku pracy pt. „Computing Machinery and Intelligence” sformułował test, który miał odpowiedzieć na pytanie, kiedy maszyna zachowuje się w sposób inteligentny. Według Turinga maszynę można uznać za inteligentną, gdy człowiek tester nie jest w stanie odróżnić odpowiedzi maszyny od odpowiedzi człowieka. Żeby zdać pełny test Turinga, maszyna musi posiadać zdolność przetwarzania języka naturalnego, uczenia się i stosowania zdobytej wiedzy, wnioskowania oraz rozpoznawania obrazów i poruszania się, w tym przemieszczania obiektów.

> USŁUGI POZNAWCZE

Narodziny sztucznej inteligencji jako dyscypliny naukowej datuje się na rok 1956. Uczestnicy warsztatów, w których brał udział też twórca terminu „sztuczna inteligencja” John McCarthy, sformułowali wtedy hipotezę, według której każdy aspekt uczenia się, jak również każda inna własność inteligencji mogą być opisane tak precyzyjnie, że możliwe będzie zbudowanie maszyny zdolnej do ich symulacji. Efektem przyjęcia tej hipotezy są wieloletnie, ciągle prowadzone, badania nad algorytmami uczenia maszynowego, takimi jak sztuczne sieci neuronowe.

Algorytmy uczenia maszynowego trenuje się przy użyciu historycznych danych. Podczas uczenia algorytm wykrywa ukryte w tych danych wzorce i tworzy na ich podstawie model uczenia maszynowego. Taki model może być potem używany do predykcji, czyli uzupełniania brakujących danych o nowe, nieznajdujące się w zbiorze danych treningowych, obserwacje. Przykładowo model nauczony na danych sprzedażowych może przewidzieć przyszłą wartość sprzedaży produktu, model nauczony na historiach chorób pacjentów może oceniać postępy w ich leczeniu, a model nauczony na danych opisujących działanie sieci wodociągowej – przewidywać zużycie wody, znajdować bieżące i przyszłe awarie wodociągu albo wykrywać próby kradzieży wody.

Do niedawna dane treningowe musiały mieć postać tabelaryczną – każdy wiersz takiej tabeli opisywał jedną obserwację (np. pojedynczą sprzedaż lub wyniki konkretnego badania), a każda kolumna zawierała dane o jednej cesze (np. nazwę produktu czy wiek pacjenta w momencie badania). Głębokie uczenie maszynowe, czyli podejście polegające na automatycznym rozpoznaniu i wyodrębnieniu coraz bardziej abstrakcyjnych cech, a następnie użyciu tych cech do dalszej nauki modelu, pozwoliło jako danych treningowych używać również obrazów, mowy i wyrażeń języka naturalnego. Przykładem zastosowania głębokiego uczenia maszynowego są usługi poznawcze Microsoft Azure (azure.microsoft.com/pl-pl/services/cognitive-services).

Usługi te można podzielić na dwie kategorie:
 

  • usługi umożliwiające komputerom zdobywanie nowych informacji (odbieranie bodźców zewnętrznych);
  • usługi pozwalające zarządzać już posiadanymi informacjami (wyszukiwanie i interpretowanie posiadanych informacji).


Do pierwszej kategorii usług należą: usługi obrazu (wzrok komputera), usługi mowy (słuch komputera) oraz usługi języka (mowa komputera). Druga kategoria obejmuje usługi wyszukiwania i informacyjne. W tym artykule przyjrzymy się wybranym usługom obrazu dostarczanym przez Microsoft. Firma ta udostępnia pięć usług obrazu: przetwarzanie obrazów, rozpoznawanie twarzy, indeksator wideo, content moderator i tzw. niestandardowe przetwarzanie obrazów. Można je wypróbować za darmo.

Zacznijmy od usługi przetwarzania obrazów. Naszym pierwszym zadaniem będzie odczytanie zapisanych na obrazach tekstów.

> ODCZYTYWANIE TEKSTU I ANALIZA TREŚCI OBRAZU

Jeżeli obraz zawiera tekst maszynowy, do jego odczytania możemy wykorzystać usługę odczytywania tekstu z obrazów (tinyurl.com/AI-tekst). Po wgraniu obrazu lub wskazaniu adresu, pod którym jest on dostępny, zostanie on przeanalizowany przez nauczony wykrywania tekstów model uczenia maszynowego (rys. 1). Z kolei do odczytania z obrazu odręcznie napisanego tekstu należy skorzystać z usługi Odczytywanie tekstu odręcznego z obrazów (rys. 2). Obie usługi są przykładem zastosowania konwolucyjnych sieci neuronowych do przetwarzania obrazów. W ich wypadku obrazem wejściowym są jednokolorowe obrazy, różnice w kolorze tekstów nie są brane pod uwagę, a na wyjściu zwracane są lokalizacje i treść poszczególnych tekstów. W zrozumieniu działania konwolucyjnych sieci neuronowych pomoże nam kolejny przykład. Tym razem naszym zadaniem będzie rozpoznanie gatunku sfotografowanych ptaków.

Zacznijmy od prostszego zadania – naszym celem będzie określenie gatunku widocznego na zdjęciu ptaka. Wydawałoby się, że wystarczy skorzystać z usługi analizowania obrazów. Działanie tej usługi polega na opisaniu przesłanego do analizy obrazu, przypisaniu go do kilku ogólnych kategorii, takich jak obraz czarno-biały, erotyka, treści dla dorosłych, oraz wykryciu znajdujących się na obrazie twarzy. Efekty próby wykorzystania usługi pokazane zostały na rys. 3. Pomimo że nie udało się rozpoznać gatunku widocznego na obrazie ptaka, to usługa analizowania obrazów zwróciła nam pełny opis zdjęcia. W tym miejscu warto wyjaśnić, w jaki sposób działa ta usługa.

 

[...]

 

Pracownik naukowy Wyższej Szkoły Bankowej w Poznaniu Wydział Zamiejscowy w Chorzowie; jest autorem książek poświęconych analizie danych, posiada tytuł Microsoft Artificial Intelligence MVP & MCT. 

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"