Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



08.07.2019

Narzędzie EDR

ESET Enterprise Inspector
08.07.2019

Usuwanie skutków awarii

Veeam Availability Orchestrator v2
08.07.2019

Indywidualna konfiguracja

baramundi Management Suite 2019
05.07.2019

Technologia Ceph

SUSE Enterprise Storage 6
05.07.2019

Szybkie i bezpieczne...

Konica Minolta bizhub i-Series
05.07.2019

Edge computing

Atos BullSequana Edge
04.07.2019

Terabitowa ochrona

Check Point 16000 i 26000
04.07.2019

Obsługa wideokonferencji

Poly G7500
04.07.2019

Laptop biznesowy

Fujitsu LIFEBOOK U939X

Python, wizualizacja danych – możliwości bibliotek Seaborn

Data publikacji: 26-11-2018 Autor: Grzegorz Kubera

W tej części kursu omawiamy kolejne możliwości bibliotek Seaborn, pozwalające w łatwy sposób wizualizować nawet skomplikowane zbiory danych. Uczymy się rysować między innymi wykresy pudełkowe i skrzypcowe.

 

Kontynuujemy poznawanie bibliotek Seaborn. Zaczynamy od przygotowania środowiska pracy. W systemie Windows na pasku zadań wpisujemy Anaconda Prompt i uruchamiamy wiersz poleceń. Następnie podajemy komendę:


conda install seaborn
conda install numpy
conda install matplotlib


Wszystkie komendy należy zatwierdzić i po kolei zainstalować biblioteki NumPy, Matplotlib i Seaborn. Jeśli zostały zainstalowane wcześniej, nie musimy robić tego ponownie. Możliwe, że wyświetli się komunikat o nowszej wersji Anacondy. W tym wypadku warto zainstalować aktualizację, wpisując polecenie:


conda update -n base conda


Po instalacji uruchamiamy Jupytera, wpisując:


jupyter notebook


Następnie otwieramy notatnik w Pythonie 3 i wpisujemy komendy:


import seaborn as sns
%matplotlib inline
sns.set(color_codes=True)
tips = sns.load_dataset('tips')
tips.head()

 

Komendy te odpowiednio oznaczają, że:

 

  • zaimportowaliśmy biblioteki Seaborn i chcąc z nich korzystać, będziemy podawać funkcje zaczynające się od polecenia sns;
  • będziemy wyświetlać wizualizacje bezpośrednio w notatniku Jupyter;
  • aktywowaliśmy style graficzne z Seaborn, które są atrakcyjniejsze i nowocześniejsze niż domyślne, zapewniane przez Jupytera;
  • załadowaliśmy zestaw danych z napiwkami (tips), który jest domyślnie wgrany w bibliotekach Seaborn;
  • wywołaliśmy dane z zestawu danych w formie tabeli.

 

Po wpisaniu ostatniej z komend zobaczymy tabelę z danymi:


Teraz poznamy popularny rodzaj wykresu, który pokazuje zależność między zmienną numeryczną a kategorią. Jest to wykres barplot.


> WYKRESY BARPLOT I BOXPLOT


Polecenie barplot pozwala np. wyświetlać średni wzrost kilku osób, jeśli dysponujemy informacjami o wzroście każdej osoby. Tu warto dodać, że wykresy barplot są często mylone z histogramami, które nie wyświetlają danych z kategorii (np. z podziałem na płeć), lecz tylko zmienne numeryczne. Wpisujemy:


sns.barplot(x='sex',y='total_bill',data=tips)

 

Otrzymany wynik będzie wyglądać jak na rys. 1.

 

Jest to wykres, który domyślnie pokazuje, jakie rachunki (total_bill) zapłacili mężczyźni (Male), a jakie kobiety (Female). Podajemy kategorię sex, aby uzyskać rozkład danych dla płci. Z naszego zbioru danych wynika, że rachunki mężczyzn były wyższe, i jest to wyraźnie widoczne na wykresie.

 

Teraz możemy dodać estymację, aby oszacować, czy mężczyźni mają zwykle wyższe rachunki niż kobiety. W praktyce mogłoby przecież być tak, że mężczyźni na ogół płacili niższe rachunki, ale jeden z nich złożył bardzo duże zamówienie i to sprawiło, że znacznie podniosła się średnia. Funkcja estymacji określi na podstawie wszystkich danych (wszystkich mężczyzn), czy są jakieś odchylenia.

[...]

Założyciel i dyr. generalny firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 10-letnim doświadczeniem i autor książki nt. tworzenia start-upów.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"