Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



23.04.2019

Optymalizacja zużycia chmury

HPE GreenLake Hybrid Cloud
23.04.2019

Zarządzanie wydajnością

VMware vRealize Operations 7.5
19.04.2019

Technologie open source

SUSECON 2019
19.04.2019

Wyjątkowo małe

OKI seria C800
19.04.2019

Łatwy montaż

Rittal AX i KX
18.04.2019

Technologie wideo

Avaya IX Collaboration Unit
18.04.2019

Krótki rzut

Optoma W318STe i X318STe
18.04.2019

Do mobilnej pracy

Jabra Evolve 65e
27.03.2019

Pożegnanie z systemem Windows...

System operacyjny Windows 7 wciąż cieszy się dużą popularnością wśród użytkowników...

Python, wizualizacja danych – możliwości bibliotek Seaborn

Data publikacji: 26-11-2018 Autor: Grzegorz Kubera

W tej części kursu omawiamy kolejne możliwości bibliotek Seaborn, pozwalające w łatwy sposób wizualizować nawet skomplikowane zbiory danych. Uczymy się rysować między innymi wykresy pudełkowe i skrzypcowe.

 

Kontynuujemy poznawanie bibliotek Seaborn. Zaczynamy od przygotowania środowiska pracy. W systemie Windows na pasku zadań wpisujemy Anaconda Prompt i uruchamiamy wiersz poleceń. Następnie podajemy komendę:


conda install seaborn
conda install numpy
conda install matplotlib


Wszystkie komendy należy zatwierdzić i po kolei zainstalować biblioteki NumPy, Matplotlib i Seaborn. Jeśli zostały zainstalowane wcześniej, nie musimy robić tego ponownie. Możliwe, że wyświetli się komunikat o nowszej wersji Anacondy. W tym wypadku warto zainstalować aktualizację, wpisując polecenie:


conda update -n base conda


Po instalacji uruchamiamy Jupytera, wpisując:


jupyter notebook


Następnie otwieramy notatnik w Pythonie 3 i wpisujemy komendy:


import seaborn as sns
%matplotlib inline
sns.set(color_codes=True)
tips = sns.load_dataset('tips')
tips.head()

 

Komendy te odpowiednio oznaczają, że:

 

  • zaimportowaliśmy biblioteki Seaborn i chcąc z nich korzystać, będziemy podawać funkcje zaczynające się od polecenia sns;
  • będziemy wyświetlać wizualizacje bezpośrednio w notatniku Jupyter;
  • aktywowaliśmy style graficzne z Seaborn, które są atrakcyjniejsze i nowocześniejsze niż domyślne, zapewniane przez Jupytera;
  • załadowaliśmy zestaw danych z napiwkami (tips), który jest domyślnie wgrany w bibliotekach Seaborn;
  • wywołaliśmy dane z zestawu danych w formie tabeli.

 

Po wpisaniu ostatniej z komend zobaczymy tabelę z danymi:


Teraz poznamy popularny rodzaj wykresu, który pokazuje zależność między zmienną numeryczną a kategorią. Jest to wykres barplot.


> WYKRESY BARPLOT I BOXPLOT


Polecenie barplot pozwala np. wyświetlać średni wzrost kilku osób, jeśli dysponujemy informacjami o wzroście każdej osoby. Tu warto dodać, że wykresy barplot są często mylone z histogramami, które nie wyświetlają danych z kategorii (np. z podziałem na płeć), lecz tylko zmienne numeryczne. Wpisujemy:


sns.barplot(x='sex',y='total_bill',data=tips)

 

Otrzymany wynik będzie wyglądać jak na rys. 1.

 

Jest to wykres, który domyślnie pokazuje, jakie rachunki (total_bill) zapłacili mężczyźni (Male), a jakie kobiety (Female). Podajemy kategorię sex, aby uzyskać rozkład danych dla płci. Z naszego zbioru danych wynika, że rachunki mężczyzn były wyższe, i jest to wyraźnie widoczne na wykresie.

 

Teraz możemy dodać estymację, aby oszacować, czy mężczyźni mają zwykle wyższe rachunki niż kobiety. W praktyce mogłoby przecież być tak, że mężczyźni na ogół płacili niższe rachunki, ale jeden z nich złożył bardzo duże zamówienie i to sprawiło, że znacznie podniosła się średnia. Funkcja estymacji określi na podstawie wszystkich danych (wszystkich mężczyzn), czy są jakieś odchylenia.

[...]

Założyciel i dyr. generalny firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 10-letnim doświadczeniem i autor książki nt. tworzenia start-upów.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"