Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.


10.06.2019

Inteligentne zarządzanie...

W dniach 11, 12 i 13 czerwca – odpowiednio – w Gdańsku, w Warszawie i w Katowicach,...
27.05.2019

Rozwiązania na platformie GCP

Citrix SD-WAN i Citrix ADC
27.05.2019

Chmura hybrydowa

Dell Technologies Cloud
27.05.2019

Uproszczona komunikacja

Cisco Webex
24.05.2019

Konferencja IT Manager of...

W dniach 12–14 czerwca w Sopocie odbędzie się konferencja IT Manager of Tomorrow 2019. To...
24.05.2019

Ochrona sieci

Fortinet FortiOS 6.2
24.05.2019

Mniejsza złożoność

Rittal VX25 Ri4Power
24.05.2019

All-in-one NAS

QNAP TDS-16489U R2
24.05.2019

Układy SoC

AMD Ryzen Embedded R1000

Przygotowywanie danych z programem Power BI Desktop

Data publikacji: 20-03-2018 Autor: Marcin Szeliga
Rys. 1. Lista dostępnych...

W pierwszej części artykułu przedstawiona została usługa online powerbi.com i jej funkcje pozwalające szybko i łatwo analizować i wizualizować dane. Jednak informacje te musiałyby być wcześniej odpowiednio przygotowane. W tej części przyjrzymy się programowi Power BI Desktop i jego funkcjom pobierania i przekształcania danych.

Power BI Desktop to darmowy, dostępny w wersjach 32- i 64-bitowej program łączący funkcjonalność trzech dodatków do Excela: Power Query, Power Pivot i Power View. Program ten można pobrać ze strony powerbi.com albo ze Sklepu Windows. Power BI Desktop pozwala tworzyć raporty w podobny sposób co usługa Power BI, ale w przeciwieństwie do niej daje również możliwość pobierania danych z wielu różnych źródeł i przekształcania ich (jest to funkcja modułu Power Query) oraz tworzenia biznesowego modelu danych (odpowiada za to moduł Power Pivot). Utworzone raporty można w prosty sposób publikować w usłudze Power BI lub na serwerze raportów Power BI.


Program Power BI Desktop jest regularnie aktualizowany – co miesiąc dostępna jest jego nowa, wzbogacona o owe funkcjonalności, wersja. W artykule przedstawiona została wersja z lutego 2018.

> Power Query

Power BI Desktop pozwala pobrać dane z wielu różnych źródeł, w tym ze źródeł niedostępnych bezpośrednio w usłudze Power BI. Po kliknięciu przycisku Pobierz dane wyświetlone zostanie okno dialogowe z dostępnymi źródłami danych podzielonymi na pięć kategorii: Pliki, Baza danych, Azure, Usługi online oraz Inne (rys. 1).

Praca z danymi wygląda w ten sam sposób, niezależnie od tego, z jakiego źródła zostały one pobrane. Jedynie niektóre źródła danych oferują dodatkowe funkcje, takie jak automatyczne wykrywanie relacji pomiędzy tabelami.

> Łączenie i przekształcanie danych

W pierwszej kolejności zademonstrujemy możliwości Power BI Desktop w zakresie pobierania i przekształcania danych na przykładzie publicznie dostępnych danych statystycznych. Będą to trzy arkusze Excel pobrane ze strony gapminder.org/data:

 

  • pierwszy zawiera dane historyczne o wskaźniku masy ciała (BMI) kobiet z różnych krajów. Żeby go pobrać na lokalny komputer, należy w polu wyszukiwania wpisać BMI i kliknąć ikonę Excela widoczną po prawej stronie zbioru danych Body Mass Index (BMI), women, Kg/m2;
  • drugi arkusz zawiera dane o parytecie siły nabywczej (GDP) mieszkańców poszczególnych krajów z uwzględnieniem wzrostu cen. Plik Alternative GDP/capita (PPP$, inflation-adjusted) from PWT znajdziemy, wpisując w polu wyszukiwania frazę GDP;
  • ostatni arkusz zawiera dane o populacji kobiet w poszczególnych krajach. Plik Female population, with projections można znaleźć i pobrać, wpisując w polu wyszukiwania frazę population.


Po zapisaniu wszystkich trzech arkuszy na lokalnym dysku jesteśmy gotowi do zaimportowania ich do programu Power BI Desktop. Po kliknięciu przycisku Pobierz dane należy wybrać pliki Excel i wskazać lokalizację pierwszego pliku indicator_total population female. Wyświetlone zostanie okienko nawigatora pozwalające przejrzeć zawartość źródła danych. W tym przypadku interesujące nas dane zapisane są w tabeli Tabela1. Jej zaznaczenie spowoduje odblokowanie przycisków Załaduj i Edytuj. Żeby przygotować dane do analizy, należy kliknąć Edytuj.

Wyświetlony w ten sposób Edytor składa się z kilku sekcji:

 

  • na górze znajduje się pasek menu z przyciskami pozwalającymi przekształcać i uzupełniać dane;
  • po lewej stronie widoczna jest lista zapytań Power Query. Każdy zbiór danych pobierany jest przez osobne zapytanie – jego wybranie spowoduje wyświetlanie zapytania w głównym okienku edytora oraz w znajdującym się po prawej stronie pasku ustawień zapytania;
  • w głównym okienku widoczny jest podgląd danych po wykonaniu zaznaczonego w prawym pasku kroku zapytania – domyślnie pokazywany jest efekt wykonania ostatniego kroku;
  • w pasku ustawień zapytania możemy zmienić jego nazwę oraz skonfigurować i usunąć jego poszczególne kroki (rys. 2).


Dane źródłowe mają format tabeli przestawnej. W pierwszej kolumnie znajdują się nazwy krajów, w kolejnych lata, a w komórkach populacja kobiet z danego kraju w wybranym roku. Ponieważ dane w tym formacie są trudne do wizualizacji, w pierwszej kolejności powinniśmy zastąpić kolumny wierszami. W tym celu klikamy prawym klawiszem myszy pierwszą kolumnę i wybieramy z menu polecenie Anuluj przestawienie innych kolumn.

Utworzona tabela będzie składała się z trzech kolumn. Nazwijmy je odpowiednio Country, Year i Population. Kolejnym krokiem będzie usunięcie wierszy z danymi dla kontynentów (ujemną populacją). Możemy to zrobić, klikając nagłówek kolumny Population i tworząc odpowiedni filtr (rys. 3).

Ostatnim zadaniem będzie zmiana typu kolumny Year z tekstowego na liczbę całkowitą – można to zrobić z menu kontekstowego albo przy użyciu paska menu.

 

Przeprowadzone przekształcenia zapisywane są w postaci kolejnych kroków zapytania. Z reguły kolejny krok odwołuje się do wyniku poprzedniego kroku, a całe zapytanie zwraca wynik ostatniego kroku. Żeby się o tym przekonać i zobaczyć, jak wyglądają dokonane przekształcenia zapisane w języku Power Query Formula Language, należy wyświetlić okna edytora zaawansowanego.

[...]

Pracownik naukowy Wyższej Szkoły Bankowej w Poznaniu Wydział Zamiejscowy w Chorzowie; jest autorem książek poświęconych analizie danych i posiada tytuł Microsoft Most Valuable Professional.

Artykuł pochodzi z miesięcznika: IT Professional

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"