Na co dzień pracujesz z danymi i tworzysz raporty? Masz dosyć zastanawiania się, jaki rodzaj wykresu najlepiej przedstawi Twoje dane? A może chciałbyś wyjść poza utarte ścieżki i zacząć tworzyć ciekawe wizualizacje?
Dołącz do naszego webinaru i poznaj Qlik Insight Advisor, narzędzie, które pomoże Ci dobrać odpowiednie wykresy do Twoich danych i stworzyć czytelny raport.
Witam na dzisiejszym webinarze który będzie poświęcony wizualizacji danych. Ja się nazywam Piotr Dębowski, jestem starszym konsultantem Qlika z dziesięcioletnim doświadczeniem we wdrażaniu i szkoleniu z tego produktu. Dziś chciałbym podzielić się swoimi doświadczeniami w kontekście wizualizacji danych.
Podzielimy sobie ten webinar na dwie części, taką teoretyczną i praktyczną. W tej części teoretycznej przede wszystkim zastanowimy się, czym jest wizualizacja danych jaka jest jej rola no i dlaczego działa, bo to jest bardzo istotne. A także co musimy wiedzieć o tej naszej percepcji wzrokowej i poznawczej Czyli to jak widzimy i jak się uczymy, aby w pełni wykorzystać potencjał naszego mózgu w kontekście odczytywania informacji zawartych w konkretnej wizualizacji.
Spróbujemy też sklasyfikować sobie różne typy wizualizacji, ponieważ materia jest dosyć obszerna i dobrze byłoby znaleźć jakiś punkt odniesienia, gdzie my z naszymi aplikacjami analitycznymi w Qliku tutaj wkomponowuje się w te różne klasyfikacje. W dalszej części przejdziemy do czterech filarów wizualizacji według Noah Iwińskiego, który jest takim ekspertem w swojej dziedzinie.
Napisał też kilka książek związanych z wizualizacją danych i ogólnie takim ogólnie pojętym procesem projektowania wizualizacji Dziękuję za uwagę Aby dowiedzieć się, co musimy zrobić, aby wizualizacja odniosła sukces, dowiemy się też, gdzie w całym procesie znajduje się wybór odpowiedniego wykresu i wiele osób może się zdziwić że nie jest to pierwsza rzecz, od której powinniśmy zacząć naszą drogę.
Przedyskutujemy też krótko jakie znaczenie i wpływ ma na naszą wizualizację każdy z tych filarów. Przy okazji omawiania wyboru docelowej wizualizacji spróbujemy zastanowić się, z jakich pomocy możemy korzystać w tym procesie poza oczywiście naszym doświadczeniem i wiedzą, jaką posiadamy. Tutaj przede wszystkim skoncentrujemy się na tych wbudowanych mechanizmach Qlik Sense, które próbują rekomendować nam pewne wybory wizualizacji Jak i ogólnodostępne w internecie takie ściągawki, które klasyfikują różnego rodzaju wykresy w takie kategorie.
Później przejdziemy do części praktycznej, w której wykorzystamy Qlik Sense i przykładowy zbiór danych sprzedażowych do stworzenia takiej prostej aplikacji analitycznej. Celem będzie po prostu szybkie wczytanie i połączenie danych takimi logicznymi relacjami. Następnie skoncentrujemy się na tych wbudowanych mechanizmach, które wspierają nas w tym procesie doboru wizualizacji oraz odkrywaniu nowych wniosków.
Mówię tu przede wszystkim o tym asystencie wykresów oraz generatorze wniosków. Następnie utworzymy sobie jedną miarę najbardziej podstawową, jaką jest sprzęt Sprzedaż I spróbujemy się zastanowić nad tymi ogólnymi ścieżkami, którymi możemy podążyć w procesie wizualizacji. I to powinno nam naocznie uwydatnić fakt, w jak wielu kierunkach analitycznych możemy podążyć oraz jak wiele decyzji projektowych po drodze musimy podjąć.
I przypominam na podstawie jednej miary. Na
początku naszej drogi są dane, które same w sobie nie niosą ze sobą żadnej informacji. Natomiast na końcu drogi którą chcemy pokonać jest wiedza która w tych danych jest ukryta. I aby z powodzeniem pokonać tą drogę dane muszą zostać zakodowane na potrzeby tej transmisji W tym przypadku wizualizacja staje się formą kanału transmisji.
Z tego powodu głównym celem nas jako projektantów wizualizacji jest uzyskanie rezultatu, który będzie łatwo i efektywnie zrozumiany przez odbiorcę. Wszystkie nasze wybory projektowe powinny być ukierunkowane na spełnienie tego celu. Wizualizacja danych często mylnie utożsamiana jest tylko z przyciągającym wyglądem wykresu raportu czy kokpitu analitycznego.
A przecież sednem tego procesu jest wsparcie w interpretacji danych w sposób jak najbardziej jasny i skuteczny. Tutaj między jeszcze tą drogą od danych do wiedzy Mamy jeszcze etap pośredni, jaki jest zbieranie pojedynczych informacji wniosków. Jak pracujemy dłużej z danymi w jakiejś aplikacji analitycznej i zbieramy pewną ilość wniosków i informacji, które początkowo mogą nie być ze sobą powiązane, na tej bazie po połączeniu tych różnych informacji w całość często buduje się wiedza, która może prowadzić do jakichś działań czy to ulepszających jakiś proces sprzedażowy, czy marketingowy, czy inne.
Po
co wizualizować dane? Parafrazując słowa Johna Duke’a, który był wielkim orędownikiem eksploracyjnej opartej na wykresach i wizualizacjach analizie danych można powiedzieć, że wizualizacja służy… Nam do tego abyśmy dostrzegali w danych to, czego nigdy się nie spodziewaliśmy. Na bazie tych słów szwagier Johna Tukeya w latach 70.
przygotował cztery zbiory danych, nazywane dzisiaj kwartetem Anscombe. W każdym z tych czterech zbiorów danych mamy te same podstawowe wartości statystyczne. Średnie wariancje, współczynniki korelacji czy regresji liniowej.
Można powiedzieć, że opis statystyczny tych zbiorów danych jest prawie identyczny. Natomiast gdy te same dane przedstawimy w formie graficznej, widzimy że charakter tych danych jest, zupełnie odmienne. Możemy zauważyć na pierwszym wykresie pewien trend, na drugim pewną parabolę i zmienność przy zmieniającej się zmiennej x2.
Na trzecim wykresie łatwo możemy wykryć wartości odstające, a czwarty to jest zupełnie też wartość odstająca oraz koncentracja pozostałych elementów zbioru danych. Tak więc możemy zauważyć, że z punktu widzenia wizualizacji te zbiory wyglądają zupełnie inaczej. W tamtych czasach badacze byli zachłyśnięci wręcz liniowymi zależnościami oraz możliwościami użycia regresji liniowej do analizy danych i opisu zjawisk.
Wydawało się, że wszędzie można zastosować te cudowne narzędzia i utrzymać taki krótki, zwięzły opis charakteru zależności. Natomiast w tym przypadku możemy podsumować to, że statystyka pozwala nam na opisanie świata, ale tylko grafika statystyczna pomaga pojąć nam sens tych danych.
Na bazie tego, co zobaczyliśmy w kwartecie Anscompa, możemy wysunąć wniosek że nasz mózg jest swoistą maszyną do wykrywania wzorców. I to wykrywanie wzorców można powiedzieć, dzieli się na takie dwie kategorie. Pierwsze to jest takie podświadome przetwarzanie wizualne i to są takie wszelkie czynności, które wykonujemy, Zanim przejdziemy do takiego świadomego skupienia uwagi.
Badania mówią o tym, że te pewne wzorce wykrywamy w przeciągu 200 milisekund lub krócej. I tutaj na tym slajdzie mamy zebrane te najistotniejsze elementy na które zwraca uwagę nasz mózg. Jest to orientacja linii długość linii grubość, wielkość, kształt zakrzywienie, zaznaczenie czy otaczanie jakiejś grupy czy jednego elementu.
Jest to ruch, jest to odcień koloru czy jego intensywność. Ważna jest też pozycja oraz doskonale mózg sobie radzi z grupowaniem Przeróżnych elementów.
Czyli to są ogólnie elementy takie podświadome, które użytkownik tej naszej wizualizacji, którą przygotujemy, jakby odbierze podświadomie. Pamiętajmy, że zbyt duża ilość takich charakterystyk może być przytłaczająca dla użytkownika i przekaz może zostać zaciemniony. Po
zakończeniu tego podświadomego procesu skanowania danej wizualizacji pod kątem przyciągnięcia naszej uwagi następuje ten etap skupionej uwagi. Kolejna kategoria związana jest w zasadzie z tymi samymi atrybutami. Tylko zostały one zbadane pod innym kątem, a mianowicie pod kątem dokładności. Badania te wykonane przez Cleveland i McGilla w 1984 roku uznano za przełomowe.
Wynikało z nich, że każdy tak naprawdę ma różne postrzeganie wizualizacji, natomiast jest kilka prostych powtarzalnych metod które są wspólne dla nas wszystkich. I poprzez serię badań udało się ustalić które te markery są dla nas najłatwiejsze do odczytywania. I tutaj patrząc od góry, od lewej przede wszystkim najlepiej…
Jesteśmy w stanie rozpoznawać pozycje, czyli pewne dane ilościowe zakodowane poprzez pozycje są bardzo łatwe dla nas do skonsumowania, jeśli chodzi o porównywanie, jak i o precyzyjne określenie jaka to jest wartość. Dalej mamy długość, pochylenie i kąt, dalej mamy obszary wielkości, rodzaj symboli i również jakieś tam nasycenia czy natężenia kolorów.
Musimy sobie zdawać sprawę, że jeśli chodzi o pozycje i długość to można powiedzieć, że one są bardzo precyzyjne, natomiast wszystkie te inne parametry… jest duża przepaść między tymi pierwszymi Dwoma atrybutami, a resztą. Natomiast oczywiście mogą one być wykorzystywane w różnych innych kontekstach, także do kodowania jakichś informacji na naszych wykresach czy wizualizacjach.
Tak więc nasze przyszłe decyzje projektowe będą przede wszystkim uwzględniały atrybuty przyciągające uwagę, w tym te nieświadome oraz atrybuty słyszące do precyzyjnego porównywania dowolnych wielkości.
Powinniśmy pamiętać o tym, że podczas odczytu wizualizacji lub każdego innego typu komunikacji odbiorca informacji ma ograniczoną ilość wydolności umysłu, którą może poświęcić na ten proces. Część energii zostanie poświęcona na przetworzenie tego przekazu, pozostała jego część na zrozumienie, o ile odbiorca nie popadł już we frustrację.
Odniesienie sukcesu w tym procesie jest możliwe wówczas, gdy ułatwimy proces zrozumienia przekazu zawartego w wizualizacji poprzez ich odpowiedni dobór, który jest łatwo odbierany przez nasz mózg. Każdy element naszych wizualizacji powinien wspierać ten proces, a jeśli tak nie jest, to element ten wprowadza szum informacyjny.
To co właśnie omawialiśmy na poprzednich dwóch slajdach czyli po pierwsze dobór atrybutów, zaplanowanie złożoności przekazu. W danym widoku analitycznym, czy wizualizacji, czy ilość obiektów i rodzaj obiektów które dobieramy w layoucie obok siebie. Czy one są ze sobą w jakiejś relacji, czy po prostu nie przerywamy jakiegoś ciągu myślowego czy jakiegoś flow analitycznego na naszym dashboardzie.
Pamiętajmy też, że projektując aplikacje analityczne, na przykład w Qliku na których użytkownicy pracują cyklicznie, musimy brać pod uwagę również taką krzywą uczenia dla takiej aplikacji Ten proces staje się coraz efektywniejszy i łatwiejszy dla takiego użytkownika. Można powiedzieć, że następuje taki proces uczenia percepcyjnego.
W przypadku gdy będziemy przygotowywać wizualizację jednorazowo, jakąś infografikę, to wiadomo że często użytkownik odbiorca tylko raz ją odczyta i to musi być bardzo efektywne. Natomiast jeżeli mówimy o aplikacjach które są cyklicznie wykorzystywane, to tu oczywiście ta wydolność umysłu i te możliwości użytkownika na pewno z czasem się zwiększają.
Teraz spróbujemy sobie zerknąć na klasyfikację wizualizacji funkcji formy i funkcji zaproponowaną przez Jonathana No i tak, pierwszą funkcją jest forma, czy statyczna czy interaktywna. I funkcja wyjaśniająca lub nastawiona na odkrywanie. No i tak patrząc od góry funkcja statyczna wyjaśniająca to mogą być różnego rodzaju infografiki, można powiedzieć nawet z ograniczoną ilością wykresów i elementów które odbiorca ma poddać analizie.
Tu raczej wszystko skierowane jest na wyjaśnieniu objaśnieniu pewnych tez popartymi jakimiś danymi. Jest to forma czysto statyczna nie interaktywna. Może być też forma statyczna ale z elementami odkrywania. To również może być infografika, ale rozszerzona o wykresy o jakieś wizualizacje gdzie odbiorca przez chwilę może się zastanowić i wysnuć jakieś swoje dodatkowe wnioski z takiego artykułu czy infografiki.
Nadal jest to forma statyczna natomiast jesteśmy w stanie konkretne wizualizacje interpretować samodzielnie. Dalej wchodzimy na pole interaktywności. Sami możemy zadecydować że nasza aplikacja będzie ukierunkowana na wyjaśnianie. Mamy jakieś określone KPI, które Ktoś ma realizować, możemy przygotować prostą aplikację, która jakby rozlicza te działania.
Odbiorca takiej wizualizacji dokładnie zna te wskaźniki, jakby reaguje w prosty sposób. Taka aplikacja może być ograniczona ilością filtrów złożonością, raczej uproszczona i może stanowić taką formę wyjaśniającą. No i ostatni przykład, ta forma interaktywna z odkrywaniem, czyli ta aplikacja może być już dosyć złożona, może zawierać wiele wskaźników, duże możliwości filtrowania oglądania danych z różnej strony.
No i tu dajemy użytkownikowi jak największe pole do popisu jeśli chodzi o odnajdywanie tych, tych własnych wniosków To oczywiście tak patrząc na platformę Qlikową też tak naprawdę możemy przygotowywać każdy typ wizualizacji. Jeżeli weźmiemy np. nprinting, możemy przygotowywać wysyłki statyczne załóżmy dla przedstawicieli handlowych, które będą czysto wyjaśniające i statyczne, i które będą ukierunkowane na jakieś działania, czyli wynik twój jako przedstawiciela jest taki, Powinieneś realizować czy poprawić sprzedaż tu i tam.
Może być forma statyczna ale właśnie w formie tego odkrywania, czyli nadal jest to raport statyczny ale może być uzupełniony wykresami czyli takimi elementami statycznymi, ale które przedstawiciel terenowy może poddać jakiejś analizie, żeby wyciągnąć jakieś wnioski do działania na swoim terenie. Mogą to być różnego rodzaju aplikacje osadzone, bardzo uproszczone, takie jakieś mashupy, czyli wyciągnięte kilka wykresów na potrzeby spełnienia konkretnej potrzeby informacyjnej.
Ostatecznie może to być też pełni interaktywna, duża aplikacja dająca nam największą swobodę w drążeniu i odkrywaniu naszych danych
Teraz możemy przejść do takich dwóch metodologii projektowych, tak pół żartem pół serio.
Mamy wykres na osi Y mamy fajerwerki, czyli wszystkie elementy graficzne, które robią ten efekt wow, kiedy otwieramy daną aplikację analityczną czy wizualizację. I mamy też na osi X okres trwałości takiej aplikacji. Jedno podejście mówi o tym, że koncentrujemy się zasadniczo tylko na tej warstwie prezentacyjnej.
Często słyszymy przygotuj tu ładne wizualizacje. Przestajemy mocno interesować się w ogóle celem stworzenia danej wizualizacji jakimś celem biznesowym. Nie analizujemy zawartości danych które będziemy obsługiwać poprzez tą wizualizację czy aplikację. No i efektem może być… Ładna, przyciągająca oko wizualizacja czy aplikacja.
Natomiast czasem może się okazać, że ta część informatywna, ta, która jest później kluczowa i ona uwydatnia się w dłuższej pracy z aplikacją, ponieważ użytkownik wtedy widzi faktyczne korzyści jakie wynikają z korzystania z tej, a nie innej aplikacji. Bo ostatecznie mamy dane, ale poprzez wizualizacje i aplikacje analityczne Oczekujemy odpowiedzi.
Jeżeli tych odpowiedzi nie uzyskujemy, to nieważne jaki efekt wow zrobiłaby część wizualna takiej aplikacji, no to niestety jej użytkowanie z czasem będzie na pewno spadać aż może zaniknąć. Natomiast drugie podejście mówi o tym, że do budowania wizualizacji aplikacji analitycznej podchodzimy bardziej rzetelnie, określając jasno cel, definiując co tak naprawdę chcemy zrobić, następnie definiując zawartość, jakie dane użyjemy, w jaki sposób, żeby najlepiej odpowiedzieć na zadane pytania i ostatecznie wybór odpowiedniej wizualizacji dla danego typu danych czy danego pytania.
No i… Efekt takiej dobrze opracowanej strony informatywnej powoduje że taka aplikacja może żyć bardzo długo ponieważ daje nam ona odpowiedzi których szukamy, a niekoniecznie ten efekt fajerwerków wizualizacyjnych nie stanowi tutaj tego kryterium sukcesu.
Czyli ostatecznie musimy sobie zadać pytanie, czy przygotowujemy zabawkę, czy faktyczne narzędzie. Cztery filary udanej wizualizacji według Nowa-Kilińskiego mogą stanowić taki zawsze punkt odniesienia, jeżeli gdzieś utkniemy z jakąś wizualizacją, zawsze możemy do tych filarów wrócić i sprawdzić czy na etapach Poprzednich nie, popełniliśmy jakiegoś błędu albo mamy jakiś brak informacji, który uniemożliwia efektywne zwizualizowanie jakiegoś zakresu jakiegoś pytania biznesowego.
Po pierwsze jest to cel, czyli dlaczego daną wizualizację chcę przygotować, co jest ważne, dla kogo ona będzie, tam będą te wszystkie odpowiedzi które będą determinowały cel. Zawartość czyli które dane mają znaczenie Jakie związki mają znaczenie w tych danych. Więc tutaj już będziemy bardziej koncentrowali się na źródłach danych pod kątem realizacji naszego celu biznesowego.
Ale jest struktura, czyli jak będziemy chcieli tą informację przekazać odbiorcom. To tu, w tym punkcie dopiero następuje wybór konkretnej wizualizacji danych czy typu wykresu. Tak, czyli przedtem mamy dwa wcześniejsze bardzo ważne punkty zanim nastąpi sama decyzja jak chcę zwizualizować dane na jakie pytanie szukam odpowiedzi.
Ostatnim punktem jest formatowanie Czyli jeżeli już te poprzednie trzy punkty zrealizowaliśmy, mamy podstawowe jakąś bazę naszej wizualizacji, więc teraz poprzez formatowanie staramy się uwydatnić to wszystko, co jest istotne, a ukryć to, co ma mniejsze znaczenie, żeby ta nasza wizualizacja przekazała to, czego oczekuje od nas odbiorca, albo co my uważamy za istotne, a odbiorca powinien spróbować to przemyśleć i zauważyć.
W
przypadku określania celu najistotniejsza będzie tutaj praca z odbiorcami naszej wizualizacji czy raportu czy aplikacji analitycznej, ponieważ to oni mają tą wiedzę co tak naprawdę jest ważne. Czemu chcemy to przygotować i jakie typy użytkowników wystąpią, czy to będą użytkownicy zaawansowani czy nie, co tak naprawdę, jaka jest potrzeba którą chcemy zrozumieć poprzez naszą wizualizację, jakie być może działania mają nastąpić, jeżeli coś wykryjemy poprzez wskaźniki w tej aplikacji, na jakie pytania będziemy szukać odpowiedzi być może co chcemy monitorować albo jaki problem chcemy rozwiązać, monitorując jakiś wskaźnik, w jakiej formie będziemy konsumować wizualizację, to też będzie determinowało nasze wybory wizualizacyjne Tak więc różne ceny mogą wymagać różnych podejść Chyba takim jednym z gorszych podejść może być próba określenia wszystkich potrzeb samodzielna przez dewelopera takiej aplikacji.
Tak biorę dane i na podstawie tego próbuję sam przewidzieć wszystkie potrzeby użytkowników. To często kończy się źle, a jeszcze gorszym podejściem jest od razu przejście do budowania wizualizacji i takiego szybkiego wytworzenia czegoś ale tak naprawdę nie wiadomo czego, ponieważ bardzo dużo jesteśmy w stanie wytworzyć wizualizacji układów raportowych, co niekoniecznie wszystko musi składać się na jakąś logiczną całość, a tym bardziej na realizację określonych jakichś celów biznesowych.
Przechodząc do kolejnego filaru jaką jest zawartość, możemy wpaść w kolejne pułapki, które są zastawiane na projektanta wizualizacji danych. Wszystko związane jest z samymi danymi i dwoma pytaniami, które dane mają znaczenie i jakie związki mają znaczenie. Najczęstszą pułapką w dzisiejszych czasach jest pokazywanie zbyt dużej próba pokazania zbyt dużej ilości danych.
Wynika to z tego, że zbieramy coraz większe ilości i coraz obszerniejsze wolumeny danych. Często osoby biznesowe czy osoby, które będą korzystać z aplikacji analitycznych Narzucają nam ten zbyt szeroki zakres danych ze względu, z jakiejś może obawy, że coś zostanie pominięte, co zazwyczaj nie przykłada się na rzeczywistość.
I tu wracamy jakby do tego celu. Jeżeli cel jest dobrze zdefiniowany, to dużo precyzyjniej jesteśmy w stanie powiedzieć, które dane mają znaczenie. Nie chodzi nawet o pewne elementy danych ale możemy mieć na przykład dane sprzedażowe z 20 lat, ale jeżeli koncentrujemy się na bieżącej efektywności a charakter sprzedaży naszych produktów zmienił się w ostatnich dwóch trzech latach to naturalnie to może prowadzić do skrócenia tego horyzontu danych który…
Poddamy analizie. To jest jeden z przykładów który umożliwia nam precyzyjniejsze dobranie zestawu danych, które później trafią do naszych wizualizacji. Natomiast idea prezentowania jak największej ilości danych jest dla wielu osób, szczególnie nietechnicznych kusząca ze względu, że po pierwsze te zasoby są duże.
Po drugie możemy chcieć zaimponować ilością tych obsłużonych danych czy ilością wskaźników, albo po prostu dlatego, że w narzędziu jest to możliwe i możemy wyprodukować przepastne ilości kombinacji naszych wizualizacji. Ale znowu to może nas oddalać od tego celu głównego do którego ciągle powinniśmy wracać jako tej definicji Która powinna ten zakres naszej wizualizacji i aplikacji utrzymać w ryzach.
Tak więc na ile to możliwe powinniśmy dążyć do precyzyjnego określenia tej wartości i celów. Tutaj pokaż wszystkie dane to jest takie skrajne podejście. Natomiast na przykład analiza sprzedaży też może to być zbyt otwarte. Ale poprzez wywiady możemy określić że sprzedaż za szczególnym określeniem realizacji budżetów za bieżący rok i zmiana w stosunku do poprzedniego roku.
Czyli już wiemy że koncentrujemy się w szczególności na dwóch ostatnich latach W tym monitorowanie zachowań kluczowych klientów, też to jest istotna informacja, oraz niwelowaniu nierentownych produktów. To mogłyby być już jakieś parametry, które i czasowo określają nasze dane, i tematycznie i gdzieś mamy jakieś punkty zaczepienia, w których będziemy szukać naszych jakichś wskaźników i elementów takiego ścisłego monitorowania.
W
trzecim filarze przechodzimy do struktury czyli elementu W którym będziemy podejmować decyzję o konkretnej wizualizacji, którą wybierzemy, no i różne wizualizacje Będą ujawniać różne aspekty z naszych danych i mogą służyć różnym celom. Z tego względu te decyzje nie są łatwe. Obecnie znamy kilkanaście podstawowych typów wykresów, natomiast w różnych kombinacjach robi nam się już tutaj kilkadziesiąt opcji, a dołączając do tego różnego rodzaju wizualizacje zaawansowane, mamy kilkadziesiąt lub nawet kilkaset opcji do wyboru Z tego względu warto organizować wizualizacje w oparciu o relacje które są zawarte w danych.
Tutaj mamy przykład typów relacji które wytypowali Dizajnerzy z Financial Timesa opracowują z Visual Vocabulary, który ma służyć przede wszystkim dziennikarzom w opracowywaniu jakiejś wizualizacji pod kątem ich artykułów. No i tutaj te, które zostały wytypowane to są odchylenia korelacje, rankingi, rozkład, zmiana w czasie, wielkości, skład W całości układy geograficzne i przepływ.
Później spróbujemy sobie wykorzystać jedną z takich ściągawek, żeby właśnie przygotowywać tą przykładową aplikację demo w Qlik Sensie, bo to będzie nadawało taki ogólny kierunek w analizie naszych danych. Tak zanim przejdziemy do konkretnego typu wykresu. Warto też zastanowić się, jakich wniosków poszukujemy w danych Tutaj opierając się na blogu Richarda Brata, w lutym tego roku publikował bardzo fajny post, który podsumowuje to, czego poszukujemy w danych i podzielił to na takie trzy kategorie.
Po pierwsze punkty danych Jeśli chodzi o punkty danych… Koncentrujemy się na szukaniu minimów i maksimów, szukamy tych największych outlierów czyli te wartości odstające. Szukamy różnego rodzaju punktów odniesienia, żeby dokonać porównania. Dalej również koncentrujemy się na obszarach rysowania, czyli przede wszystkim na zakresach na trendach, na takich zakresach mówiących czy wskaźnik jest w zakresie poprawnym lub nie.
Również o zbliżających się jakichś ograniczeniach, jakichś targetach do których dążymy, albo których nie powinniśmy przekraczać. I są też zdarzenia zdarzenia… To jest taki punkt informacyjny, który może dodać nowego kontekstu do danych. Bo mimo że mamy jakieś wzorce, jakiś wzorzec możemy w naszych danych odkryć, to nie wiedząc że jakieś zdarzenie się wydarzyło na przykład wprowadzenie nowego produktu czy nowy konkurent na naszym rynku, czy utrata znaczącego klienta jeżeli spróbujemy takie dane dodatkowo zawrzeć w naszej wizualizacji czy aplikacji to one zawsze będą miały takie dodatkowe bardzo ważne znaczenie.
Na przykład na tym wykresie wprowadzenie nowego produktu może nasuwać teraz wniosek że… Że ten produkt się bardzo dobrze zaczął sprzedawać i sprzedaż nasza poszybowała. W innym przypadku możemy się tylko domyślać tak, że poprawiliśmy efektywność naszej sprzedaży lub nastąpiły inne zdarzenia które wpłynęły na tą sprzedaż.
Pomocą w wyborze wykresów mogą być oczywiście różnego rodzaju ściągawki. Taką popularną z 2009 roku jest takie zestawienie doktora Abela i on tak naprawdę wytypował takie cztery kategorie czyli porównanie, rozkład, kompozycja czyli rozkład w całości, no i związki. Natomiast to było przygotowywane przede wszystkim na potrzeby tworzenia prezentacji, więc to są takie układy bardzo statyczne I oczywiście nie pogrywa to wszystkiego czy wszystkich kierunków w których możemy podążać.
Oczywiście te cztery są, można powiedzieć, krytyczne, natomiast ilość wizualizacji i typów wykresów jest znacznie znacznie większa niż tutaj przedstawiona. A wręcz Steven Few, inny ekspert zajmujący się danymi, mówi, że tutaj możemy zejść na manowce w niektórych decyzjach. Między innymi tutaj próba wykorzystania układów 3D, czy wykresów słupkowych obok siebie, które nie są zbyt efektywne.
Mamy też Chart Guide, to jest taki osoba Jeden deweloper z Holandii, który zaczął kilka lat temu przygotowywać kolejne wersje takiego plakatu de facto, który można zamówić także na stronie. Obecnie jest wersja 3.5, wkrótce ma się pojawić wersja 4. Tu też koncentruje się, te kolory mówią nam o tych grupach ogólnych czyli porównania trendy, skład, czyli porównanie jak nasz element wygląda w całości.
Są też takie dodatkowe elementy mówiące o tym, jak możemy sprawić żeby dane były bardziej czytelne dla użytkownika końcowego, więc sporo ciekawych rzeczy tu się zawiera. A może w nowszej wersji jeszcze. Tak więc… Zawsze możemy wspierać się takimi ściągawkami ich jest naprawdę sporo. Tutaj jest tylko kilka przykładów które mogą być interesujące.
Natomiast sam Stephen Few powiedział, że wielokrotnie był proszony przez firmy o przygotowanie takich zestawów wytycznych takich ściągawek ale nigdy na to się nie zgodził ze względu, że tak dużo może być kombinacji naszych potrzeb, które będą determinowały ostateczny wybór konkretnej wizualizacji i innych elementów że praktycznie nie jest możliwe stworzenie takiej jednej prostej przejrzystej wskazówki dla każdego typu a z drugiej strony też trzeba Posiadać tą wiedzę ogólną o tworzeniu wizualizacji i elementach, które wpływają na czytelność i informatywność, że też nie da się tego wszystkiego zawrzeć.
Więc jeżeli osoba posiada dużą wiedzę na ten temat, to może efektywnie korzystać z takich ściągawek. Jeśli nie, to może łatwo gdzieś pobłądzić w tym procesie.
A jeśli chodzi już o samego Qlik Sense, to też korzystając z machine learning, maszynowego uczenia czy sztucznej inteligencji, część tych elementów system próbuje nam podpowiadać. Między innymi asystent wykresów, który próbuje pomagać nam w doborze jak najlepszej wizualizacji w danym kontekście, czyli przy przekazanych wymiarach i miarach Jest też generator wniosków, który w zasadzie podpowiada bardzo dużo wizualizacji Możemy przekazywać poprzez wyszukiwanie wymiary i miary, które są dla nas interesujące i otrzymujemy wiele propozycji zwizualizowania danego zakresu.
Jak również wykorzystywane są tutaj obiekty już stworzone przez nas w aplikacji, więc to może umożliwiać uzyskiwanie większej ilości kontekstów. Także możemy to miejsce wykorzystywać do zadawania pytań poprzez filtrację.
Wybranie jakiegoś produktu klienta i kraju. Możemy szukać tutaj w tych wnioskach dodatkowych informacji dla kontekstu, którego wybraliśmy. To jest bardzo użyteczne, ponieważ nasza aplikacja może być zaprojektowana na jakieś flow analityczne. Natomiast tu możemy przyjść i zastanowić się, spojrzeć na te dane z naszej selekcji w trochę inny sposób.
Poprzez inne wizualizacje albo zestawienie wizualizacji z wielu arkuszy. No i nowością od wersji kwietniowej są też wnioski asocjacyjne, gdzie możemy się dowiedzieć coś więcej o danych wykluczonych Tutaj jest przykład selekcji na polu kraj Dowiadujemy się, że 30% marży zostało wypracowane w danym kraju, ale przełączając się na przykład na pole handlowiec, możemy się dowiedzieć, że w ramach tego kraju gdzie te 30% marży zostało wypracowane, ci cztery przedstawiciele, którzy na tym terenie tego kraju pracują, tak naprawdę odpowiadają za blisko 70% całej wypracowanej marży, ale sprzedają również w innych krajach.
Natomiast pozostali pięciu, którzy w tym kraju nie działają, odpowiadają tylko za 30% pozostałej marży. Dzięki temu przechodząc przez różne inne pola możemy spaść na wnioski których byśmy się nie spodziewali, także analizując dane, które w bieżącym filtrowaniu selekcji są wykluczone. Ostatni punkt formatowanie, czyli już stricte koncentrujemy się, mamy cel, mamy określoną zawartość czyli dane, które poddajemy analizie.
Mamy wybrane wizualizacje, czyli wybraliśmy tą wizualizację która powinna odpowiadać najlepiej na zadane pytanie. Na końcu koncentrujemy się na formatowaniu, czyli zastanawiamy się, które atrybuty użyte działają, które ewentualnie trzeba zmienić, żeby jeszcze bardziej uwydatnić ten cel i w pełni wykorzystać zawartość, którą przyjęliśmy do naszej aplikacji czy dla naszej wizualizacji.
I to jakby odnosi się do tych… Pierwszych slajdów, które mówiły o tych najefektywniejszych atrybutach, z których powinniśmy korzystać. Czyli te mniej istotne rzeczy staramy się ukrywać, a to, co jest esencją, co ma być odpowiedzią na zadawane pytania, to powinniśmy poprzez te atrybuty uwydatniać. No i sukcesem tak naprawdę jest w pełne wykorzystanie tych czterech filarów o których tutaj autor wspomina.
Nie powinniśmy zapominać o żadnym z nich. Też możemy wracać się, jeżeli pracujemy nad wizualizacją i gdzieś tam utknęliśmy, zawsze wracamy do celu i zawartości, zastanawiamy się, czy być może tutaj gdzieś nie popełniliśmy błędów. I to powoduje że Powstaje problem w wyborze konkretnej wizualizacji. No i oczywiście może być sukces albo poprzez pominięcie szczególnie etapu pierwszego i drugiego co jest nagminne, efekt naszych prac może niestety być niewystarczający.
Nawet jeżeli spróbujemy poprzez samo formatowanie gdzieś tam przypudrować ten efekt to ta część informatywna aplikacji i pozostałe elementy niestety prędzej czy później wyjdą na wierzch. Taka nasza czeklista ostateczna, wracajmy czy cel jest dobrze zdefiniowany, czy zawartość wspiera ten cel, który realizujemy, czy struktura czyli wybrane wizualizacje ujawniają tą zawartość, o którą pytamy i czy formatowanie ułatwia konsumpcję, czy to co ważne jest na wierzchu a niekoniecznie jakieś elementy rozpraszające.
I tak możemy iterować iterować do osiągnięcia pełnego sukcesu do jak najbardziej informatywnej wizualizacji czy aplikacji analitycznej.
I tak podsumowując za kolejnym ekspertem wizualizacji danych jakim jest Andy Kirk, wizualizacja jest grą decyzji. Dobra wizualizacja wynika z dobrych decyzji Aby podejmować najlepsze decyzje musimy znać wszystkie dostępne opcje i musimy wiedzieć co będzie miało wpływ na nasze wybory. Same decyzje będą efektem naszego doświadczenia, naszej wiedzy z zakresu wizualizacji danych, jak również z dobrego określenia celu i zawartości, o której mówiliśmy w tych filarach dobrej wizualizacji.
Dalej będzie odpowiedni wybór konkretnej wizualizacji Która będzie odpowiadała na konkretne pytanie w naszej aplikacji analitycznej, a na końcu formatowanie, które uwydatni to co jest istotne a ukryje to co nie Powinno zostać ukryte i nie powinno odwracać uwagi użytkownika. A teraz możemy przejść już do części praktycznej naszego webinarium.
Możemy teraz przejść do Qlik Sense, w którym za chwilę budujemy aplikację od podstaw, na podstawie przykładowych danych sprzedażowych przygotowanych wcześniej w Excelu A pobranych wcześniej z bazy danych. Natomiast na potrzeby tutaj webinara, żeby skrócić ten czas połączeń z bazą danych, wykorzystamy ten jeden plik.
Tworzymy nową aplikację. Będziemy koncentrować się na ogólnopojętej Sprzedaży możemy
przeciągnąć nasze źródło
widzimy skoro szycie mamy kilkanaście arkuszy mamy zamówienia szczegóły zamówienia już informacje co było zamawiane przez klientów mamy naszych przedstawicieli handlowych mamy produkty i klientów którzy te produkty zamawiają mamy kalendarz który ułatwi nam tutaj operowanie na wymiarach związanych z czasem oraz dostawców naszych produktów
dodajemy dane Widzimy, naszym zadaniem teraz jest stworzenie relacji ponieważ są to indywidualne tabele. Widzimy tu Qlik, rekomenduje nam pewne relacje między danymi i możemy sobie punkt po punkcie spróbować sprawdzić, czy te relacje faktycznie są prawidłowe. Zacznijmy od pierwszej znalezionej relacji między szczegółami zamówienia a produktami, po ID produktu po obu stronach.
Relacja wygląda prawidłowo, możemy ją zastosować. Przechodzimy do kolejnej relacji zamówienia i szczegóły zamówienia. Mamy ID zamówienia z kluczem mini zamówienia. To jest relacja która niekoniecznie wydaje mi się, że jest prawidłowa, bo mam tutaj również ID zamówienia w tej tabeli więc nie muszę…
korzystać z tej rekomendacji.
A mogę spróbować metodą połączenia dwóch tabel, wtedy uzyskuje dostęp do większej ilości rekomendacji przez silnik Qlikowy. No i widzimy teraz ID zamówienia z drugiej tabeli, siła połączenia jest poprawna, czyli wartości po jednej i drugiej stronie w pełni siebie uzupełniają, nie ma jakichś tutaj braków.
Przejdziemy dalej za naszymi rekomendacjami, dostawcy dostarczają produkty, OD dostawcy ID dostawcy jest OK, klienci którzy składają zamówienia OD klienta ID klienta wygląda w porządku Przedstawiciele handlowi którzy pozyskują zamówienia po ID sprzedawcy jest OK. I ostatnia relacja. Po dacie zamówienia uzyskujemy wymiary czasowe.
Też jest wszystko w porządku. Tu powinniśmy pamiętać, że sam taki model danych tak zwany zdemoralizowany, czyli że nie próbujemy łączyć wszystkich danych do jednej tabeli, już daje nam pewne informacje o relacjach, których możemy poszukiwać w tym przypadku w tej naszej analizie sprzedaży. Zauważmy, mamy nasze zamówienia, które są składane przez klientów, a klienci zamawiają produkty.
To jest już silna relacja, w której możemy poszukiwać jakie produkty są zamawiane, jacy klienci są najistotniejsi Dalej mamy handlowców czyli Którzy są najistotniejsi, którzy działają najefektywniej, tak jak są wykonywane plany sprzedażowe. Mamy kontekst czasu, czyli jak ta nasza sprzedaż w czasie się rozwija.
No i jakieś dodatki w stylu dostawców czy jakichś atrybutów związanych z samymi zamówieniami. No dobrze, dane zostały przeładowane więc możemy przejść do arkusza analizy. Oczywiście tutaj zaczynamy od pustej kartki, czyli w zasadzie wszystko w naszych rękach. Nazwiemy sobie nasz arkusz sprzedaż i zmienimy odstępy siatki na wąskie dzięki czemu uzyskamy taką większą elastyczność w dobieraniu wielkości naszych wizualizacji.
Jako że ja cokolwiek o tych danych sprzedażowych wiem, Państwo natomiast niezbyt wiemy, to spróbujmy wykorzystać nasz generator wniosków żeby zobaczyć czy system jest w stanie nam coś ciekawego w tym momencie podpowiedzieć. Przy założeniu że stworzyliśmy tylko relacje, nie podaliśmy żadnych wymiarów i miar, tak naprawdę wszystko, wszystkie wnioski początkowe będą wynikały jakby z samego generatora.
Generujemy wnioski. No
i tak pokrótce możemy się kilku wizualizacjom zaproponowanym przyjrzeć Po pierwsze mamy sumę kosztów towarów sprzedawanych według typu produktu Możemy zauważyć relacje sprzedaży ubrań. Do Obuwia, praktycznie trzykrotnie więcej sprzedajemy ubrań. Udało się także stworzyć mapę i to jest w sumie dosyć interesujące Mamy sumę sprzedaży, która nas najbardziej będzie interesowała.
Mamy sumę kosztów towarów sprzedanych i o dziwo Qlik był w stanie nawet zaproponować nasze, po pierwsze, kontury dla poziomu kraj ponieważ nazwy angielskie kraju zostały rozpoznane i połączone z konturami tych krajów, jak i miasta zostały powiązane z koordynatami danego miasta. I tak mamy sprzedaż przedstawioną na poziomie konturów i koszty towarów sprzedanych związane są z…
miastami, to od razu Pierwszy wniosek z naszego generatora. Przede wszystkim największa sprzedaż będzie powiązana tutaj z Niemcami. Jeśli chodzi o punkty danych i koszty no wiadomo im więcej klienci zamawiają, tym więcej koszt tych towarów wynosi, więc to niekoniecznie jest jakaś relacja bardzo istotna, ale tak czy siak na start jest to bardzo dobry widok.
Idąc dalej, suma sprzedaży według handlowców i typu produktu. Widzimy że w sprzedaży ubrań szczególnie Rob Carson i Tom Lindwall, największe sprzedaże generuje, ale w obuwiu już Frank Roll, który tak naprawdę na ubraniach dopiero tutaj zajmuje piąte miejsce. To też jest taki bardzo wstępny jakiś wniosek.
Kolejny jakiś rozkład sprzedaży między dostawcą z danego kraju a krajem, gdzie nastąpiła sprzedaż Też mogą być na start. Może jakaś… Bardziej wyrafinowana wizualizacja ale na przykład produkty dostarczane przez producentów z Finlandii głównie przede wszystkim sprzedają się do Niemiec tak na przykład produkty z Australii również Niemcy tak bo ta sprzedaż jest największa to co jest fajne w generatorze wniosków to tak jeżeli w tym przypadku Niemcy zaburzają i mój widok mogę przejść do filtracji normalnie wykonywać regularne selekcje i znowu wracać do tych wniosków aby gdzieś tam pogłębić analizy bieżące dobrze idźmy dalej czy coś ciekawego jeszcze tutaj znajdziemy sumy ilościowe więc jak na start Kilka interesujących wniosków możemy wysnuć.
Dalej oczywiście możemy po prostu przePłukiwać się przez różne pola które są dostępne w modelu danych aby generować inne wnioski już takie ukierunkowane, na przykład po kliencie. Już widzimy mamy 90 klientów, mamy nawet sprzedaż po klientach, więc bardzo szybko jesteśmy w stanie sobie jakieś wstępne wnioski przyjmować, które mogą umożliwić efektywniejszą dalej wizualizację, ponieważ nie musimy po stronie layoutu tworzyć tych wszystkich kombinacji wykresów, tylko szukamy jakiegoś wniosku który może być interesujący do wykorzystania już w samej aplikacji analitycznej.
Natomiast widzimy tu mamy wszystkie pola z modelu danych natomiast możemy też sobie i generatorowi pomóc w pewien sposób, Czyli wyznaczając wymiary i miary, które mają największe znaczenie. Mogę sobie wrócić do głównego arkusza do elementów głównych i zdefiniować wymiary i miary, które z mojej perspektywy, tak po określeniu celu i zawartości, będą miały dla mnie na start takie największe znaczenie.
Począwszy od wymiarów to zobaczmy sobie po kolei dostawcę, może nie jest to na start coś interesującego ale handlowiec już jak najbardziej. Z kalendarza myślę, że rok, miesiąc coś w szerszym czasie rok, kwartał mogą być interesujące. Klienci Klienci są na najwyższym poziomie przypisani do regionów następnie do krajów i tu widzimy że Qlik automatycznie wykrył dane geograficzne i spróbował w tym przypadku powiązać kontury, a w przypadku miasta koordynaty.
Niech będzie kraj i ten ostateczny klient. Z tabeli produktów typ produktu czyli podział na obuwie i ubrania. Kategorie produktów to już bardziej szczegółowe. No i sam produkt. Z samych zamówień być może na razie nie będziemy poszukiwać jakichś elementów. No dobrze, mamy dosyć spory pakiet interesujących wymiarów na stałe Nasza miara którą mamy się przede wszystkim zajmować, to jest nasza suma sprzedaży Chociaż jest ich znacznie więcej dostępnych na
start dużo łatwiej będzie się skoncentrować na tej najistotniejszej teraz wracając do wniosków możemy już korzystać z wcześniej określonych wymiarów i miar możemy tworzyć różne kombinacje na przykład interesują mnie handlowcy według sprzedaży już mamy szybki ogląd tak Rób Carson ta sprzedaż jest największa mamy jakiś przykład rozkładu i dużo łatwiej nam na przykład według lat możemy szybko się dowiedzieć tak że sprzedaż ma taką Pozytywną progresję rok do roku.
No dobrze, ale na start spróbujmy po prostu zacząć od samej sprzedaży. No i na start widzimy mamy 3 lata danych co składa się na 11,5 miliona dolarów sprzedaży. I od tego to wykorzystamy sobie jako punkt wyjścia do dalszych decyzji odnośnie wizualizacji sprzedaży. Zamykamy wnioski. Łatwo przenieśliśmy wybrane wygenerowane wizualizacje.
I to teraz będzie naszym punktem wyjścia.
Teraz możemy spróbować przejść do naszej… Ściągawki i zastanowić się w jakim kierunku możemy podążyć z tą analizą naszej sprzedaży. Dobrym punktem zaczepienia może być analiza w czasie. Wiemy już, że mamy 3 lata tej sprzedaży, więc dobrze by było mieć cały czas ten kontekst widoczny. Wróćmy do edycji.
Wybieramy rok sprzedaż.
Na początek wystarczy nam tylko taki kontekstowy widok Widzimy że sprzedaż rok do roku wzrasta Pamiętajmy też, że każdy wykres tak naprawdę jest w pełni i responsywny, mimo że widzimy tylko jakieś małe szczegóły, w każdym momencie możemy przejść do trybu pełnych szczegółów. Dobrze obok naszego wykresu też pewnie chcielibyśmy wiedzieć o zachowaniu trendu według miesięcy, czy występuje być może jakaś sezonowość.
Podobnie
skorzystamy z miesięcy i
ponownie sprzedaż.
I widzimy to jest kolejne miejsce, w którym Qlik stara nam się podpowiadać wizualizację Działa tutaj nasz asystent wykresów, czyli podając wymiary i miary pewne sugestie automatycznie są stosowane. Natomiast jeżeli jakaś sugestia niekoniecznie mi odpowiada, mogę jeszcze dalej podążać tą ścieżką i zobaczyć inne propozycje.
Załóżmy, chciałbym to w układzie zobaczyć liniowym, a
jeżeli chciałbym wprowadzić dodatkowe zmiany, bo widzimy, że ta ilość opcji, którą mamy dostępną jest ograniczona, to poprzez wyłączenie asystenta możemy precyzyjnie wskazać inne również parametry. Obszarowy jak
to wygląda możemy
dodać tytuły żeby poprawić czytelność miesięcy pierwszy wykres mamy jakiś układ
obiekty są w pełni funkcjonalne dobrze wracając do naszej ściągawki czyli mniej więcej na bardzo podstawowym poziomie wiemy co się dzieje w czasie Teraz przejdziemy do kategorii do kompozycji, czyli jak część ma się do całości, ponieważ najłatwiej będzie nam zrozumieć, jak dany element w tej całości się zawiera.
Jak spojrzymy sobie na model danych, to przede wszystkim chcielibyśmy to zbadać w dwóch kontekstach. Produktów, od ogółu do szczegółu od typu kategorii przez kategorię produktów aż do produktu. Później to będziemy mogli zastosować też do kontekstu klienckiego odnośnie regionu kraju i samego klienta.
Czyli taka dosyć ważna relacja sprzedaż produktów i do kogo.
Wracamy do edycji.
Wizualizację mogę zacząć również od zadecydowania, jaką wizualizację chciałbym użyć. Tutaj kolejne podpowiedzi Qlika, czyli jakie wymiary i miary są istotne do ustalenia aby wizualizacja mogła zostać wyświetlona. Dobrze, nas interesują produkty czyli typ produktu zostajemy przy sprzedaży. Możemy również powielić sobie dany obiekt jeżeli chcemy na jego podstawie zbudować kolejną wizualizację, czyli
tak widzimy że ubrania to jest Ponad 3 czwarte naszej sprzedaży w ostatnich 3 latach a teraz jeszcze chcielibyśmy bardziej po kategoriach produktowych bardziej szczegółowo dowiedzieć się co mamy możliwość modyfikacji zastąp
zmienię wizualizację ponieważ chciałbym, nie chcę tracić kontekstu typu produktu a jednak wykres kołowy ten kontekst musiałby stracić dlatego na wykresie warstwowym możemy teraz sobie dodać nasze kategorie dodaj kategorię
A już z tej prostej wizualizacji dokładnie wiemy, co również się dzieje w odpowiednich typach produktów. W sekcji ubrań przede wszystkim tutaj ubrania damskie, w sekcji obuwia z lekką przewagą obuwie męskie. I teraz między latami możemy już sobie drążyć dane, by sobie zbadać czy to jest stałe w czasie.
Wracamy do ściągawki, czyli jeden, jeśli chodzi o produkty zapisaliśmy sobie tą kompozycję. Teraz przejdziemy do rankingu, bo w ramach produktów kategorii produktów mamy już konkretne produkty I tutaj już pewnie sprawdzi się lepiej Inne przedstawienie produktu ponieważ produktów jest dużo.
Niekoniecznie te dwa układy sprawdziłyby się. Zobaczmy co zaproponuje nam sam.
Będziemy sobie tego miejsca zrobić trochę więcej.
Przejdźmy do ręcznego trybu zmiany układu. Zmienimy sobie orientację na poziomą. Czytelność znacznie się poprawiła. Widzimy, że w stosunku do tego widoku kompozycji, ranking dosyć efektywnie umożliwia nam rozeznanie się Na wymiarach gdzie ich ilość tych wartości jest duża. To, co nam się na pierwszy rzut oka daje zauważyć to jeden produkt, którego sprzedaż to jest blisko 3 miliony dolarów, czyli blisko prawie 30% całej sprzedaży jest tylko na tym jednym produktu generowana.
Widzimy że rok do roku ta sprzedaż wciąż rośnie, teraz sobie spróbujmy taki test zrobić, co się stanie, jeśli naszą analizę zamienimy na wszystkie produkty poza tym jednym głównym. To, co mi się rzuca w oczy to przede wszystkim w kategoriach sprzedaży zauważmy, że ubrania damskie spadły na drugie miejsce.
Teraz się okazuje że ubrania sportowe Po wykluczeniu tego jednego produktu wiodą premie. To jest dosyć interesujące.
Szybko możemy sobie teraz nadać należeć. Czyli tak, według typu
produktu według typu i kategorii i
ostatni, według
produktu. Tak teraz mamy te elementy Formatujące, ale z drugiej strony są istotne, bo pokazują nam ten flow analizy od typu przez kategorie do produktu. Teraz możemy dosyć szybko tak naprawdę zerknąć z perspektywy klientów jak to wygląda i możemy dosłownie użyć te same wizualizacje, więc szybko
kopiujemy sobie nasze układy i
tylko poprzez zmianę wymiarów szybko uzyskamy nowy interesujący widok. Czyli klienci przede wszystkim dzielą się na kilka głównych regionów
Dalej regiony
regiony zastąpimy typ produktu i
klienci dzielą się również na kraje które przypisane są do regionów zastąpimy kategorię produktów No i produkt zastąpimy klientem i
voila. Szybko możemy rozeznać się, że główną sprzedaż prowadzimy do Europy w Europie faktycznie Niemcy to jest największy nasz klient, jeśli chodzi, aha oczywiście zmieniamy od razu etykiety. Według regionów
regionów i krajów. No i ostatecznie według klientów.
No w przypadku gdy mamy już wymiary, które są w sobą w jakiejś relacji te produkty i klienci, no to kolejne selekcje mogą nam przynosić kolejne ciekawostki Wybierzemy sobie naszego najlepszego klienta Widzimy że jest tutaj wielkim fanem tego naszego najlepiej sprzedającego się produktu. Możemy zobaczyć jakie inne kategorie dla tego klienta mają znaczenie.
Możemy zobaczyć co się dzieje według latu tego klienta więc tych kontekstów zadawania pytań jest teraz ogrom.
Zbliżamy się powoli do końca naszego webinaru, więc w takim przyspieszonym trybie chciałbym pokazać jeszcze kilka kierunków analitycznych w których moglibyśmy podążać z naszymi analizami. Po pierwsze kontekst handlowców. W łatwy sposób moglibyśmy dodać kolejne wykresy które powiedzą nam coś o efektywności naszego działu sprzedaży.
Możemy tu wykorzystać takie flow, tą górną część powiązana jest z produktami, dolna część z klientami podziałem takim geograficznym. Tu widzimy, że naszym najlepszym… sprzedawcą jest Rob Carson. Widzimy jaki układ sprzedaży ze względu na typ produktu mamy według… Przedstawicieli podobnie podział regionalny tak na przykład najlepszy nasz handlowiec sprzedaje we wszystkich regionach gdzie sprzedaje nasza firma na przykład Frank Roll skoncentrowany jest tylko na Ameryce Północnej tak Helen Brolin ma nawet Frank Roll ma największy wskaźnik sprzedaży obuwia to częściowo widzimy może być powiązane z informacją o sprzedaży do Ameryki Północnej tak dodając jakiekolwiek selekcje możemy tak dowiadywać się kolejnych rzeczy tak na przykład Frank Roll w Ameryce Północnej z roku 16 na 17 zaliczył spadek natomiast w tym ostatnim roku ta sprzedaż jest najlepsza dotychczasowej trzyletniej historii dobrze patrząc na naszą ściągawkę a Moglibyśmy też pójść w kierunku rozkładu który często kojarzony jest tylko z rozkładem takim statystycznym, żeby poznać kształt danych.
My moglibyśmy go wykorzystać do bardziej interesujących układów. I tak, handlowiec według typów produktów i zauważmy że
wykorzystaliśmy tu możliwość sortowania wymiaru po sprzedaży. Dzięki temu mamy zachowaną kolejność tych naszych przedstawicieli handlowych. To także z punktu widzenia takiego doświadczenia użytkownika końcowego Daje nam takie poczucie ciągłości w analizie. I tak, każdym punktem jest w tym przypadku produkt, a na dolnym wykresie dokładnie to samo mamy rozpisane, tyle że według klientów.
Na górnym wykresie kolor mówi nam o typie sprzedawanego produktu na dole mówi o regionie do którego klient jest przypisany. Skoncentrujmy się na tym pierwszym i zauważmy, jest to nasz topowy produkt Halter Dress. Widzimy że po wstępnej selekcji podświetla nam się ten produkt także u innych handlowców.
To też jest element koncentracji uwagi, o czym mówiliśmy przy atrybutach Pre-Attentive. I tak I to jest jakby wbudowane w produkt i daje nam doskonałą możliwość zauważenia że praktycznie ten produkt jest topowy u wszystkich przedstawicieli handlowych, poza jednym u którego w ogóle ten produkt nie występuje.
Inną ciekawą rzeczą jest to, że jak wykluczymy ten pierwszy produkt, który jest z kategorii ubrań, zauważymy, że kolejne topowe produkty to są de facto obuwie, co też nie było możliwe do wywnioskowac ze wcześniejszych wykresów. Dopiero jeżeli użyliśmy tej dystrybucji, tych punktów jest dużo, możemy wpaść na dosyć ciekawe Informacje zobaczmy jak sprzedaż handlowców według klientów się rozkłada.
Widzimy tutaj Europa, u Franka Rolla praktycznie Ameryka. Północna, no i widzimy jak klienci się koncentrują, widzimy tych klientów którzy dużo rozmawiają, to jest ci, dla których możemy się koncentrować sprzedażowo, żeby nie utracić tych wpływów, ale są handlowcy, którzy mają dużą koncentrację, ale nie ma jakichś szczególnych klientów.
Znowu jak wrócimy do naszej analizy to jakakolwiek selekcja, zauważmy, nasz topowy klient u Roba Carsona, The Fasching, również sprzedaż jest generowana przez dwóch innych handlowców. A jeśli chodzi o rozkład według produktów to w szczególności widzimy że produktem Halter Dress zajmuje się tylko Rób Carson i z tego może wynikać ta duża sprzedaż Unia Lutego klienta Tak więc im dalej tym więcej możemy jakby wyciskać z samego Qlika i możliwości wyciągania kolejnych wniosków.
No i ostatni element, który moglibyśmy omówić to są jakieś związki. Do tej pory opieraliśmy się tylko na sprzedaży i w zasadzie część informacji o tej sprzedaży sobie odkryliśmy ale oczywiście moglibyśmy podążyć jeszcze w wielu, wielu innych kierunkach więc to naocznie nam pokazuje na podstawie nawet jednej miary jak daleko możemy brnąć jak dużo decyzji musimy podjąć dla tego użytkownika końcowego, żeby zwizualizować to, co faktycznie jest najistotniejsze i te relacje które mają znaczenie.
I w ostatnim widoku moglibyśmy sobie dodać kolejne miary poza sprzedażą. Ja tutaj skorzystałem ze sprzedaży, marży procentowej, ilości zamówień, to będzie wielkość naszego bąbla i rabatów. No zerknijmy sobie na produkty Jest ten nasz halter dress, który sprzedawany jest z rabatem 6% na marży 20%. Mamy oczywiście inne produkty bardziej wysokomarżowe, natomiast halter dress, no nie ma o czym mówić jest tutaj naszym topowym produktem.
Co ciekawe wykresy są bardzo responsywne. Jesteśmy w stanie robić dowolne przecięcia na dowolnej mierze by uzyskać jakieś kolejne wnioski. To co jest ciekawe to również wykorzystanie legendy Tak? Idźmy sobie od góry i zobaczmy, tak, mamy nasz jeden produkt na małej sprzedaży, ale udzielamy tam wysokie rabaty i widzimy że kolejne punkty które się zaznaczają, tak, to słaba marża może wynikać z dosyć wysokiego rabatowania.
Możemy też łatwo skoncentrować się na tych produktów gdzie rabatów nie dajemy zbyt dużych i po dokonaniu selekcji ponownie następuje przeliczenie. Mamy rabaty od 1 do 9% i wizualnie jesteśmy w stanie spojrzeć na ten segment z innej perspektywy. To samo zrobiliśmy z pierwszymi klientami i widzimy, że… To, co się rzuca od razu, a propos tych outlierów wartości odstających Babi Sox tak naprawdę jest klientem poniżej opłacalności naszej.
Nie ma dużego znaczenia w sprzedaży, bo dużo tam nie sprzedajemy, ale faktycznie rabatowanie powoduje, że część tych klientów tam osiągamy niską marżę. Natomiast ciekawe wnioski, zobaczmy naszego najlepszego klienta Teraz możemy spojrzeć jak marża rozkłada się w kontekście produktów które ten klient zamawia.
Jest sporo tych wysokomarżowych, widzimy że Halter Dress zdecydowanie tutaj,
To, co może rzucić się w oczy, to ta sprzedaż rok do roku nam spadła, z 17 na 18. Jeśli chodzi o sezonowość to ten produkt gdzieś tam po połowie roku sprzedawał się w tych trzech latach najlepiej. No dobrze, to dziękuję bardzo za dzisiejszą obecność na naszym webinarze. Polecamy się na przyszłość, na pewno będzie jeszcze wiele tematów z zakresu analizy czy wizualizacji danych które w przyszłości będziemy mogli podjąć na naszych webinarach.
Dziękuję bardzo i do zobaczenia do usłyszenia.