Sztuczna inteligencja w analizie danych klientów – poznaj Salesforce Einstein Discovery
Salesforce Einstein Discovery to narzędzie wykorzystujące wbudowane modele analizy danych, wspomagane sztuczną inteligencją. Jest częścią pakietu Salesforce Einstein Analytics, o którym możesz przeczytać na naszym blogu.
Einstein Discovery umożliwia biznesowym użytkownikom Saleforce identyfikację wzorców i zależności, występujących w zgromadzonych danych. Aby je poznać, nie trzeba budować zaawansowanych statystycznych modeli. Einstein Discovery sam, po przeanalizowaniu dostarczonych danych, wygeneruje historie biznesowe, składające się z opisów i wykresów. Pozwolą one zrozumieć, co i dlaczego dzieje się w firmie oraz zdecydować, jakie działania najlepiej podjąć w przyszłości.
W dalszej części artykułu opisujemy Salesforce Einstein Discovery na przykładzie firmy dostarczającej części samochodowe. Jej produkty sprzedawane są klientom końcowym poprzez dystrybutorów, działających w różnych regionach i branżach. W firmie tej zauważono, że średnie marże sprzedawanych produktów maleją i postanowiono zbadać, z czego to wynika.
Przygotowanie do pracy z Salesforce Einstein Discovery
Włączenie Einstein Analytics na środowisku produkcyjnym wymaga dodatkowych, płatnych licencji. Aby wypróbować możliwości Einstein Discovery (część pakietu Einstein Analytics), należy zarejestrować się na odpowiedniej stronie. Po wypełnieniu formularza otrzymuje się dostęp do środowiska Salesforce Developer Edition, zawierającego moduł Einstein Discovery.
Jak działa Salesforce Einstein Discovery?
Proces tworzenia analizy danych w Salesforce Einstein Discovery składa się z dwóch etapów:
1.przygotowanie zbioru danych:
- import danych
- obróbka danych
2.tworzenie analizy:
- wskazanie czego szukamy
- ustawienie parametrów analizy
Przygotowanie zbioru danych
Zbiór to wszystkie dane jakie posiadamy i chcemy wykorzystać w analizie.
W celu stworzenia zbioru danych możemy wykorzystać dane, które już mamy w Salesforce. Mogą pochodzić z dowolnego, pojedynczego standardowego lub utworzonego przez nas obiektu lub wiązać dane kilku obiektów, np. okazji biznesowych z kontami i kontaktami, których dotyczą.
Salesforce Einstein Discovery pozwala także bezpośrednio podłączyć się i importować dane z zewnętrznych zbiorów danych, takich jak:
- Hadoop
- Oracle
- Microsoft SQL Server
- Postgres
- MySQL
- SAP
- Netezza
Dostępną opcją jest również wskazanie pliku csv. Pozwala to importować dane właściwie z dowolnego źródła.
Po załadowaniu danych, Salesforce Einstein Discovery automatycznie wykonuje analizę ich jakości i podpowiada, jakie błędy mogą zawierać oraz jak je poprawić.
Przykładowe sugestie narzędzia:
- Discovery znajduje wartości, które występują bardzo rzadko. Ich mała ilość bardzo utrudnia szukanie wzorców pomiędzy nimi, a resztą danych. Narzędzie zaleca sprawdzenie, czy wartości są prawidłowe, nie zawierają literówek lub nie są zastępczymi nazwami pozostałych danych. Jeżeli tak, można je w łatwy sposób zamienić na prawidłowe wartości. Możliwe jest też usunięcie wskazanych wierszy ze zbioru danych.
- Jeżeli rekord zawiera datę oraz czas, Discovery sugeruje upewnienie się, czy dokładny czas jest ważny w naszej analizie, czy lepiej go usunąć.
- Jeżeli dwie kolumny zawierają taką samą nazwę, Discovery zaleca zmianę nazwy jednej z nich.
W naszym przykładzie, Discovery podpowiada, że nazwa “Bea-rings (Łoży-ska)” występuje w niewielkiej ilości rekordów. Dzięki temu możemy ją zmienić na prawidłową i częściej występującą “Bearings (Łożyska)”. Operując na kilkudziesięciu tysiącach wierszy danych, byłoby to trudne do ręcznego wychwycenia.
Salesforce Einstein Discovery samodzielnie przydziela danym jeden z trzech typów: tekst, liczba lub data. W analizach Discovery będzie badać, jak liczby zmieniają się w czasie oraz w zależności od odpowiadających im danym tekstowym. Przed zatwierdzeniem danych, należy się upewnić czy typy zostały przypisane prawidłowo. Należy na przykład pamiętać, że importując ID produktu, składające się tylko z cyfr, Discovery może je błędnie uznać za liczbę, a nie tekst.
Dodatkowo Salesforce Einstein Discovery pozwala:
- dodać kolumnę zawierającą wartość średnią, maksymalną, minimalną lub wynik podstawowych operacji matematycznych na polach liczbowych
- dla pól o typie data dodać, odjąć wskazaną liczbę dni, sprawdzić czy wartość jest przed, po lub jest równa wybranej, innej dacie
- dodać dodatkowe kolumny z innych, wcześniej utworzonych źródeł danych
- pogrupować dane po wskazanych polach i wartościach
W naszej przykładowej firmie będziemy importować dane z pliku csv, zawierającego 7 kolumn danych:
- Product – kategoria produktu
- Region – region sprzedaży
- Vertical – branża
- Close Date – data sprzedaży
- Distributor – dystrybutor
- Discount Level – poziom zniżki
- Margin – marża
Nasza firma ma do zaimportowania 32212 wierszy danych.
Import danych
Tworzenie analizy
Mając przygotowane źródło danych, użytkownik Salesforce w kilka minut może uruchomić wykonanie analizy na interesujący go temat. Nie jest mu do tego potrzebna techniczna wiedza z zakresu programowania, ani ze statystycznych modeli danych.
W celu jej stworzenia należy wybrać źródło danych i kliknąć “Create Story”. Zostaniemy wówczas przeniesieni na stronę konfiguracji, gdzie wskażemy, którą wartość chcemy zmaksymalizować lub zminimalizować. Dodatkowo możemy:
- wskazać, z których pól źródła danych chcemy budować analizę – automatycznie wybrane są wszystkie pola
- jeżeli w danych źródłowych znajdują się pola o typie data, możemy zdecydować, czy chcemy analizować zmiany wartości danych w czasie i jeżeli tak, to w jakim przedziale
- wskazać pola, które są od nas zależne i możemy je modyfikować – Einstein Discovery przeliczy, które z nich mają największy wpływ na otrzymane wyniki
- zmienić ustawienia modelu analizy: na przewidującą, jakie wyniki możemy uzyskać w przyszłości i wybrać metodę statystyczną, z której chcemy skorzystać
Ekran wyboru głównej analizowanej zmiennej i wyboru opcji analizy
Po wybraniu odpowiednich parametrów, należy ponownie kliknąć “Create Story”. Salesforce Einstein Discovery zacznie wówczas analizę danych. Czas analizy zależy od ilości dostarczonych danych oraz zaznaczonych opcji.
W przypadku przykładowej firmy wybieramy maksymalizację marży jako najbardziej interesujące zagadnienie. Przy pozostałych parametrach zostawiamy ustawienia standardowe.
Einstein Discovery wykonuje analizę danych
Co dostajemy w efekcie analizy?
Salesforce Einstein Discovery prezentuje wyniki w formie krótkich, tekstowych wskazówek oraz wykresów, odnoszących się do wskazanego parametru, który chcieliśmy zbadać (zmaksymalizować lub zminimalizować).
Narzędzie wybiera wskazówki, które uważa za najważniejsze i tworzy historię biznesową, wskazującą od czego zależy badany parametr i jak możemy wpływać na jego wartość.
Prócz tego Discovery prezentuje, zgodnie z przeprowadzoną analizą, mniej istotne wskazówki.
Możemy edytować historię, usuwając lub dodając do niej wskazówki. Gdy uznamy, że jest gotowa i odpowiada na interesujące nas pytania, możemy łatwo ją obejrzeć jako gotową prezentację i eksportować do programu Microsoft PowerPoint czy Word.
Możemy także wybrać pytanie, na które chcemy zobaczyć wskazówki – odpowiedzi. W zależności od wcześniej sprecyzowanych ustawień, do wyboru mamy:
- Co się stało?
- Co się zmieniło w czasie?
- Dlaczego to się stało?
- Co może się wydarzyć?
- Jak mogę to poprawić?
Salesforce Einstein Discovery pokazuje, w ilu procentach kolejne pola wpływają na wskazany parametr. Możliwe jest porównanie wyników w zależności od jednego parametru, kombinacji kilku parametrów, kombinacji parametrów z określonymi wartościami.
Dla każdego wyniku otrzymamy:
- wykres
- główne wnioski w formie tekstowej
- dane liczbowe pokazujące wartość dla wybranego parametru, różnicę od średniej, odchylenie standardowe, ilość rekordów
Po przeprowadzeniu pierwszej analizy danych firmy produkującej części samochodowe, Einstein Discovery wskazał, że największy wpływ na marżę ma kategoria produktu. Na wykresie oraz w opisach widać, że największe marże dają pasy bezpieczeństwa i śruby do wirników tarcz hamulcowych, a najmniejsze alternatory i klocki hamulcowe.
Analiza danych – wykres prezentujący średnią marżę (oś pionowa) w zależności od typu produktu (oś pozioma)
Na niebiesko zaznaczone są skrajne największe i najmniejsze wartości.
Na pomarańczowo zaznaczony przez użytownika produkt, poniżej jego wartość, odchylenie standardowe, różnica do wartości średniej wszystkich produktów i ilość rekordów, w których występuje.
Pod wykresem główne wnioski znalezione przez Salesforce Einstein Discovery.
W kolejnej analizie – historii, Discovery radzi przyjrzeć się jednemu z dystrybutorów, firmie Nisizu. Sprzedaje ona najwięcej produktów, dla większości ma marże powyżej średniej. Ma jednak słabe wyniki dla alternatorów (poniżej średniej marży dla tego produktu).
Porównanie marży w zależności od typu produktu (oś pionowa), gdy dystrybutorem jest firma Nisizu (słupki po lewej stronie danego typu produktu) i wszystkich pozostałych firm (słupki po prawej stronie)
W prawym górnym rogu analizy możemy zmienić pytanie na “Dlaczego tak się dzieje?” i jako badaną zmienną wskazać typ produktu “Alternator”. Otrzymamy wykres wodospadowy, prezentujący na skrajnych słupkach średni wynik dla całości danych i wynik dla wybranego parametru, a pomiędzy pola i wartości, które mają wpływ na różnicę wyników.
Wykres pokazuje, że Nisizu odpowiada za sprzedaż 35% wszystkich produktów i za 52% sprzedawanych alternatorów. Niska marża Nisizu dla alternatorów może więc mieć duży wpływ na średnią marżę całej firmy.
Lewy skrajny słupek to średnia marża dla wszystkich produktów, prawy skrajny słupek to średnia marża alternatorów w firmie Nisizu, a pomiędzy nimi wartości pokazujące przyczynę różnicy. Dla przykładu drugi słupek od lewej pokazuje spadek wartości marży, jeżeli wszystkie rekordy ograniczymy do alternatorów. Kolejny słupek to spadek wartości, jeżeli klient dostaje zniżkę ‘Gold’. Gdy zmieniamy pytanie na “Jak to poprawić?”, Discovery radzi dla Nisizu zmienić produkty z alternatorów na pasy bezpieczeństwa.
Dodatkowo Discovery zauważa, że firma Dimago ma marże powyżej średniej, ale niewielki udział w sprzedaży produktów naszej firmy.
Po przejrzeniu wszystkich powyższych historii możemy dojść do następujących wniosków:
- Nisizu to główny dystrybutor, osiągający dobre wyniki, jednak trzeba popracować z nim nad sprzedażą i marżą dla alternatorów
- powinny zostać zwiększone nakłady marketingowe na sprzedaż pasów bezpieczeństwa
- współpraca z firmą Dimago powinna zostać wzmocniona
Wyniki analizy można w łatwy sposób przekazać np. Zarządowi. W tym celu wykresy i wskazówki, które zostały uznane za najważniejsze, wystarczy wyeksportować do programu PowerPoint, otrzymując gotową prezentację.
Usprawnienie analizy
W trakcie wykonywania analizy danych, Salesforce Einstein Discovery dodatkowo ocenia jej jakość i wskazuje sposoby ulepszenia. Po zapoznaniu się z analizą i rekomendacjami poprawy, możemy zdecydować, czy chcemy z nich skorzystać. Jeżeli tak, Discovery wykona ponowną analizę.
Przykładowe sposoby usprawnień:
- Usunięcie kolumn dublujących wartości, jeżeli więcej niż jedna kolumna zawiera tą samą informację (np. źródło danych może zawierać nazwę i ID z nim powiązane).
- Usunięcie rekordów z mocno odbiegającymi od większości wartościami. Są to skrajne, prawie nie występujące przypadki, mogące zaburzać średnie wyniki, odchylenie standardowe.
- Usunięcie pól, które mają wg pierwszej analizy największy wpływ na badany parametr, a uważamy, że nie ma między nimi matematycznej zależności lub których wartości wynikają z wielkości badanego parametru.
Zalecane sposoby poprawy analizy
Salesforce Einstein Discovery to narzędzie do analizowania dużych zbiorów danych, używające zaawansowanych modeli statystycznych, wspomaganych sztuczną inteligencją.
Analizy te mogą przygotowywać osoby nie posiadające specjalistycznej wiedzy technicznej, w czasie krótszym, niż gdyby modele te były budowane od podstaw.
Dodatkowo, otrzymane wyniki są od razu zwizualizowane wykresami i opisami, co znacząco pomaga w wyciąganiu wniosków.