Data Mart to tabela/tabele zawierające tylko takie informacje, które są analitykowi niezbędne do pracy. Są to dane zaciągnięte z różnych źródeł, przetworzone w sposób jednolity, udokumentowany i zoptymalizowany.
Data Marty jako niezbędne narzędzie analityczne
W zależności od specyfiki działalności firmy, informacje dotyczące świadczonych usług, klientów oraz transakcji gromadzone są w różnych systemach bazodanowych oraz hurtowniach danych.
Taka organizacja danych powoduje, że wykonanie nawet prostych analiz czy raportów wymaga dużego nakładu czasu, dogłębnej wiedzy na temat wykorzystywanych systemów informacyjno-bazodanowych oraz posiadanie do nich dostępu.
Dla analityka danych taka sytuacja często jest przyczyną trudności i problemów – brak odpowiednich informacji lub czasu na dokładną analizę danych źródłowych może zaowocować błędami w trakcie prowadzonych analiz, a w konsekwencji potencjalnymi stratami finansowymi.
W takiej sytuacji, wygodnym rozwiązaniem jest budowa Data Martów.
Data Marty często zawierają agregaty na poziomie klienta, np.: średnia liczba transakcji z ostatnich 6 miesięcy, czy liczba pożyczek gotówkowych zaciągniętych przez klienta w ciągu ostatnich 12 miesięcy itp. Posiadając gotowe już wyliczone agregaty możemy sprawniej przygotować zestawienia i raporty.
Data Marty są budowane tylko raz, na początku procesu analitycznego, natomiast są cyklicznie i automatycznie aktualizowane, dzięki czemu zawierają wszystkie niezbędne informacje związane z klientami / produktami / transakcjami za dany okres czasu.

Korzyści ze stosowania Data Martów
- Usprawnienie analiz marketingowych i sprzedażowych, konstruowania raportów, tworzenia i zarządzania modelami prognostycznymi
- Oszczędność czasu – analityk danych nie musi za każdym razem, gdy chce zbudować model, pozyskiwać niezbędne dane bezpośrednio z kilku źródeł, a następnie je przetwarzać
- Zmniejszenie ryzyka powstania błędu w trakcie analizy, a tym samym zwiększenie wiarygodności jej wyniku
- Możliwość posiadania najbardziej aktualnych informacji analitycznych na potrzeby biznesowe, dzięki cyklicznej aktualizacji Data Martu
Praktyczny przykład wykorzystania Data Martu
Budowanie Data Martów przydaje się szczególnie w projektach korporacyjnych, gdzie różnorodność i rozproszenie źródeł danych oraz ilość danych jest bardzo duża. Tak było w przypadku jednego z naszych projektów. Firma posiadała kilka milionów klientów, kilkadziesiąt tabel (dane o transakcjach, klientach, produktach itd.), kilkanaście miliardów rekordów.
Struktura danych była zbyt skomplikowana, aby efektywnie budować modele scoringowe (m.in. predykcja churnu, rekomendacja produktów, targetowanie ofert). Konieczne okazało się zbudowanie Data Martu analitycznego – tak, aby wszystkie najpotrzebniejsze informacje do budowy modeli zgromadzić w jednym miejscu. W efekcie:
- Osiągnęliśmy znaczącą redukcję w złożoności danych – 1 rekord na klienta
- Zarządzanie danymi w procesie analitycznym stało się łatwiejsze (np. uzyskaliśmy efekt, w którym liczba wykonanych przez klienta połączeń na BOK konkurencji w ostatnim miesiącu była dostępna „od ręki” na poziomie klienta)
Ponadto, możliwość codziennej aktualizacji Data Martu, pozwoliło na wykorzystanie go do realizacji kampanii marketingowych. Przy konstrukcji Data Martu w tym projekcie wykorzystaliśmy nasz autorski system AdvancedMiner.
Czy jeden Data Mart wystarczy?
W zależności od wymagań biznesowych może okazać się, iż potrzebny jest więcej niż jeden Data Mart. Przed podjęciem decyzji ile i jakie Data Marty chcemy skonstruować, konieczne jest sformułowanie konkretnych potrzeb biznesowych. Innymi słowy musimy ustalić, jakich informacji potrzebujemy, jakie analizy, raporty i modele planujemy konstruować.
Podsumowanie
Data Mart analityczny jest jednocześnie efektywnym i przyjaznym narzędziem do raportowania, analizowania i modelowania. Może stanowić podstawę do dalszej rozbudowy procesu ETL dla umożliwienia zaawansowanych analiz na potrzeby np. szacowania ryzyka, automatyzacji kontroli jakości danych i weryfikacji skuteczności produkcyjnie wdrożonych modeli analitycznych.