Rozwiązania analityczne Big Data to przede wszystkim dostęp do ogromu nowych informacji, dzięki którym firmy mogą podejmować właściwe decyzje i trafnie prognozować, jak będzie rozwijać się ich biznes. Warto więc przyjrzeć się bliżej korzyściom, które przynosi Big Data i gdzie mogą znaleźć zastosowanie systemy tej klasy.

Najczęściej powtarzana definicja Big Data mówi o trzech V: Volume (ilość), Velocity (szybkość) oraz Variety (różnorodność). Po pierwsze, organizacje zbierają dziś ogromne ilości danych z różnych źródeł, min. transakcji biznesowych, mediów społecznościowych, czujników i komunikacji M2M (Machine-to-Machine). W przeszłości przechowywanie i przetwarzanie tych danych stanowiło na tyle poważny problem, że operacja nie była opłacalna. Jednak nowe technologie, jak Hadoop, rozwiązały większość wyzwań. Po drugie, przesyłane strumienie danych muszą być przetwarzane z dużą szybkością, na bieżąco. Tagi RFID czy inteligentne liczniki wymuszają, żeby zbierać dane w czasie rzeczywistym. Po trzecie, dane występują w różnych formatach – od ustrukturyzowanych, numerycznych zestawień w tradycyjnych bazach danych po nieustrukturyzowane dokumenty, wiadomości e-mail, nagrania wideo lub audio, dane transakcyjne, itd.

Niektórzy rozszerzają tę definicję o dodatkowe charakterystyki – zmienność i złożoność. Strumienie danych potrafią być bardzo niespójne i charakteryzować się skokowymi, chwilowymi wzrostami. Przykładem jest pojawienie się „gorącej” wiadomości w mediach społecznościowych. Takie skoki obciążenia mogą być sporym wyzwaniem, tym większym, jeśli chodzi o nieustrukturyzowane dane. Dane pochodzą z wielu źródeł, co sprawia, że trudno jest powiązywać czy porządkować informacje pochodzące z różnych systemów. Tymczasem wyszukiwanie relacji czy hierarchii jest konieczne, w przeciwnym razie można szybko utracić kontrolę nad danymi.

Potencjalne źródła danych

Big Data to zbiór danych z tradycyjnych i cyfrowych źródeł, znajdujących się zarówno wewnątrz firmy, jak i na zewnątrz. Cześć osób ogranicza ten termin do danych pochodzących z takich źródeł, jak serwisy społecznościowe czy informacji o zachowaniu użytkowników stron internetowych. Jednak eksperci uważają, że nie można wykluczać bardziej tradycyjnych źródeł, jak informacje o transakcjach, dane finansowe czy raport nt. interakcji z klientami w punktach sprzedaży czy call center. Wszystkie te informacje to Big Data, nawet jeśli danych zbieranych z cyfrowych źródeł pod względem ilości jest dużo więcej niż z pozostałych miejsc. Co więcej, często przewijają się głosy, że ilość nie ma znaczenia, aby mówić o Big Data. Ważniejsze jest to, jakich narzędzi używa się do przetwarzania zebranych danych.

Definiując Big Data, ważne jest zrozumienie, że chodzi o mieszankę danych ustrukturyzowanych i nieustrukturyzowanych. Te pierwsze to dane różnych typów i formatów zbierane, np. z interakcji między ludźmi i systemami (aplikacjami webowymi). Dobrym przykładem są logi z witryn internetowych, które mogą zawierać kombinację tekstu i obrazów, jak również dane z formularzy czy informacje o transakcjach. Wraz ze zmianami jakie w kanałach komunikacji przynosi tzw. cyfrowa rewolucja, tego rodzaju dane będą się zmieniać a także zaczną się pojawić zupełnie nowe typy.

Z kolei dane nieustrukturyzowane mają układ, który nie daje się łatwo uporządkować czy zinterpretować z wykorzystaniem relacyjnych baz danych i tradycyjnych modeli analitycznych. Często w tym przypadku chodzi o duże ilości tekstu. Metadane – takie jak wpisy z Twittera czy innych mediów społecznościowych – są dobrymi przykładami nieustrukturyzowanych danych.

Dlaczego analiza staje się tak ważna?

O Big Data dużo się mówi, ale skąd cały ten szum? Znaczenie tej koncepcji nie polega na tym, aby zebrać jak najwięcej danych. Chodzi o to, co z tymi danymi można zrobić. Można pozyskać dane z dowolnego źródła i analizować je, aby uzyskać informacje, np. jak obniżyć koszty i czas realizacji zadań, w jakich kierunkach rozwijać nowe produkty i optymalizować ofertę. Taka analiza bardzo poprawia również trafność podejmowanych decyzji.

Łącząc zbiory danych z zaawansowaną analityką, można realizować szereg zadań biznesowych, np.: określać w czasie zbliżonym do rzeczywistego faktyczne przyczyny błędów czy defektów; generować kupony w punktach sprzedaży na podstawie przyzwyczajeń zakupowych klienta; wykrywać podejrzane zachowania, zanim będą one miały negatywny wpływ na organizację.

Zastosowania Big Data w praktyce

Jednym z najpopularniejszych zastosowań analityki Big Data jest śledzenie, co klienci sklepów internetowych robią na ich witrynach – jakie strony odwiedzają, na których spędzają najwięcej czasu i kiedy opuszczają stronę. Kolejne typowe zastosowanie to Internet Rzeczy. Big Data w tym przypadku służy do zbierania danych z urządzeń i umożliwia ich analizę.

Big Data to również sposób na modernizację hurtowni danych. Te dwa rozwiązania można ze sobą zintegrować, co przynosi, m.in. korzyści w postaci poprawy efektywności operacyjnej czy możliwości przeprowadzania nowych typów analiz. System Big Data może służyć jako obszar przejściowy, w którym zapisywane są nowe dane, a następnie podejmowana jest decyzja, które z nich przenieść do hurtowni danych. W ten sposób dane stare lub rzadko używane można przechowywać poza hurtownią. Dzięki czemu narzędzia analityczne mają mniej danych do przetwarzania.

Analityka Big Data znajduje szereg zastosowań w firmach produkcyjnych. Umożliwia, m.in. śledzenie jakości produktów i wykrywanie defektów, planowanie dostaw czy wykrywanie problemów w przebiegu procesów produkcyjnych. Przynosi ograniczenie zużycia energii oraz umożliwia testowanie i symulowanie nowych procesów produkcyjnych.

Interesującym przykładem zastosowania Big Data są systemy Security Analytics. Są to rozwiązania analityki bezpieczeństwa, których zadaniem jest przetwarzanie danych i wykrywanie oznak wskazujących na atak. Mogą to być pliki logów, pliki z danymi, przechwycone pakiety sieciowe czy różne dane z systemów i sieci. Systemy Security Analytics umożliwiają osobom odpowiedzialnym za bezpieczeństwo szybkie zebranie informacji na temat ataku.

Podziel się na:
  • Facebook
  • Google Bookmarks
  • LinkedIn