Wydajność platformy SAP HANA wynika z samej architektury rozwiązania, która jest silnie równoległa, jak również z kolumnowego przetwarzania danych.
W SAP HANA wykorzystywane są następujące innowacyjne aspekty technologiczne:
Równoległe przetwarzanie w wielu rdzeniach procesorów – wykorzystanie możliwości przetwarzania współbieżnego przez SAP HANA. Oznacza to możliwość jednoczesnego wykorzystania mocy obliczeniowej do 80 procesorów, 2 terabajtów pamięci DRAM i 5 terabajtów SSD serwera. Obecnie każdy procesor wyposażony jest w zegar taktowany częstotliwością 3 GHz, co oznacza całkowitą dostępność j na poziomie 240 gigaherców (80 CPU * 3) oraz 2 terabajty pamięci DRAM.
Kolumnowa struktura bazy danych – dane w magazynie SAP HANA przechowywane są w postaci kolumnowej. Struktury wierszy są tradycyjne, ale dzięki przetwarzaniu w pamięci operacje mogą być wykonywane szybciej niż w tradycyjnej architekturze. Dzięki kolumnowej strukturze przechowywania danych, mogą być one przeanalizowane szybciej poprzez selektywny wybór tylko tych informacji, które są wymagane do przetworzenia zapytania.
Projekcja , agregacja i kompresja dynamiczna – SAP HANA umożliwia stosowanie zasady Principle of Minimal Projection. Z bazy danych pobierane są tylko te dane, które są potrzebne do przetwarzania. To samo odnosi się do agregacji . Gdy wymagana jest agregacja dane mogą być przetwarzane dynamicznie z prędkością 12,5 – 15 milionów operacji/sek / na rdzeń.
Narzędzie SAP HANA jest też wydajne w połączeniu z innymi systemami. Firmie SIDGroup udało się zintegrować SAP HANA™ z narzędziem Business Intelligence Tableau uzyskując płynne działanie, odczyt i
wizualizację danych źródłowych z systemu SAP HANA w systemie do analizy i
wizualizacji – Tableau. Tableau jest rozwiązaniem umożliwiającym wykonywanie szybkich, prostych i
co najważniejsze – użytecznych analiz. Tableau pomaga biznesowi uzyskać
wgląd w informacje, jest użyteczne przy rozwiązywaniu zwykłych i
niecodziennych problemów. SAP HANA™, z kolei, to elastyczna,
wielofunkcyjna platforma przetwarzania danych w pamięci (in-memory)
pochodzących z dowolnych systemów biznesowych dająca bezpośredni dostęp
do wyników analiz w czasie rzeczywistym.
Przy integracji wykorzystano bazę danych
SAP HANA™ działającą na 256 GB pamięci RAM, 4 procesorach po 8 rdzeni
czyli łącznie z 32 rdzeniami.
Podczas testów udało się uzyskać
prędkość przetwarzania poniżej 1 sekundy, co dla użytkownika końcowego
oznacza praktycznie brak zauważalnych opóźnień między wykonywaną
czynnością, a uzyskanym na ekranie wynikiem. Testowano między innymi
analizę sprzedaży oraz obliczanie sumy i średniego profitu w podziale na
miasta i oddziały. Przy filtrowaniu tych danych odpowiedzi uzyskiwane z
bazy danych były jeszcze szybsze. Do połączenia Tableau i SAP HANA nie są potrzebne dedykowane narzędzia typu middleware. Tableau podłączone było bezpośrednio do SAP HANA. Na laptopie z Tableau wystarczy zainstalować oprogramowanie SAP HANA Client. Zademonstrowane podczas warsztatów połączenie Tableau z SAP HANA pokazuje jakie korzyści niesie integracja tych dwóch narzędzi.
Warto powiedzieć też o wydajności samej platformy SAP HANA i tego w jaki sposób można ją mierzyć.
Koncepcja testów wydajnościowych przedstawiona przez dr Vishal Sikka odnosi się do pomiaru rzeczywistej wydajności HANA. Wzorzec pomiarowy składa się z następujących wymiarów:
• Rozmiar danych – im więcej danych tym wolniej trafiają do systemu
• Złożoność zapytań – im bardziej skomplikowane zapytanie tym więcej czasu potrzeba na odpowiedź
• Zmienność danych – sprawdzamy jak system przyswaja informacje, gdy dane są zmienne
• Czy dane są przetworzone właściwie – weryfikacja etapu przygotowania danych
• Czas odpowiedzi – jak szybko system reaguje i daje odpowiedź na zapytanie
Nauka podpowiada nam, że ludzki mózg może wykonywać zadania w zależności od złożoności: interaktywnie przy ciągłym przepływie myśli w który się angażuje – w czasie około 800 milisekund, efektywnie, gdy jest zaangażowany – w czasie poniżej 3 sekund, a gdy nie jest zaangażowany wyłącznie w przetwarzaną informację – poniżej 8 sekund. System SAP HANA jest w stanie odpowiedzieć na zapytania użytkownika w czasie krótszym niż 3 sekundy.
Wykorzystywanie Big Data w biznesie jest już na porządku dziennym. Programy do analizy dużych zbiorów danych pozwalają szybko analizować ogromne zbiory informacji. Ostatnio czytałem o sap hana, programie do błyskawicznej analizy danych z Big Data. Pozwalają one odpowiedzieć na pytania o kierunek w jakim zmierzają wymagania klientów albo trendy zakupowe oraz wiele innych. Jedną z lepszych firm w tej branży to sidgroup.pl/oferta/analityka/sap-hana-in-memory
OdpowiedzUsuń