Wydajność platformy SAP HANA

Wydajność platformy SAP HANA wynika z samej architektury rozwiązania, która jest silnie równoległa, jak również z kolumnowego przetwarzania danych.



W SAP HANA wykorzystywane są następujące innowacyjne aspekty technologiczne:

Równoległe przetwarzanie w wielu rdzeniach procesorów – wykorzystanie możliwości przetwarzania współbieżnego przez SAP HANA. Oznacza to możliwość jednoczesnego wykorzystania mocy obliczeniowej do 80 procesorów, 2 terabajtów pamięci DRAM i 5 terabajtów SSD serwera. Obecnie każdy procesor wyposażony jest w zegar taktowany częstotliwością 3 GHz, co oznacza całkowitą dostępność j na poziomie 240 gigaherców (80 CPU * 3) oraz 2 terabajty pamięci DRAM.

Kolumnowa struktura bazy danych – dane w magazynie SAP HANA przechowywane są w postaci kolumnowej. Struktury wierszy są tradycyjne, ale dzięki przetwarzaniu w pamięci operacje mogą być wykonywane szybciej niż w tradycyjnej architekturze. Dzięki kolumnowej strukturze przechowywania danych, mogą być one przeanalizowane szybciej poprzez selektywny wybór tylko tych informacji, które są wymagane do przetworzenia zapytania.

Projekcja , agregacja i kompresja dynamiczna – SAP HANA umożliwia stosowanie zasady Principle of Minimal Projection. Z bazy danych pobierane są tylko te dane, które są potrzebne do przetwarzania. To samo odnosi się do agregacji . Gdy wymagana jest agregacja dane mogą być przetwarzane dynamicznie z prędkością 12,5 – 15 milionów operacji/sek / na rdzeń.

Narzędzie SAP HANA jest też wydajne w połączeniu z innymi systemami. Firmie SIDGroup udało się zintegrować SAP HANA™ z narzędziem Business Intelligence Tableau uzyskując płynne działanie, odczyt i wizualizację danych źródłowych z systemu SAP HANA w systemie do analizy i wizualizacji – Tableau. Tableau jest rozwiązaniem umożliwiającym wykonywanie szybkich, prostych i co najważniejsze – użytecznych analiz. Tableau pomaga biznesowi uzyskać wgląd w informacje, jest użyteczne przy rozwiązywaniu zwykłych i niecodziennych problemów. SAP HANA™, z kolei, to elastyczna, wielofunkcyjna platforma przetwarzania danych w pamięci (in-memory) pochodzących z dowolnych systemów biznesowych dająca bezpośredni dostęp do wyników analiz w czasie rzeczywistym.

Przy integracji wykorzystano bazę danych SAP HANA™ działającą na 256 GB pamięci RAM, 4 procesorach po 8 rdzeni czyli łącznie z 32 rdzeniami.

Podczas testów udało się uzyskać prędkość przetwarzania poniżej 1 sekundy, co dla użytkownika końcowego oznacza praktycznie brak zauważalnych opóźnień między wykonywaną czynnością, a uzyskanym na ekranie wynikiem. Testowano między innymi analizę sprzedaży oraz obliczanie sumy i średniego profitu w podziale na miasta i oddziały. Przy filtrowaniu tych danych odpowiedzi uzyskiwane z bazy danych były jeszcze szybsze. Do połączenia Tableau i SAP HANA nie są potrzebne dedykowane narzędzia typu middleware. Tableau podłączone było bezpośrednio do SAP HANA. Na laptopie z Tableau wystarczy zainstalować oprogramowanie SAP HANA Client. Zademonstrowane podczas warsztatów połączenie Tableau z SAP HANA pokazuje jakie korzyści niesie integracja tych dwóch narzędzi.

Warto powiedzieć też o wydajności samej platformy SAP HANA i tego w jaki sposób można ją mierzyć.

Koncepcja testów wydajnościowych przedstawiona przez dr Vishal Sikka odnosi się do pomiaru rzeczywistej wydajności HANA. Wzorzec pomiarowy składa się z następujących wymiarów:

• Rozmiar danych – im więcej danych tym wolniej trafiają do systemu

• Złożoność zapytań – im bardziej skomplikowane zapytanie tym więcej czasu potrzeba na odpowiedź

• Zmienność danych – sprawdzamy jak system przyswaja informacje, gdy dane są zmienne

• Czy dane są przetworzone właściwie – weryfikacja etapu przygotowania danych

• Czas odpowiedzi – jak szybko system reaguje i daje odpowiedź na zapytanie

Nauka podpowiada nam, że ludzki mózg może wykonywać zadania w zależności od złożoności: interaktywnie przy ciągłym przepływie myśli w który się angażuje – w czasie około 800 milisekund, efektywnie, gdy jest zaangażowany – w czasie poniżej 3 sekund, a gdy nie jest zaangażowany wyłącznie w przetwarzaną informację – poniżej 8 sekund. System SAP HANA jest w stanie odpowiedzieć na zapytania użytkownika w czasie krótszym niż 3 sekundy.





1 komentarz:

  1. Wykorzystywanie Big Data w biznesie jest już na porządku dziennym. Programy do analizy dużych zbiorów danych pozwalają szybko analizować ogromne zbiory informacji. Ostatnio czytałem o sap hana, programie do błyskawicznej analizy danych z Big Data. Pozwalają one odpowiedzieć na pytania o kierunek w jakim zmierzają wymagania klientów albo trendy zakupowe oraz wiele innych. Jedną z lepszych firm w tej branży to sidgroup.pl/oferta/analityka/sap-hana-in-memory

    OdpowiedzUsuń