Teradata, firma zajmującą się analityką danych, wprowadziła funkcje Teradata Columnar, która stanowi istotny postęp w technologii baz danych, pozwalający na pełną integrację tabel opartych na kolumnach i wierszach, osiągając dzięki temu nowe poziomy elastyczności, wydajności i kompresji. Teradata Columnar pozwala na szybszą pracę bazy danych Teradata i umożliwia osiągnięcie wysokiego stopnia kompresji.
Dzięki zaawansowanej architekturze Teradata Columnar stanowi ona najbardziej kompletne, gotowe do użycia środowisko dla organizacji stojących przed problemem dostarczania analiz z coraz szybciej rosnących wolumenów danych typu Big Data.
Teradata Database 14 w wersji Data Mart Edition dostępna jest także, jako oprogramowanie instalowane na platformach sprzętowych firm trzecich, oraz jako Teradata Express dla rozwiązań przetwarzania w chmurze.
Inaczej niż w przypadku relacyjnych baz danych, które przechowują dane jedynie w wierszach, kolumnowa baza danych przechowuje informacje w kolumnach. Działając niezależnie każda z tych metod daje wyjątkowe korzyści, w zależności od konkretnego zastosowania i rodzaju danych. Nowe funkcje obsługi baz kolumnowych oferowane przez Teradata pozwalają użytkownikom na odpowiedni dobór kolumnowych i wierszowych metod przechowywania danych, w zależności od potrzeb danej aplikacji. Dzięki systemowi Teradata aplikacje uzyskują teraz dostęp do danych ułożonych w wiersze i kolumny oferując wysoką elastyczność i wydajność.
"Ta elastyczność wspiera organizacje zmagające się z wielkimi zbiorami danych, z rosnącą rzeszą użytkowników oraz wymaganiami dotyczącymi wydajności. Teradata Columnar pozwala naszym użytkownikom na szybsze dostarczenie lepszych analiz do większej liczby użytkowników. Elastyczność Teradata Columnar pozwala na obsługę analitycznych aplikacji przez odpowiednią strukturę tabel, optymalizując czasy odpowiedzi z centralnej, wspólnej hurtowni danych. Dodatkowo, baza danych automatycznie dobiera najlepszą metodę kompresji oraz dynamicznie dostosowuje mechanizm kompresji stosownie do zmian danych w czasie" - powiedział Scott Gnau, prezes Teradata Labs w Teradata Corporation.
Teradata Columnar rozwiązuje problemy związane z tzw. wąskimi gardłami przetwarzania, dzięki przechowywaniu danych w kolumnach zamiast w wierszach. Do pamięci, w celu przetwarzania, wczytywane są wyłącznie dane z kolumn odnoszących się do zapytania, co znacznie obniża rozmiar i czasochłonnych operacji wejścia/wyjścia (ang. I/O) w stosunku do rozwiązań opartych na wierszach wymagających odczytania danych z wszystkich kolumn.
Dzięki Teradata Columnar klienci będą mogli uczynić zdecydowany krok naprzód, wiedząc, że jego dopracowana hybrydowa struktura posiada możliwości wspierania aplikacji krytycznych do prowadzenia biznesu, wykorzystując wielkie objętości danych w tabelach kolumnowych. W przeciwieństwie do hybrydowych rozwiązań konkurencji, Teradata Columnar wspiera zaawansowane zarządzania obciążeniem, wysoką dostępność, złożone zapytania SQL, analitykę typu in-database, zaawansowany optymalizator wykonywania zapytań i niezrównaną skalowalność.
Oprócz znacznych korzyści w zakresie wydajności wynikających z przechowywania danych w kolumnach, Teradata Columnar rozwiązuje problem nadmiaru operacji wejścia/wyjścia jeszcze w inny sposób: przez kompresję. Kompresja obniża obciążenie operacji wejścia/wyjścia wymaganych w celu wczytania danych do pamięci, bowiem dane konieczne dla odpowiedzi na pytanie, kompresowane są do ułamka jego rozmiaru. Co więcej, Teradata Columnar automatyzuje zarządzanie kompresją, zwalniając administratora bazy danych z obowiązku analizy i doboru konkretnego rozwiązania z kilkunastu możliwych do zastosowania. Baza danych automatycznie wybiera najlepiej dostosowany do danej sytuacji mechanizm kompresji.
System Teradata automatycznie dobiera jeden z sześciu rodzajów kompresji: kodowanie długości serii (ang. run length encoding, RLE), kompresję na podstawie słownika, przycinanie, delta i średnia, kompresję opartą na zerze oraz kompresję opartą na kodowaniu UTF8 w zależności od charakterystyki danych kolumny. Przykładowo, sklep z napojami może często sprzedawać specjalny, świąteczny napój w grudniu, dzięki czemu kodowanie długości serii powiązane z kompresją słownikową może przynieść najlepsze wyniki. W maju sprzedaż napojów jest bardziej losowa i rozproszona i redukuje powtórzenia, dla których najlepsze będzie kodowanie długości serii. Zatem algorytm kodowania długości serii będzie dodawany automatycznie do algorytmów stosowanych w grudniu, ale nie w maju.
Źródło: Teradata
Skomentuj na forum