poniedziałek, 6 września 2010

Ciągłość procesów biznesowych: inwestycja w Real Time Data Integration

Paweł Płaszczak


Kluczowe dla biznesu dane nie mogą być tracone. Jednocześnie ilość danych uznawanych za kluczowe rośnie. Z tego powodu technologia składowania i zarządzania danymi jest dobrem strategicznym, zapewniającym ciągłość działania przedsiębiorstwa (Business Continuity).


Przeprowadzone przez GridwiseTech badanie rynku wśród dużej i średniej wielkości przedsiębiorstw wskazuje pięć dominujących kierunków inwestycji w tym obszarze: odtwarzanie systemu po awarii (Disaster Recovery - DR), zapewnienia ciągłości dostępu (High Availability - HA), tworzenia kopii zapasowych (backup) oraz poprawa wydajności przetwarzania oraz migracja do innych baz danych. Wyniki te wskazują, że systemy informatyczne przedsiębiorstw w Polsce już operują na kluczowych dla biznesu danych, a menadżerowie zdają sobie sprawę z ryzyka i konsekwencji ich utraty.
Najprostszym i najpopularniejszym sposobem na ograniczenia tego ryzyka jest replikacja danych, przy użyciu rozwiązań sprzętowych lub programowych. Nowością jest podejście IaaS (Infrastructure-as-Service), zdobywająca rynek dzięki konkurencyjnej cenie oraz elastyczności, pozwalająca przetrzymywać kopie danych w zewnętrznej chmurze (Cloud). Natomiast duże możliwości daje tzw. Real Time Data Integration, czyli możliwość synchronizacji baz danych w czasie rzeczywistym. Odpowiednie wykorzystanie tego podejścia może zapewnić bezpieczeństwo i ciągłość procesów biznesowych, niezależnie od architektury, jej rozlokowania i użytych aplikacji biznesowych.

Dlaczego Oracle wybrało GoldenGate?

Rynek utrzymania niezawodności systemów informatycznych jest zróżnicowany i niejednorodny. Jeszcze w połowie 2009 roku firma GoldenGate, z siedzibą w San Francisco była niewielkim, w skali Doliny Krzemowej, niezależnym producentem oprogramowania, jednak ze znakomitą ilością wdrożeń liczącą ponad 500 klientów z całego świata.
Co skłoniło Oracle do przejęcia spółki? Oracle posiadało zaawansowane produkty HA, jednak dopiero włączenie technologii GoldenGate w ofertę ugruntowało ich pozycję w dziedzinie replikacji danych w czasie rzeczywistym.
Wspólną cechą technologii wiodących na rynku (email, skype, www, sieci społeczne) jest prostota działania. Zasada działania GoldenGate jest również prosta: w celu synchronizacji dwóch baz danych, należy wiedzieć o zmianach (transakcjach) zachodzących w pierwszej i umieć je powtórzyć na drugiej. Metoda ta znana jest jako Change Data Capture (CDC).
Jedną z ważniejszych i ciekawszych funkcjonalności Oracle GoldenGate jest dwukierunkowa replikacja (active-active replication). Wyobraźmy sobie korporację, która ma dwa oddziały a w nich odrębne systemy informatyczne (sytuacja bardzo często spotykana po fuzji bądź przejęciu firmy, będąca koszmarem dla administratorów). GoldenGate umożliwia ich stosunkowo prostą integrację i pracę na jednym zbiorze danych oraz modyfikację. Tutaj dotykamy jednego z podstawowych problemów rozproszonych systemów informatycznych, mianowicie zgodności synchronizowanych danych pomiędzy geograficznie oddalonymi replikami. Oracle GoldenGate gwarantuje, że nawet w niestabilnym i awaryjnym środowisku replikowane informacje nigdy nie zostaną zgubione. Synchronizacja danych w obie strony oczywiście nie jest bezkolizyjna, tutaj Oracle GoldenGate dostarcza metody kontroli i kolejkowania operacji.

Kiedy ciągłość działania jest ważna dla biznesu?

W praktyce często spotykamy się z niejednorodnym środowiskiem IT w przedsiębiorstwie. Im łatwiejsza integracja produktu klasy Real Time Data Integration z aplikacjami i bazami danych różnych dostawców o różnych wersjach, tym szersze jest spektrum możliwości jego wykorzystania. Przykładowo GoldenGate nie wymaga homogenicznego środowiska Oracle i pracuje równie dobrze z produktami konkurencji. Kilka scenariuszy:

1. Niezawodność i wysoka dostępność: Oracle GoldenGate automatycznie zarządza zdalną kopią danych aplikacji. Podczas awarii systemu podstawowego lub konieczności jego wygaszenia w celach serwisowych, użytkownik może pracować na jego kopii.

2. Migracja w czasie rzeczywistym: czynności modernizacji sprzętu wymaga migracji bazy danych, co standardowo powoduje konieczność wygaszenia systemu. Tymczasem GoldenGate pozwala na uniknięcie tego problemu, ponieważ nowy system może zostać zsynchronizowany ze starym w trakcie normalnej pracy, bez wiedzy użytkownika.

3. Integracja różnorodnych środowisk: posiadając niekompatybilne ze sobą środowiska bazodanowe, np. MSSQL, Oracle, IBM DB2, Sybase można pokusić się o współdzielenie danych pomiędzy nimi, co może być najprostszą formą integracji.

4. Fuzje, przejęcia i konsolidacja IT w rosnących przedsiębiorstwach: warto rozważyć zastosowanie CDC w celu sprawnej konsolidacji danych pomiędzy nowo połączonymi oddziałami.

5. Raportowanie: ciekawym dodatkowym efektem jest poprawa wydajności systemu poprzez możliwość rozpraszania zapytań (load balancing). Raporty generowane przez wiele serwerów jednocześnie, więc będą dostępne szybciej.

Kiedy inwestować w Real Time Data Integration?

Podejście Real Time Data Integration jest uniwersalne, jednak powyższe scenariusze nie zawsze można połączyć. Przykładowo, zintegrowane w ten sposób systemy dwóch przedsiębiorstw po fuzji nie mogą być jednocześnie traktowane jako środowisko wysokiej dostępności.
Osobną kwestią jest ważny temat współistnienia w jednym systemie instalacji GoldenGate i innych technologii zapewniających ciągłość działania (Active Data Guard, Oracle RAC, replikacja sprzętowa). W celu podjęcia decyzji o inwestycji, ważne jest zrozumienie kiedy GoldenGate powinno uzupełniać inne techniki wysokiej dostępności, a kiedy prościej będzie zastosować jedną technologię.
Planowanie inwestycji w celu zapewnienia ciągłości procesów biznesowych będzie tematem konferencji organizowanej przez GridwiseTech i Oracle, która odbędzie się 5 października w Warszawie.

O autorze:

Paweł Płaszczak, Prezes GridwiseTech, to specjalista w zakresie nowoczesnych technologii informatycznych. Doświadczenie zdobywał w CERN (Szwajcaria), British Telecom (Wielka Brytania) oraz Argonne National Laboratory (USA). W 2003 roku założył GridwiseTech, gdzie wraz z zespołem prowadzi pionierskie prace nad technologiami skalowalnymi. Jest autorem wielu artykułów, książki "Grid Computing: The Savvy Manager's Guide" oraz bloga BigDataMatters.com.

Brak komentarzy:

Prześlij komentarz