Selasa, 03 Januari 2012

IS&T Disaster Recovery Exercise BASIS, ROAM and NETWORK

Untuk menambah wawasan dang pengetahuan, bagi teman-teman yang masih baru mengenal apa itu DRC dalam bidang NETWORKING dan bagaimana Steb By Step DRC di jalankan, saya akan mengulas dalam penulisan saya ini selama saya bekerja memengang Jaringan dalam suatu perusahaan..

  • DEFINISI DRC

Setiap perusahaan memiliki sejumlah rangkaian proses utama (core processes) yang biasanya ditunjang oleh beragam teknologi informasi (TI) dan komunikasi agar tercipta suatu mekanisme kerja yang efektif, efisien, dan terkendali dengan baik. Core processes merupakan suatu proses penting yang harus selalu dijaga kinerjanya. Hal ini dilakukan dengan melindungi core process dari sumber-sumber yang berasal dari bencana alam, virus, terorisme, malicious acts dari dalam maupun luar serta unpredictable source lainnya. Salah satu upaya untuk mengantisipasi bila hal-hal tersebut terjadi adalah dengan membangun sebuah Disaster Recovery Center.
Disaster Recovery Center merupakan suatu fasilitas dalam perusahaan yang berfungsi untuk mengambil alih fungsi suatu unit ketika terjadi gangguan serius yang menimpa satu atau beberapa unit kerja penting di perusahaan, seperti pusat penyimpanan dan pengolahan data dan informasi. Contohnya adalah ketika terjadi malapetaka yang menimpa sejumlah perusahaan besar dunia yang bermarkas di World Trade Center tetap dapat beroperasi (segera pulih kegiatan operasionalnya dalam waktu cepat), karena mereka telah mempersiapkan sejumlah DRC untuk mengantisipasi bencana yang tidak dikehendaki tersebut.
Secara umum DRC berfungsi :

  • Meminimalisasi kerugian finansial dan nonfinansial dalam meghadapi kekacauan bisnis atau bencana alam meliputi:
  1. Fisik: komputer, real money
  2. Informasi berupa data penting perusahaan
  3. Kepercayaan dan nama baik 
  4. Manusia
  • Meningkatkan rasa aman di antara personel, supplier, investor, dan pelanggan
         Membangun sebuah DRC yang baik, bukanlah suatu hal yang mudah, bahkan beberapa praktisi      mengategorikannya sebagai sebuah aktivitas kompleks, karena di dalamnya terdapat beragam aspek dan komponen yang membutuhkan perhatian khusus dan serius. Oleh karena itu, yang perlu dipelajari dan dipahami sungguh-sungguh oleh mereka yang ingin merencanakan dan mengembangkan DRC adalah metodologi pembangunannya. Metodologi yang baik akan menekankan pada aspek-aspek sebagai berikut:
  • Memberikan gambaran yang jelas kepada manajemen mengenai besarnya usaha yang harus dilakukan dalam merencanakan, mengembangkan, dan memelihara sebuah DRC.
  • Menggalang komitmen penuh dari seluruh manajemen dan karyawan di berbagai lapisan organisasi untuk berpartisipasi dalam proses perencanaan dan pengembangan DRC.
  •  Mendefinisikan kebutuhan recovery dipandang dari berbagai perspektif bisnis
  • Memperlihatkan dampak kerugian yang akan diderita perusahaan jika DRC tidak segera dibangun.
  •  Memfokuskan diri pada pencegahan terjadinya gangguan dan mencoba untuk meminimalisasikan dampak negatif yang terjadi, walaupun tetap dipersiapkan berbagai usaha reaktif (recovery) seandainya gangguan tersebut benar-benar terjadi.
  • Memudahkan proses pemilihan anggota tim yang bertangung jawab di dalam proses pengembangan DRC.
  • Menghasilkan sebuah perencanaan recovery yang mudah dipahami, mudah diterapkan, dan mudah dipelihara.
  • Mendefinisikan secara jelas bagaimana keberadaan DRC tersebut terintegrasi secara baik dengan sejumlah entiti bisnis lain yang dalam keadaan normal tetap berjalan.
Adapun metodologi perencanaan dan pengembangan DRC yang baik paling tidak harus memperhatikan 8 (delapan) tahapan utama, yaitu:
1. Pre-Planning Activities (Project Initiation), merupakan tahap persiapan untuk menjamin bahwa seluruh pimpinan dan jajaran manajemen perusahaan paham betul mengenai karakteristik dan perlunya DRC dibangun.
2. Vulnerability Assessment and General Definition of Requirements, merupakan kajian terhadap potensi gangguan yang dapat terjadi karena kerapuhan sistem dan usaha untuk mendefinisikan kebutuhan akan DRC yang dimaksud.
3. Business Impact Assessment, merupakan analisa terhadap dampak bisnis yang akan terjadi seandainya gangguan tersebut terjadi pada kenyataannya.
4. Detailed Definition of Requirements, merupakan proses mendefinisikan kebutuhan secara lebih rinci setelah proses kajian terhadap dampak bisnis selesai dilakukan, sehingga perusahaan dapat memfokuskan diri secara tepat (karena adanya keterbatasan sumber daya yang dimiliki).
5. Plan and Center Development, merupakan tahapan membangun perencanaan dan DRC yang dimaksud sesuai dengan spesifikasi kebutuhan yang telah didefinisikan sebelumnya.
6. Testing and Exercising Program, merupakan rangkaian usaha uji coba atau latihan kinerja DRC dengan cara mensimulasikan terjadinya gangguan yang dimaksud.
7. Execution, merupakan suatu rangkaian proses dimana DRC beroperasi sejalan dengan aktivitas bisnis sehari-hari perusahaan dalam keadaan normal.
8. Maintenance and Evaluation, merupakan usaha untuk memelihara dan mengevaluasi kinerja DRC dari waktu ke waktu agar selalu berada dalam kondisi yang prima dan siap pakai.
Membangun DRC yang baik tentu saja memerlukan dana yang tidak sedikit. Oleh karena itu, tidak setiap perusahaan perlu dan sanggup membangun atau menyediakan DRC. Perusahaan yang biasanya memutuskan untuk membangun DRC adalah mereka yang memiliki karakteristik usaha sebagai berikut:
  • Resiko terjadinya gangguan cukup tinggi karena nature dari proses atau teknologi yang dipakai di dalam menunjang core processes yang ada, misalnya dalam mengimplementasikan internet banking, remote trading, e-auction, dan lain sebagainya.
  • Resiko gangguan yang terjadi berpotensi mengganggu sejumlah besar (mayoritas) proses atau aktivitas yang sangat kritikal bagi kelangsungan hidup perusahaan, misalnya terkait dengan automated teller machine, corporate electronic payment system, automatic procurement system, dan lain sebagainya.
  • Resiko gangguan melekat pada sejumlah proses bernilai tinggi (value-added processes), yaitu serangkaian aktivitas dimana terkait langsung dengan mekanisme penciptaan produk atau jasa, bersifat mutlak dilakukan oleh perusahaan agar tidak kehilangan sumber pendapatan.
Infrastruktur disaster recovery mencakup fasilitas data center, wide area network (WAN) atau telekomunikasi, local area network (LAN), hardware, dan aplikasi. Dari tiap bagian ini kita harus menentukan strategi disaster recovery yang paling tepat agar dapat memberikan solusi yang efektif dan sesuai dengan kebutuhan perusahaan.
Aspek lain yang perlu diperhatikan bahwa sumber daya manusia merupakan komponen penting dalam penyediaan layanan di mana mereka harus memberikan layanan (yang kadang-kadang berlebihan). Misalnya mereka siap bekerja jam 12 malam atau di luar jam kerja. Artinya dibutuhkan adanya �help desk� 24 jam/hari. Hal tersebut dapat menjadi kendala yang perlu dipertimbangkan.Hal-hal yang perlu diperhatikan dalam membangun dan negosiasi kontrak DRC:
  1.  DRC harus berada di daerah aman tapi dalam jarak yang terjangkau dari lokasi yang akan dilayaninya. 
  2. Perjanjian kontrak harus mengidentifikasikan sumber-sumber secara spesifik dan pelayanan yang akan disediakan. 
  3. Perjanjian kontrak sebaiknya berisi batasan jumlah maksimum pelanggan lain yang berlokasi sama dengan wilayah layanan perusahaan perusahaan bersagkutan. 
  4. Perjanjian kontrak harus menspesifikasi berapa lama waktu yang dibutuhkan untuk menanggapi laporan dari client.
Dalam membangun DRC dibutuhkan perencanaan yang matang agar prosesnya berjalan secara efektif dan efisien. Perencanaan tersebut disebut Disaster Recovery Planning(DRP). DRP merupakan pedoman yang disepakati bersama antara pimpinan dan jajaran manajemen dalam melakukan tindakan sebelum, selama, dan setelah bencana terjadi. Isinya mencakup kebijakan-kebijakan mulai dari konsep perencanaan sampai eksekusi secara konkrit, misalnya:
1. Obtain Top Management Commitment
Top management harus mendukung dan terlibat dalam pengembangan DRP. Manajemen hendaknya bertanggung jawab mengkoordinasi DRP dan memastikan efektivitasnya dalam perusahaan.
2. Establish a Planning Committee
Anggota Planning Committee meliputi wakil-wakil dari seluruh bagian perusahaan. Komite ini harus menjelaskan rumusan dan batasan masalah dari perencanaan.
3. Perform a Risk Assesment
Planning Committee mempersiapkan analisa terhadap kemungkinan bencana yang terjadi dan dampaknya terhadap perusahaan.
4. Establish Priorities of Processing and Operations
Penyusunan prioritas proses dan operasi mana yang harus benar-benar tetap berjalan saat bencana terjadi dan mana yang bisa ditangguhkan.
5. Determine Recovery Strategies
Menentukan strategi recovery yang disusun dengan mempertimbangkan seluruh aspek orginisasi seperti fasilitas, hardware, software, komunikasi, data files, customers services, end users systems dan lain-lain. 
6. Perform Data Collection
Menentukan material, data dan dokumentasi yang perlu dikumpulkan seperti backup position listing, communications inventory, equipmnet inventory, main computer hardware inventory, dan lain-lain.
7. Organize and Document a Written Plan
Mendokumentasikan rencana yang disusun dalam bentuk tulisan.
8. Develop Testing Criteria and Procedures
Rencana yang telah disusun dites dan dievaluasi untuk memastikan bahwa rencana tersebut sudah dapat diimplementasikan dengan baik.
9. Approve the Plan
Setelah DRP ditest dan didokumentasikan, DRP tersebut harus disetujui oleh top management untuk kemudian dipakai sebagai DRP yang sah bagi perusahaan tersebut.
Dalam menyusun DRP diperlukan metode yang spesifik untuk mengorganisasi dan menuliskannya. DRP yang benar-benar terstruktur akan berpengaruh langsung terhadap kemampuan recovery suatu organisasi. Isi dari rencana yang disusun harus sistematis dan mudah dimengerti. Pengorbanan usaha dan waktu yang sungguh-sungguh diperlukan dalam menyusun rencana. Rencana yang ditulis dengan baik memudahkan dalam membaca dan memahami prosedur sehingga kemungkinan berhasil lebih besar saat digunakan.


  • Berikut Step by Step Proses DRC

Objective & Scope
 
Objective :
Provide regular DR exercise to forming the habit of DR procedure
Review and Evaluate DR Procedure to measure RTO that committed to business.
Record all issue where parameter don’t work as expected
Scope :
this time may involve operation support team and performed under “disaster” condition mode.
This test will focus on BASIS & ROAM data validity, replication by MIMIX
Network infrastructure provided by PT.TELKOM only.


What we have established
  • Recovery Time Objective (RTO)    :   3 Hours
  • Recovery Point Objective (RPO)    : 15 Minutes

  • Frequency : Every Six Months

  • DR Test Plan in 2009 :  2nd week Mar 2009
                                               2nd week Sep 2009
  • Last DR Test :  21 May 2009

  • Last Testing Scenario :  Full Scale Test (Network recovery time, Application recovery time, document procedure)




Last Testing Result

  • Recovery Time Objective (RTO)        :   118 mins (1 hour & 58 minutes)
  •     Network Connection                          >> 63 min
  •     Server system (BASIS & ROAM)    >>48 min

  • Recovery Point Objective (RPO)        : -

Summary Issue :


  • Standar Format Penulisan
Standardidasi format dibutuhkan terutama jika prosedur DRP ditulis oleh beberapa orang. Dua format dasar yang digunakan untuk menulis rencana yaitu informasi background dan informasi instruksional.
Informasi background meliputi:
  1. Tujuan prosedur 
  2. Batasan prosedur ( lokasi, peralatan, personel, dan waktu) 
  3. Bahan referensi (buku, informasi, dan hal lain yang perlu dikonsultasikan) 
  4. Dokumentasi 
  5. Kebijakan umum yang diterapkan
  • Batasan Masalah

Walaupun mayoritas DRP hanya membahas aktivitas yang berkaitan dengan data processing, rencana keseluruhan akan meliputi operasi di luar data processing. Rencana harus mempunyai jangkauan yang luas agar bisa menangani berbagai skenario bencana yang mempengaruhi kegiata organisasi.
Worst case scenario sebaiknya menjadi dasar pengembangan rencana. Oleh karena itu, keadaan yang tidak terlalu genting dapat diatasi dengan mudah.
  • Planning Assumption

Setiap DRP mempunyai asumsi dasar yang membatasi lingkup perencanaan. Asumsi yang dibuat sering diidentifikasikan dengan menanyakan hal-hal berikut:
  1. Apa saja alat yang rusak? 
  2. Berapa lama kerusakan terjadi? 
  3. Apa saja yang terproteksi dari bencana? 
  4. Sumber daya apa saja yang tersedia saat bencana?
  • Tim Penyusun

Tim penyusun DRP tidak boleh sama dengan struktur organisasi yang telah ada. Dalam tim tersebut harus ada manajer yang memimpin dan mengarahkan dalam penyusunan DRP.
Beberapa contoh pembagian tim:
  1. Managemen Team 
  2. Business recovery team 
  3. Computer recovery team 
  4. Damage assesment team 
  5. Security team 
  6. Administrative supprot team 
  7. Logistics support team 
  8. Communications team 
  9. Human relation team 
  10. Customer relation team

Kesimpulan
DRC diperlukan oleh perusahaan untuk mengatasi dampak dari bencana yang mungkin terjadi. Untuk itu diperlukan suatu proses perencanaan yang matang agar implementasi DRC berjalan efektif dan efisien. Rencana yang disusun tidak hanya mencakup aktivitas data processing, tetapi meliputi semua aspek di luar operasi data processing. Rencana tersebut harus meliputi prosedur yang telah diuji untuk meyakinkan keberhasilan proses recovery saat bencana benar-benar terjadi. Rencana yang sudah tersusun didokumentasikan dalam bentuk tulisan. 

Sumber : Internet
  - Andreas W. Yanuardi & Arief Hamdani Gunawan, penulis bekerja sebagai engineer pada Lab. Solusi TI di R&D Center 

Tidak ada komentar:

Posting Komentar