SOP Emergency Action Data Center

Posted: 1 Agustus 2017 in Pengalaman

AC pendingin server

AC pendingin server

Assalamu’alaikum Wr. Wb.

Saya mau share mengenai EMERGENCY ACTION DATACENTER.

yang penting dalam keadaan emergency adalah “TETAP TENANG dan JANGAN PANIK”

yang saya tulis bedasarkan pengalaman ya, bukan dari klausul-klausul seperti ISO  atau standarisasi lainnya. Foto yang saya share tidak mengandung rahasia perusahan, hal ini adalah foto umum dari sebuah data center. maksudnya tidak ada data yang bersifat merugikan perusahaan jika ditulis. tenang saya sudah dapat pelatihan soal ini 🙂

Saya menulis pengalaman pribadi ya. semoga bisa bermanfaat bagi rekan-rekan yang juga berprofesi sebagai IT Infrastructure seperti saya.

1. Case : Belt Precission Air Conditioner putus

2. Akibat : Suhu Datacenter naik

3. Risiko : Server bisa down karena overheat

4. Preventive Action :

Kita sudah melakukan kontrak maintenance dengan Vendor untuk perawatan PAC, dan yang menjadi penting adalah jangan menunggu rusak untuk maintenance. Pastikan selalu ada budget maintenance karena kita tidak tahu sewaktu2 rusak. Ketika tiba2 PAC rusak dengan belt putus maka tinggal telpon vendor akan segera datang untuk proses perbaikan. Selalu lakukan Maintenance berkala. sebisa mungkin punya sparepart seperti belt nya. kalau2 putus bisa diganti sendiri.

hal yang penting adalah punya AC backup dan jangan sampai rusak backupnya, kita punya AC SPlit ( AC ruangan pada umumnya) untuk membackup. namun memang peformanya tidak sebaik PAC. yang penting bisa menahan suhu agar tidak melonjak drastis

5. Smart Action :

hal yang perlu dipikirkan adalah vendor tidak bisa datang detik itu juga, dari surabaya ke pasuruan butuh sekitar 2 jam, tapi jangan diam saja. lakukan langkah2 untuk mendinginkan server. seperti gambar dibawah saya ambil AC portabel dan hot air nya kita kasi belalai agar panasnya keluar, arahkan langsung ke server karena server the most critical. tambah blower. blower akan membantu proses sirkulasi udara.

6. Corrective

langkah pertama adalah ketika PAC nya alarm dan mati. Matikan MCB / catu daya utama. lalu buka tutup untuk melihat apa kerusakannya. jangan sekali2 buka sebelum listriknya benar2 mati. Selalu periksa suhu server. kalau mentok ya shutdown server lebih baik daripada autoshutdown karena overheat.

 

Sekian . mungkin kurang sistematis tulisan saya . kira2 seperti itu lah. dan setelah berselang 2 jam suhu berangsur2 turun. masih kita monitor

semoga bermanfaat bagi rekan2.

Wassalamu’alaikum Wr. Wb.

 

Belt Putus

Belt Putus

Iklan

Tinggalkan Balasan

Please log in using one of these methods to post your comment:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s