Big Data

Posted: 22 Maret 2016 in Diskusi, programming

Assalamu’alaikum.

saya mau nuliskan resume untuk Kuliah Tamu Big data kemarin. untuk file presentasinya berikut Big Data for National Industry , file tersebut di share oleh Pemateri sehingga bisa didownload di link berikut http://bit.ly/BigDataUIN2016 . Tulisan saya bersumber dari materi Beliau.

Seminar Big Data UIN

Seminar Big Data UIN

saya buat resume nya sebagai berikut ya

Summary Seminar Big Data

21 Maret 2016

Oleh : Mochamad Agung Tarecha

 

Skema Sederhana BIG DATA

Skema Sederhana

Skema Sederhana

Sederhananya BIG DATA adalah proses pengumpulan data yang diproses sedemikian rupa sehingga dapat divisualisasikan agar human friendly yang kemudian digunakan sebagai dasar untuk pengambilan keputusan. Pengambilan keputusan ini tergantung culture perusahaan, apakah management (manusia), ataukah berpegang teguh pada data. Bila menggunakan data (apa kata data) maka bisa diproses lagi menjadi Sistem Pendukung Keputusan. Big Data digunakan bila pengambilan keputusan berdasarkan data. Sebenarnya hanya statistika sederhana namun proses dari awal pengumpulan data hingga visualisasinya menggunakan teknologi-teknologi aplikatif.

Misal menghitung customer life time value, setelah membeli produk X pada hari 1, berapa hari lagi customer membeli produk yang sama ? dalam setahun berapa kali beli produk X ? semakin lama semakin sering atau semakin jarang sehingga dalam setahun bisa sama sekali tidak membeli produk X ? bagaimana visualisasi datanya ? data-data tersebut dapat divisualisasikan kemudian dapat digunakan dalam pengambilan keputusan dari Big Data tersebut.

Namun tetap ada kelemahan dalam BIG DATA yaitu tidak semua data dapat di capture, misal sebuah produk Y memasang iklan baliho besar, dan terdapat kenaikan penjualan, berapa orang yang membeli produk Y karena melihat dan tertarik dengan baliho yang dipasang ? berapa orang yang harusnya membeli produk tersebut setelah melihat baliho sehingga biaya pemasangan baliho dapat tertutupi oleh laba penjualan produk sedangkan siapa yang membeli produk setelah melihat baliho tidak dapat di trace. Bisa diakali menggunakan kupon, sehingga dapat di trace pembelian berdasarkan baliho iklan yang dipasang. Namun hal tersebut tidak dapat diterapkan pada semua jenis produk.

Apa itu Big Data ?

Sebenarnya istilah “Big Data” hanyalah buzzwords. Istilah yang paling mendekati adalah Big Data è Data Driver

Apa itu Data Driven ?

Tools. Ability, and culture that acts on data. Dengan bahasa sederhananya bagaimana ketersediaan data diolah menggunakan tools dan digunakan sebagai pendukung pengambilan keputusan. Pada dasarnya bagaimana kultur, ketersediaan data, dan peralatan merupakan komponen Big Data.

Five V on Big Data merupakan penyusun dasar Big Data

  1. Volume è Data at Rest. Data umumnya berukuran sangat besar untuk disimpan. Dan tidak fit untuk di analisis dalam satu memory server
  2. Velocity èData in Motion. Data bergerak cepat mendekati near-time / real time
  3. Value èSetiap data bernilai dan berhubungan / berelasi
  4. Variety è Data in Many Forms. Data memiliki banyak bentuk, terstruktur maupun tidak terstruktur, teks, gambar, dan lain sebagainya,
  5. Veracity è Data in Doubt. Kebanyakan data tidak konsiten, membingungkan, dan tidak meyakinkan.
Gartner's hype Cycle

Gartner’s hype Cycle

Menurut Gartner’s Hype Cycle ternyata Big Data tidak seperti yang ekspektasikan, sebenarnya BIG DATA bukanlah hal yang wah sekali.

Big Data mayoritas yang dibutuhkan adalah analisa, dan mayoritas analisa berbasis Bussines Intelligence (BI), dan mayoritas yang dibutuhkan dalam BI adalah Data Gorvernance / tata kelola data yang baik, dan mayoritas yang dibutuhkan untuk tata kelola data yang baik adalah Data Engineering, dan mayoritas Data Engineering adalah use case yang spesifik berdasarkan kasus tertentu (tidak bisa dipukul rata satu teknik untuk semua masalah yang ada).

Sebenarnya BIG DATA tidak selalu membutuhkan Machine Learning, bisa diselesaikan dengan model statistika sederhana.

DATA DRIVEN

Dari tiga bagian utama data driven yang telah disebutkan di awal yaitu Mindset / Culture, Ability, dan Tools beriku resumenya

  1. Culture
  • Data : Bagaimana budaya mengolah data yang benar, berkualitas, dapat diakses.
  • People : Siapa yang mendesign metrics, ekstrak data, dan menganalisanya
  • Principles : Eksperimen berkelanjutan dan improvement, analisis
  1. Ability
  • Kemampuan bagaimana mengolah data menggunakan metode-metode yang ada diperlukan seperti Matematika statistik, visualisasi data penting agar mengentahui prespektif dari data, programming, data engineering, dan skill bisnis (terkait penggambilan keputusan)
  1. Tools
  • Tools dibutuhkan untuk mengolah data tersebut. Untuk memilihnya kita perlu mendefinisikan dahulu seperti pengolahan batch atau streaming, seberapa banyak data, seberapa cepat, menggunakan visualisasi data.
Leading Tools

Leading Tools

 

Semoga Bermanfaat.
Wassalamu’alaikum.

 

Tinggalkan Balasan

Please log in using one of these methods to post your comment:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s