Perkembangan zaman yang semakin pesat membuat banyak perubahan pada dunia kerja. Efeknya di dunia kerja kemudian adalah munculnya banyak cabang pekerjaan baru. Data Engineer dan Data Analyst adalah sebagian dari pekerjaan yang baru yang muncul beberapa tahun belakangan. Pertanyaan yang muncul selanjutnya adalah, apa sih beda dari Data Engineer dan Data Analyst?

Kamu bisa lihat pada penjelasan di bawah mengenai perbedaan antara Data Engineer dan Data Analyst;

 

1. Data Engineer

Data Engineer adalah seseorang yang mengembangkan dan membuat desain arsitektur manajemen data dan memelihara/memonitor infrastruktur data di perusahaan, seperti sistem database, data warehouse, data lake, dan sistem pemrosesan data berskala besar. Data science, di sisi lain, adalah seseorang yang membersihkan, memproses, dan mengolah data (besar).

Secara umum, upaya yang dibutuhkan kedua belah pihak untuk mendapatkan data dalam format yang dapat digunakan sangat berbeda. Data engineer menangani data mentah yang masih kotor. Data kotor ini bisa disebabkan human error, kesalahan mesin atau instrumen. Data mentah ini belum divalidasi, dan perlu diformat sedemikian rupa sehingga sesuai dengan sistem arsitektur data pada organisasi/perusahaan tersebut. Data engineer perlu merekomendasikan dan terkadang menerapkan cara untuk meningkatkan keandalan, efisiensi, dan kualitas data. Selain itu, data engineer perlu memastikan ketersediaan dan konsistensi data selama 24 x 7. Untuk melakukannya, mereka perlu menggunakan berbagai bahasa dan alat seperti Hadoop, NoSQL database, computer network technology, dan sebagainya. Data engineer juga biasanya diharapkan mengerti administrasi sistem dan menguasai sistem operasi Linux / Windows / OS X.  Data engineer juga terus-menerus melakukan data acquisition dari sumber-sumber yang berbeda sehingga dapat memberikan data yang lebih lengkap untuk pemrosesan lebih lanjut oleh data scientist.

 

2. Data Scientist

Data scientist biasanya akan mengolah lebih lanjut data yang telah dikumpulkan oleh data engineer. Mulai dari data extraction, lalu data preparation (cleansing), data processing, dan analysis. Data scientist perlu memastikan bahwa kondisi data baik dan sesuai untuk dianalisis dan diambil insightsnya. Data scientist juga melakukan eksperimentasi dengan menggunakan teknik machine learning dan metode statistik untuk digunakan dalam pemodelan prediktif dan preskriptif. Data scientist juga kadang merangkap pekerjaan data analyst untuk melakukan analisis data, di mana mereka perlu menyajikan data dilengkapi dengan pemaparan yang jelas untuk membantu pengambilan keputusan. Terkadang, data scientist juga merangkap sebagai data engineer, terutama dari segi ekstraksi data dengan menggunakan bahasa SQL atau NoSQL. Walaupun data scientist mungkin tidak perlu memonitor jobs yang sedang berjalan di Hadoop, terkadang data scientist juga perlu ikut serta dalam manajemen data di Hadoop.

 

Nah kalau kamu ingin belajar lebih detail mengenai Data Engineer dan Data Scientist, yuk ikutan kelas online “Data Science and Technology Series” di Pintaria. Cara daftarnya sangat mudah, kamu hanya perlu klik di sini Pintarian.