Day 1: Alur Kerja & Penerapan Data Science Di Industri

Viony Wijaya
2 min readApr 14, 2021

--

Source image (Manfred Steger, Pixabay)

Manusia dan data merupakan suatu hal yang tidak dapat dipisahkan. Setiap harinya kita berhubungan atau bahkan menghasilkan data. Ilmu yang berisikan dengan data-data ini biasanya disebut dengan data science. Pada postingan ini dan postingan-postingan selanjutnya, saya akan membagikan pelajaran yang saya dapatkan dari online course yang saya ikuti. Hitung-hitung mendokumentasikan learning journey saya.

Data Science Workflow

Pada Day 1 ini saya belajar mengenai workflow yang terdapat di industri data science. Ternyata ada 4 tahapan.

  1. Data collection & storage — Data dikumpulkan dari berbagai macam sumber seperti survey, traffic dari website, geo-tagged di postingan media sosial hingga transaksi keuangan. Pada tahap ini, data masih berupa data raw atau mentah.
  2. Data preparation — Tahap ini dikenal sebagai tahapan yang paling memakan waktu karena pada tahap ini kita akan mengolah data yang masih mentah menjadi data dalam format yang lebih rapi dimana diperlukan adanya cleaning data hingga mencari missing atau duplicate value.
  3. Exploration & visualization — Data yang ada dapat divisualisasi lebih lagi dengan menggunakan dashboard untuk melacak bagaimana data berubah seiring dengan berjalannya waktu atau sekedar membandingkan performa dari 2 data set yang ada.
  4. Experimentation & prediction — Contoh use case yang sering kita dengar adalah ramalan cuaca atau ramalan gempa.

Application of Data Science

Traditional machine learning, Internet of Things dan Deep learning merupakan contoh pengaplikasian data science yang paling populer digunakan.

  1. Traditional machine learning — Machine learning digunakan untuk menjawab pertanyaan-pertanyaan yang bersifat well-defined seperti “berapa probabilitas bahwa transaksi yang terjadi sekarang di bank merupakan transaksi penipuan?”. Machine learning juga pada umumnya berperan pada tahapan terakhir workflow data science yaitu experimentation & prediction. Hasil dari machine learning pada tahap experimentation & prediction pada umumnya memiliki peranan penting dalam pengambilan keputusan di perusahaan.
  2. Internet of Things — mengarah ke gadget non computer tapi masih memiliki kemampuan untuk mengirimkan data. Contoh: smart watch
  3. Deep learning — Algoritme lanjutan dari subbidang machine learning. Contoh: face recognition atau language learning. Deep learning sendiri membutuhkan training data yang lebih banyak namun juga dapat membangun hubungan yang tidak dapat dilakukan oleh model tradisional.

Jika ada yang kurang tepat, feel free to comment ya!

--

--