Pelatihan Detail
Kurikulum
SKKNI
No. 299 tahun 2020
daftarAssociate Data Scientist
Pelatihan Data Scientist dirancang untuk membekali peserta dengan keterampilan praktis dan pengetahuan mendalam dalam mengolah, menganalisis, dan memodelkan data untuk menghasilkan solusi berbasis data yang relevan bagi kebutuhan bisnis dan industri.
- Menentukan Label Data
- Mengumpulkan Data
- Menelaah Data
- Memvalidasi Data
- Menentukan Objek Data
- Membersihkan Data
- Mengkonstruksi Data
- Membangun Model
- Mengevaluasi Hasil Pemodelan
Peserta akan belajar mengenali dan menetapkan label data yang relevan dengan tujuan analisis untuk mempermudah proses klasifikasi, pengelompokan, atau prediksi.
Pelatihan ini mencakup teknik pengumpulan data dari berbagai sumber, seperti data internal perusahaan, API, atau web scraping, dengan mempertimbangkan legalitas dan etika pengumpulan data.
Peserta akan mempelajari cara memahami struktur, pola, dan distribusi data menggunakan visualisasi dan statistik deskriptif untuk menentukan langkah analisis selanjutnya.
Pelatihan ini menekankan pentingnya validasi data untuk memastikan keakuratan, kelengkapan, dan konsistensi data sebelum digunakan dalam analisis atau pemodelan.
Peserta akan belajar mengidentifikasi variabel atau fitur utama yang relevan untuk analisis, termasuk teknik feature engineering untuk meningkatkan kualitas model.
Pelatihan ini melatih peserta dalam proses pembersihan data, seperti menangani data yang hilang, outlier, atau duplikasi, untuk memastikan data siap untuk dianalisis.
Peserta akan mempelajari teknik transformasi data, seperti encoding, scaling, atau normalisasi, guna mempersiapkan data yang sesuai untuk kebutuhan algoritma atau model.
Pelatihan ini melatih peserta dalam memilih, membangun, dan mengimplementasikan model machine learning atau statistik untuk mengolah data, termasuk supervised dan unsupervised learning.
Peserta akan mempelajari cara mengevaluasi performa model menggunakan metrik evaluasi, seperti akurasi, precision, recall, atau F1-score, serta melakukan tuning model untuk hasil yang optimal.