Data Science with Python
Durasi Pelatihan : 4 Hari
Saat ini kita telah memasuki era big data dimana data bertumbuh dengan sangat cepat, banyak dan dengan bentuk yang bervariasi. Ketika masalah penyimpanan telah diselesaikan dengan teknologi penyimpanan terdistribusi seperti hadoop maka masalah kembali timbul saat data tersebut ingin digunakan. Proses cleansing, join, seleksi data untuk menemukan data yang tepat untuk digunakan dalam analisis menjadi masalah baru karena harus menangani data dengan variasi yang sangat banyak, sampai akhirnya muncul teknologi-teknologi baru dalam data science yang salah satunya berbasis bahasa pemrograman python. Pelatihan ini dirancang untuk memahamkan peserta dalam penggunaan bahasa pemrograman python untuk memecahkan masalah terkait pengolahan data.
Peserta Pelatihan
- Pegawai / staff pengolahan data
- Programmer
- Manager / Pimpinan
Manfaat Pelatihan
Dalam pelatihan ini, peserta akan mempelajari :
- Penggunaan Interactive Python
- Penggunaan pustaka Numerical Python
- Penggunaan pustaka Pandas
- Penggunaan pustaka visualisasi data Matplotlib
- Penggunaan Machine Learning untuk mengolah data
Outline Pelatihan.
- Perintah-perintah dasar IPython
- Profilling dan timing
- Tipe data di python
- Array NumPy
- Komputasi Array
- Agregasi pada NumPy
- Kondisional, Masking dan logika Boolean
- Indexing
- Sorting
- NumPy dan Tuples
- Object Pandas
- Operasi data dengan Pandas
- Penanganan data null dan nan
- Index Hirarkis
- Kombinasi Dataset
- Pivot Table
- Operasi Vektor pada Text
- Operasi data berbasis waktu
- Visualisasi data dengan grafik
- Histogram, scatter dan grafik
- Visualisasi data geografis
- Pengenalan Machine Learning
- Supervised dan Unsupervised Learning
- Algoritma Klasifikasi
- Algoritma Regresi
- Algoritma Clustering