Data Processing with Spark
Apache Spark saat ini merupakan salah satu sistem populer untuk memproses data dalam skala besar, dengan dukungan API untuk berbagai bahasa pemrograman dan berbagai dukungan pustaka yang melimpah, Apache Spark menyediakan banyak fitur untuk menyelesaikan berbagai masalah pemrosesan data.
Pelatihan Apache Spark ini ditujukan agar dapat membantu engineer dan data scientist dengan aktivitas rutin seperti query data untuk menjawab berbagai pertanyaan bisnis dan membangun model serta persiapan data untuk analisis lebih lanjut maupun membuat data ingestion pipeline.
Apa yang Anda pelajari?
- Pengenalan Spark
- Masalah Big Data
- Sejarah Spark
- Menjalankan spark
- Struktur Apache Spark
- Arsitektur Spark
- API Spark
- Sesi Spark
- Data Frame
- Transformasi
- Aksi
- API data terstruktur
- Operasi data terstruktur
- Menggunakan beragai tipe data
- Agregasi
- Join
- Sumber Data
- Spark SQL
- Dataset
- API dasar
- RDD
- Variabel Bersama terdistribusi
- Steaming
- Dasar proses stream
- Struktur Streaming
- Event berbasis waktu dan pemrosessan statefull
- Analitik lanjutan dan Machine Learning
- Tentang analitik lanjutan dan machine learning
- Preprocessing dan feature engineering
- Klasifikasi
- Regresi
- Rekomendasi
- Unsupervised learning
- Analisis graph
- Deep Learning
Apa yang Anda dapatkan?
Sertifikat setelah pelatihan
Lab sudah disediakan
(untuk kelas yang membutuhkan lab)