BA3 · Materi
BA3 – Analisis Data: Index Materi
BA3 – Analisis Data: Index Materi
Ujian: Proyek analisis data + laporan tertulis (R/RStudio, Excel, Word) Referensi Utama: James et al. (2013), Frees (2010), Healy (2019), Lander, Kelleher et al. (2015), ASOP No. 23
Topik 1: Identifikasi Masalah dan Persiapan Data (10–20%)
- 1.1 Business Problem Identification — Identifikasi permasalahan bisnis berdasarkan pertanyaan dan isu yang diberikan; tipe analisis data (deskriptif, inferensial, prediktif)
- 1.2 Data Identification and Limitations — Identifikasi data secara spesifik; ketergunaan dan batasan data berdasarkan permasalahan bisnis
- 1.3 Data Analysis Stages and Tools — Tahapan analisis data untuk menyelesaikan permasalahan nyata secara ilmiah; metode yang tepat pada setiap tahapan
- 1.4 Data Sources and Characteristics — Berbagai sumber data dan karakteristiknya, termasuk data berukuran sangat besar (big data)
- 1.5 Data Cleaning and Transformation — Metode pembersihan (cleaning), restrukturisasi, dan transformasi data agar sesuai dengan analisis yang akan dilakukan
Hasil Pembelajaran
- Mengidentifikasi permasalahan bisnis berdasarkan pertanyaan dan isu yang diberikan.
- Mengidentifikasi data secara spesifik, menjelaskan ketergunaan maupun batasannya berdasarkan permasalahan bisnis.
- Menjelaskan tipe analisis data yang sesuai untuk digunakan (deskriptif, inferensial, atau prediktif).
- Menjelaskan tahapan analisis data untuk menyelesaikan permasalahan nyata, dan menggunakan metode yang tepat pada setiap tahapannya.
- Menjelaskan berbagai macam sumber data dan menjelaskan karakteristiknya, termasuk data berukuran sangat besar.
- Menggunakan metode yang tepat untuk membersihkan, merestrukturisasi, dan mentransformasi data agar sesuai dengan analisis yang akan dilakukan.
Referensi
- Actuarial Standards Board. (2004). ASOP No. 23 – Data Quality.
- Lander, J. P. R for Everyone, Advanced Analytics and Graphics, Bab 19–21, 23, 25.
Topik 2: Analisis Data Eksploratif dan Visualisasi Data (25–35%)
- 2.1 Exploratory Data Analysis Purpose — Tujuan dari analisis data eksploratif (EDA); statistik deskriptif yang sesuai
- 2.2 Descriptive Statistics and Visualisation Tools — Penggunaan metode yang tepat untuk menghitung statistik deskriptif dan melakukan visualisasi data eksploratif menggunakan software
- 2.3 Model Identification for Business Problems — Identifikasi model yang akan digunakan, relevan dengan permasalahan bisnis
- 2.4 Principal Components Analysis — Penggunaan Principal Components Analysis (PCA) untuk mereduksi dimensi data yang kompleks
- 2.5 Distribution Fitting and Goodness of Fit — Penggunaan paket software untuk melakukan uji kecocokan distribusi (goodness of fit) pada data
Hasil Pembelajaran
- Menjelaskan tujuan dari analisis data eksploratif.
- Menggunakan metode yang tepat untuk menghitung statistik deskriptif dan melakukan visualisasi data eksploratif.
- Mengidentifikasi model yang akan digunakan, yang relevan dengan permasalahan bisnis.
- Menggunakan Principal Components Analysis (PCA) untuk mereduksi dimensi data.
- Menggunakan paket dalam software untuk melakukan uji kecocokan distribusi pada data.
Referensi
- Healy, K. (2019). Data Visualization: A Practical Introduction, Bab 1–8.
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning, Bab 10.
- Frees, E. W. (2010). Regression Modelling with Actuarial and Financial Applications, Bab 3, 4.
Topik 3: Seleksi dan Validasi Model (20–30%)
- 3.1 Statistical Modelling with Software — Penggunaan paket software untuk pemodelan data: model regresi linier/berganda, model survival, atau Generalized Linear Model (GLM); interpretasi output
- 3.2 Model Comparison and Business Relevance — Perbandingan model; kelebihan dan kelemahan model terkait permasalahan bisnis
- 3.3 Statistical Learning and Machine Learning — Makna statistical learning dan machine learning; perbedaan antara supervised dan unsupervised learning
- 3.4 Machine Learning Applicability — Kondisi penggunaan machine learning yang tepat; jenis masalah yang diselesaikan; perbedaan pendekatan diskrit dan kontinu
- 3.5 Machine Learning Techniques — Teknik umum machine learning pada empat area: supervised/unsupervised × diskrit/kontinu
- 3.6 Neural Networks and Decision Trees — Penerapan teknik neural network dan decision tree menggunakan paket software pada permasalahan machine learning
- 3.7 Model Validation and Business Value — Validasi model menggunakan metrik evaluasi; keterkaitan metrik dengan nilai bisnis
Hasil Pembelajaran
- Menggunakan paket dalam software untuk melakukan pemodelan pada data (model regresi linier/berganda, model survival, atau GLM), serta menginterpretasikan outputnya.
- Membandingkan dan menunjukkan kelebihan serta kelemahan dari model yang digunakan, terkait dengan permasalahan bisnis.
- Menjelaskan makna dari statistical learning dan machine learning, serta perbedaan antara supervised dan unsupervised learning.
- Menjelaskan kapan machine learning dianggap sebagai metode yang tepat dalam pemecahan suatu masalah, mengidentifikasi jenis masalah yang biasanya dapat diselesaikan dengan metode machine learning, dan mendeskripsikan perbedaan antara pendekatan diskrit dan kontinu.
- Menjelaskan teknik umum yang digunakan dalam machine learning pada masing-masing dari empat area yang didefinisikan sebagai supervised/unsupervised dan pemisahan diskrit/kontinu.
- Menggunakan paket dalam software untuk menerapkan teknik neural network dan decision tree pada permasalahan machine learning.
- Melakukan validasi model dengan menggunakan metrik evaluasi, serta mengaitkannya dengan nilai bisnis.
Referensi
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An Introduction to Statistical Learning, Bab 1, 2, 3, 4, 5, 6, 8, 10.
- Frees, E. W. (2010). Regression Modelling with Actuarial and Financial Applications, Bab 3, 4, 6, 7, 8, 10.
- Kelleher, J. D., Mac Namee, B., & D’Arcy, A. (2015). Fundamentals of Machine Learning for Predictive Analytics, Bab 1–3.
- Lander, J. P. R for Everyone, Advanced Analytics and Graphics, Bab 19–21, 23, 25.
Topik 4: Komunikasi Hasil dan Kesimpulan (25–35%)
- 4.1 Communicating Modelling Results — Komunikasi hasil dari setiap proses pemodelan secara efektif dengan bahasa yang sesuai untuk target pengguna
- 4.2 Data Visualisation for Key Conclusions — Pembuatan visualisasi data yang mengkomunikasikan kesimpulan utama dari suatu analisis
- 4.3 Synthesising Outcomes and Recommendations — Meramu hasil dan mengajukan solusi atau rekomendasi yang tepat untuk permasalahan bisnis yang diberikan
- 4.4 Report Writing — Pembuatan laporan yang efektif mencakup permasalahan, metodologi dan pendekatan, serta solusi yang diajukan
Hasil Pembelajaran
- Mengomunikasikan hasil dari setiap proses pemodelan secara efektif dengan menggunakan bahasa yang umum dimengerti oleh target pengguna.
- Menghasilkan visualisasi data yang dapat mengkomunikasikan kesimpulan utama dari suatu analisis.
- Meramu hasil dan mengajukan solusi atau rekomendasi yang tepat untuk permasalahan bisnis yang diberikan.
- Membuat laporan secara efektif yang mencakup permasalahan, metodologi dan pendekatan, serta solusi yang diajukan.
Referensi
- Healy, K. (2019). Data Visualization: A Practical Introduction, Bab 1–8.
- Actuarial Standards Board. (2004). ASOP No. 23 – Data Quality.
- Frees, E. W. (2010). Regression Modelling with Actuarial and Financial Applications, Bab 6, 7, 8, 10.
Bobot Soal
| Topik | Bobot |
|---|---|
| 1. Identifikasi Masalah dan Persiapan Data | 10–20% |
| 2. Analisis Data Eksploratif dan Visualisasi Data | 25–35% |
| 3. Seleksi dan Validasi Model | 20–30% |
| 4. Komunikasi Hasil dan Kesimpulan | 25–35% |
Tags
#BA3 #Index #AnalisisData