Bayesian Parameter Estimation
📊 6.3 — Bayesian Parameter Estimation
Ringkasan Cepat›
Topik: Estimasi Parameter Bayesian | Bobot: ~20–25% (Topik 6) | Difficulty: Hard Ref: Klugman et al. (2019), Bab 13 & 15 | Prereq: 6.1 Parameter Estimation Methods, 6.2 MSE Confidence Intervals and Delta Method
Section 0 — Pemetaan Topik
| Topik TA2 | Sub-topik ID | Skill Diuji | Bobot | Difficulty | Prerequisite | Connected Topics | Referensi |
|---|---|---|---|---|---|---|---|
| Pembentukan dan Pemilihan Model Parametrik | 6.3 | Menghitung distribusi posterior; menentukan Bayes estimator (mean, median, mode posterior); melakukan uji hipotesis Bayesian | 20–25% (bersama topik 6) | Hard | 6.1 Parameter Estimation Methods, 6.2 MSE Confidence Intervals and Delta Method | 7.3 Bayesian Credibility, 7.4 Empirical Bayesian Methods | Klugman et al. (2019), Bab 13 & 15 |
Section 1 — Intuisi
Bayangkan seorang aktuaris baru bergabung di sebuah perusahaan asuransi motor. Ia diminta mengestimasi parameter frekuensi klaim nasabah baru. Masalahnya: nasabah ini baru, data klaimnya nol. Apakah artinya frekuensi klaimnya betul-betul nol? Tentu tidak — data yang sedikit tidak berarti tidak ada risiko. Di sinilah intuisi Bayesian masuk: kita tidak mulai dari nol pengetahuan. Kita punya prior — informasi dari portofolio nasabah serupa yang sudah ada sebelumnya — lalu kita perbarui keyakinan itu dengan data aktual si nasabah baru.
Pendekatan klasik (MLE, method of moments) memperlakukan parameter distribusi seperti sebuah konstanta yang tidak diketahui, lalu mencarinya dari data. Pendekatan Bayesian melakukan sesuatu yang berbeda secara fundamental: parameter diperlakukan sebagai variabel acak yang memiliki distribusinya sendiri. Sebelum melihat data, kita punya keyakinan awal (prior distribution). Setelah data masuk, keyakinan itu diperbarui menjadi posterior distribution — campuran antara pengetahuan lama dan bukti baru.
Dalam konteks aktuaria, ini sangat intuitif. Parameter distribusi klaim — seperti rata-rata klaim harian atau parameter skala distribusi Pareto — tidak selalu tetap. Ada variabilitas antar kelompok risiko, antar periode, antar wilayah. Pendekatan Bayesian memungkinkan aktuaris “belajar” dari data secara formal dan terstruktur, menghasilkan estimasi yang lebih stabil terutama ketika data terbatas — persis saat estimasi paling dibutuhkan.
Section 2 — Definisi Formal
Definisi Matematis — Teorema Bayes untuk Parameter›
Misalkan adalah parameter distribusi (diperlakukan sebagai variabel acak), adalah prior dan adalah likelihood. Maka distribusi posterior adalah:
di mana adalah marginal likelihood (konstanta normalisasi).
Tabel Variabel & Parameter
| Simbol | Makna | Catatan |
|---|---|---|
| Parameter distribusi | Diperlakukan sebagai variabel acak dalam kerangka Bayesian | |
| Distribusi prior | Keyakinan awal sebelum melihat data; harus ditentukan secara eksogen | |
| Fungsi likelihood | Sama dengan likelihood MLE; probabilitas data diberikan | |
| Distribusi posterior | Keyakinan yang diperbarui setelah melihat data | |
| Marginal likelihood | Konstanta normalisasi; sering diabaikan dan ditulis | |
| Bayes estimator | Titik estimasi yang dipilih dari distribusi posterior |
Rumus Utama
1. Posterior Proporsional (bentuk kerja):
Label: Ini adalah persamaan kerja utama. Dalam ujian, fokuslah mengenali bentuk kernel dari hasil perkalian ini — itu menentukan distribusi posterior.
2. Bayes Estimator — Mean Posterior (minimizer MSE):
Label: Estimator Bayesian yang paling sering digunakan; meminimalkan expected squared error loss.
3. Bayes Estimator — Mode Posterior (MAP):
Label: Maximum A Posteriori — memodifikasi MLE dengan menambahkan informasi prior. Berguna ketika distribusi posterior tidak simetris.
4. Pasangan Prior-Posterior Konjugat Kritis untuk TA2:
| Likelihood | Prior Konjugat | Posterior |
|---|---|---|
| Poisson() | Gamma() | Gamma() |
| Eksponensial() | Gamma() | Gamma() |
| Binomial() | Beta() | Beta() |
| Normal(), diketahui | Normal() | Normal dengan mean dan variansi yang diperbarui |
Label: Pasangan konjugat adalah kunci efisiensi komputasi — posterior memiliki bentuk distribusi yang sama dengan prior.
5. Prediktif Posterior (Posterior Predictive):
Label: Digunakan untuk membuat prediksi pada observasi baru, mengintegrasikan ketidakpastian parameter.
Asumsi Eksplisit
- Randomness pada : Parameter adalah variabel acak, bukan konstanta tetap — ini berbeda fundamental dari paradigma frekuentis.
- Spesifikasi prior: Prior harus ditentukan sebelum melihat data; tidak boleh “disesuaikan” setelah data diketahui (data-driven prior selection yang naif melanggar prinsip Bayesian).
- Pertukaran data (exchangeability): Observasi diasumsikan saling independen kondisional pada — yaitu .
- Konjugasi (jika digunakan): Keluarga prior konjugat dipilih agar posterior memiliki bentuk tertutup (closed form) — ini adalah simplifikasi komputasi, bukan keharusan teoritis.
- Identifikabilitas: Model likelihood harus teridentifikasi — dua nilai yang berbeda harus menghasilkan distribusi yang berbeda.
Section 3 — Jembatan Logika
Dari Definisi ke Rumus — Mengapa Posterior Berbentuk Demikian›
Teorema Bayes hanyalah aturan probabilitas kondisional: . Jika kita ganti dan , langsung diperoleh formula posterior. Yang membuat ini powerful adalah ketika kita memilih prior dari keluarga yang “kompatibel” dengan likelihood — maka hasil perkalian secara aljabar menghasilkan kernel dari distribusi yang dikenal. Kita tidak perlu menghitung integral normalisasi secara eksplisit; cukup kenali bentuknya.
Kunci Mengenali Distribusi Posterior›
Dalam soal ujian, setelah menghitung , sederhanakan ekspresi sebagai fungsi dan cari polanya:
- Jika ada → itu kernel Gamma(, ) dalam parameterisasi rate
- Jika ada → itu kernel Beta(, )
- Jika ada → itu kernel Normal(, )
Begitu bentuk dikenali, semua momen posterior (mean, variansi) langsung diketahui dari rumus distribusi tersebut.
Derivasi Step-by-Step: Kasus Poisson-Gamma (paling sering diujikan)
Misalkan klaim harian berdistribusi Poisson(), dan hari observasi menghasilkan total klaim .
Langkah 1 — Tulis likelihood:
Langkah 2 — Tentukan prior Gamma(, ) dalam parameterisasi rate:
Di sini dan .
Langkah 3 — Hitung posterior (proporsional):
Langkah 4 — Kenali bentuk:
Ini adalah kernel Gamma dengan parameter:
Sehingga .
Langkah 5 — Hitung Bayes estimator (mean posterior):
Interpretasi credibility:
Ini adalah bobot tertimbang antara rata-rata sampel (data) dan mean prior (pengetahuan awal) — persis struktur formula kredibilitas!
Tiga Larangan Fatal dalam Bayesian TA2›
- JANGAN gunakan sebagai mean — itu variansi! Mean Gamma(, ) dalam parameterisasi rate adalah .
- JANGAN lupa memperbarui kedua parameter: saat Poisson-Gamma, bertambah dengan total klaim dan bertambah dengan jumlah observasi — bukan hanya satu.
- JANGAN asumsikan distribusi posterior selalu sama dengan prior hanya karena prior konjugat — parameter posterior sudah berubah; distribusinya keluarga yang sama tetapi bukan prior yang sama.
Section 4 — Contoh Soal
Soal A — Fundamental
Soal: Frekuensi klaim mingguan sebuah nasabah berdistribusi Poisson(). Prior untuk adalah Gamma(, ) dalam parameterisasi rate. Dalam 4 minggu observasi, total klaim yang terjadi adalah 10. Tentukan distribusi posterior dan Bayes estimator-nya.
Solusi Soal A›
Pendekatan: Gunakan pasangan konjugat Poisson-Gamma; perbarui parameter secara langsung.
1. Identifikasi Variabel
- Likelihood: Poisson()
- Prior: Gamma(, ) →
- Data: minggu,
2. Identifikasi Distribusi / Model Pasangan konjugat Poisson-Gamma berlaku. Posterior akan berupa Gamma dengan parameter yang diperbarui.
3. Setup Persamaan
4. Eksekusi Aljabar
Posterior: Gamma(, )
Bayes estimator:
5. Verification Prior mean = 1.5, sampel mean = . Posterior mean = 2.167 berada di antara keduanya — masuk akal. Bobot data .
Hasil: Posterior adalah Gamma(13, 6); klaim per minggu.
Exam Tips — Soal A›
Target waktu: 2–3 menit. Common trap: Lupa memperbarui dengan (hanya menambahkan ke ). Shortcut: Hafal rumus update Poisson-Gamma: — langsung tanpa derivasi.
Soal B — Exam-Typical
Soal: Besar klaim individual berdistribusi Eksponensial dengan mean (yaitu rate ). Prior untuk adalah Gamma(, ) dalam parameterisasi scale (sehingga ). Dalam satu periode observasi, tercatat 6 klaim dengan total besar klaim .
(a) Tentukan distribusi posterior untuk . (b) Hitung Bayes estimator (mean posterior) untuk . (c) Nyatakan estimator ini dalam bentuk bobot tertimbang antara prior mean dan data mean.
Solusi Soal B›
Pendekatan: Likelihood Eksponensial berpasangan konjugat dengan Gamma; perhatikan parameterisasi scale vs rate.
1. Identifikasi Variabel
- Likelihood: Eksponensial(), yaitu
- Prior: Gamma(, ) dalam parameterisasi scale →
- Data: , , sehingga
2. Identifikasi Distribusi / Model Untuk Eksponensial dengan parameterisasi mean , gunakan substitusi sehingga prior dalam parameterisasi rate menjadi Gamma(, ), atau lebih mudah: tulis likelihood dalam langsung.
3. Setup Persamaan
Catatan: dalam parameterisasi rate dari Gamma untuk , perlu berhati-hati. Cara paling aman: gunakan substitusi (rate), lalu prior .
Cara langsung menggunakan hasil konjugat yang diketahui:
Dengan dan .
4. Eksekusi Aljabar
Untuk bentuk tertimbang:
Atau lebih sederhana:
(Catatan: implementasi spesifik bergantung parameterisasi; di ujian, selalu verifikasi dengan formula konjugat yang tepat.)
5. Verification Posterior mean = 1,889 berada antara prior mean 2,000 dan sampel mean 2,500. Karena cukup kecil relatif terhadap , prior memberikan bobot signifikan — masuk akal.
Hasil: Posterior Gamma terbalik dengan ; .
Exam Tips — Soal B›
Target waktu: 4 menit. Common trap: Mencampur parameterisasi scale dan rate dari Gamma — selalu definisikan terlebih dahulu apakah adalah scale atau rate. Shortcut: Untuk Eksponensial, ingat bahwa posterior mean = (total klaim + prior total) / (n + prior count), yaitu tergantung konvensi.
Soal C — Challenging
Soal: Klaim individual berdistribusi Poisson() dengan prior (parameterisasi rate, sehingga ). Setelah observasi 3 periode dengan klaim masing-masing 1, 4, 3:
(a) Tentukan posterior. (b) Hitung Bayes estimator dan bandingkan dengan MLE. (c) Lakukan uji hipotesis Bayesian: apakah diterima pada keyakinan posterior ?
Solusi Soal C›
Pendekatan: Gabungkan estimasi Bayesian dengan uji hipotesis posterior menggunakan distribusi Gamma yang sudah diperbarui.
1. Identifikasi Variabel
- Prior: Gamma(, ) → ,
- Data: , observasi: , ,
2. Identifikasi Distribusi / Model Poisson-Gamma konjugat. Posterior: Gamma(, ).
3. Setup Persamaan — Posterior
4. Eksekusi Aljabar
(a) Bayes Estimator:
(b) MLE:
Perbandingan: Bayes estimator = 2.5 berada di antara prior mean (2) dan MLE (2.667). Secara eksplisit:
(c) Uji Hipotesis Bayesian:
vs .
Hitung probabilitas posterior:
Konversi: jika , maka , yaitu .
Sehingga: .
Dari tabel : (nilai kritis 20 df pada adalah sekitar 19.34).
Karena , maka ditolak — data memberikan cukup bukti bahwa .
5. Verification Posterior mean = 2.5 > 2, sehingga secara intuitif memang data mendukung . Jika posterior mean sudah berada di atas nilai hipotesis, sangat mungkin — konsisten.
Hasil: Posterior Gamma(10,4); ; ditolak karena .
Exam Tips — Soal C›
Target waktu: 5–6 menit. Common trap: Salah mengkonversi Gamma ke Chi-squared — ingat bahwa Gamma(, rate) berhubungan dengan melalui . Shortcut: Uji hipotesis Bayesian cukup menghitung menggunakan CDF posterior — jika , tolak .
Section 5 — Verifikasi & Sanity Check
Cross-check Posterior Mean — Harus Berada di Antara Prior dan Data›
Untuk estimator Bayesian, selalu berlaku:
Bayes estimator adalah rata-rata tertimbang antara prior mean dan sampel mean. Jika berada di luar rentang ini, ada kesalahan komputasi.
Cross-check Bobot Kredibilitas — Harus Antara 0 dan 1›
Untuk Poisson-Gamma: bobot data , bobot prior .
Ketika sangat besar, posterior mean harus mendekati (MLE). Ketika , posterior mean harus sama dengan prior mean. Verifikasi ini tanpa kalkulator.
Metode Alternatif
Jika distribusi posterior tidak memiliki bentuk tertutup (prior non-konjugat), gunakan:
- Numerik/Grid approximation: Hitung pada grid nilai , lalu normalisasi.
- MAP (Maximum A Posteriori): Maksimalkan — lebih mudah dari menghitung seluruh posterior, dan dalam TA2 sering diuji sebagai alternatif Bayes estimator.
Section 6 — Visualisasi Mental
Visualisasi Proses Bayesian — Update Keyakinan:
SEBELUM DATA (Prior) SETELAH DATA (Posterior)
Distribusi Prior Distribusi Posterior
π(θ) π(θ|x)
┌──────┐ ┌─────┐
│ ↑ │ │ ↑ │
│ │ │ │ │ │
│bell │ + Data → │ narrower bell │
│curve │ │lebih peaked │
└──────┘ └─────┘
E[θ] E[θ|x] = Bayes estimator
(lebar = ketidakpastian besar) (lebih sempit = lebih yakin)
Visualisasi Verbal — Distribusi Gamma(α, β) sebagai Prior Poisson:
- Sumbu X: nilai (parameter frekuensi klaim, selalu positif)
- Bentuk: unimodal, skewed kanan untuk kecil; mendekati simetris untuk besar
- Mode: (ada untuk )
- Mean: (selalu lebih besar dari mode — ekor kanan)
- Semakin besar dan proporsional (mempertahankan mean): prior semakin “tight” = informasi prior semakin kuat, data butuh lebih banyak untuk menggeser posterior
Hubungan Visual ↔ Rumus
| Elemen Visual | Komponen Formula |
|---|---|
| Lebar/spread distribusi prior | Variansi prior ; makin kecil = prior makin informatif |
| Perpindahan puncak posterior ke arah data | Bobot kredibilitas |
| Posterior lebih sempit dari prior | Selalu terjadi: variansi posterior variansi prior karena denominator membesar |
| Mean posterior antara prior dan data | Formula tertimbang |
Section 7 — Jebakan Umum
Kesalahan Parametrisasi — Gamma Rate vs Scale›
Salah: Menggunakan sebagai scale dan menghitung mean Gamma(, ) sebagai . Benar: Jika adalah rate (inverse of scale), maka mean = . Jika adalah scale, maka mean = .
Soal TA2 bisa menggunakan kedua konvensi. Selalu periksa apakah yang diberikan adalah rate atau scale — cek dari satuan: rate memiliki satuan .
Kesalahan Konseptual — Empat Miskonsepsi Kritis›
- “MLE selalu lebih baik dari Bayes karena lebih objektif.” — Salah. Saat data sedikit, prior membantu stabilitas estimasi. MLE bisa sangat tidak stabil dengan kecil.
- “Posterior mean sama dengan MLE ketika data banyak.” — Benar secara asimptotik, tapi tidak eksak untuk terbatas. Keduanya konvergen ke nilai true saat .
- “Prior yang diffuse (uninformative) menghasilkan posterior yang identik dengan likelihood.” — Benar hanya dalam batas; dalam praktik, prior diffuse sering membuat posterior tidak proper.
- “Update Bayesian bisa dilakukan dua kali dengan data yang sama.” — Tidak boleh! Data yang sama tidak boleh digunakan dua kali dalam update. Posterior setelah batch pertama menjadi prior untuk batch kedua hanya jika data memang berbeda.
Kesalahan Interpretasi Soal — Keyword yang Menjebak›
- “Prior mean” vs “prior mode”: Untuk Gamma(, ) rate, mean = tapi mode = untuk . Soal yang meminta “most likely value” mungkin ingin mode!
- “Bayes estimate” tanpa spesifikasi → asumsikan mean posterior (minimizer MSE). Jika diminta “MAP estimate” → gunakan mode posterior.
- “Predictive mean” bukan sama dengan “posterior mean” parameter — untuk kasus Poisson, tapi tidak selalu demikian.
Red Flags — Keyword yang Wajib Memicu Prosedur Khusus›
- “Prior: Gamma” + “Likelihood: Poisson” → Langsung gunakan update konjugat; jangan derivasi ulang dari awal.
- “Test hypothesis” dalam konteks Bayesian → Hitung dari distribusi posterior — berbeda dari uji hipotesis frekuentis!
- “Expected number of future claims” → Gunakan posterior predictive mean, bukan hanya posterior mean parameter.
- “Compare Bayes vs MLE” → Tunjukkan formula tertimbang dan diskusikan bobot kredibilitas .
Section 8 — Ringkasan Eksekutif
Must-Remember›
- Rumus Inti — Posterior:
- Update Poisson-Gamma (paling sering diujikan):
- Bayes estimator (mean posterior) = kredibilitas:
- MAP estimator:
- Uji hipotesis Bayesian: Tolak jika (atau threshold yang ditentukan).
Kapan Digunakan
- Soal menyebutkan “prior distribution” atau memberikan distribusi prior untuk parameter
- Soal meminta “Bayes estimate”, “posterior distribution”, atau “MAP estimate”
- Soal meminta kombinasi antara informasi historis dan data sampel (→ struktur kredibilitas)
- Soal meminta uji hipotesis dalam kerangka Bayesian
- Pasangan likelihood-prior yang diketahui (Poisson-Gamma, Binomial-Beta, Normal-Normal)
Kapan TIDAK Boleh Digunakan
- Soal hanya menyediakan data tanpa prior → gunakan MLE atau method of moments (6.1 Parameter Estimation Methods)
- Soal meminta selang kepercayaan frekuentis → gunakan metode delta (6.2 MSE Confidence Intervals and Delta Method)
- Soal meminta uji kecocokan model (goodness-of-fit) → gunakan diagnostik (6.4 Model Diagnostics and Selection)
Quick Decision Tree
graph TD
A["Soal melibatkan estimasi parameter?"] -->|"Ya"| B["Ada prior distribution diberikan?"]
A -->|"Tidak"| Z["Topik lain"]
B -->|"Ya"| C["Kenali pasangan konjugat?"]
B -->|"Tidak"| D["Gunakan MLE / MoM\n(Topik 6.1)"]
C -->|"Poisson-Gamma atau\nBinomial-Beta"| E["Update parameter\nlangsung (closed form)"]
C -->|"Non-standar"| F["Hitung proportional:\nf(x|theta) * pi(theta)"]
E --> G["Hitung posterior mean\n= alpha* / beta*"]
F --> G
G --> H["Apakah diminta uji hipotesis?"]
H -->|"Ya"| I["Hitung P(H0|x)\ndari distribusi posterior"]
H -->|"Tidak"| J["Laporkan Bayes estimator\ndan interpretasi kredibilitas"]
I --> K["Tolak H0 jika P(H0|x) < 0.5"]
Follow-up Options›
- “Berikan contoh soal variasi dengan prior Beta dan likelihood Binomial”
- “Jelaskan hubungan 6.3 Bayesian Parameter Estimation dengan 7.3 Bayesian Credibility”
- “Buat flashcard 1-halaman untuk pasangan konjugat kritis TA2”
📖 Ref: Klugman, Panjer & Willmot (2019), Loss Models 5th ed., Bab 13 & 15 | 🗓️ 2026-04-17 | #TA2 #BayesianEstimation #TeoriRisiko