Klugman et al. (2019) Bab 16–18; Tse (2009) Bab 6–9
Section 1 — Intuisi
Dalam model Bühlmann dan Bühlmann-Straub yang telah kita pelajari, formula premi kredibilitas ZXˉ+(1−Z)μ memerlukan tiga besaran: mean kolektif μ, expected value of process variance v, dan variance of hypothetical means a. Masalahnya: dalam praktik asuransi nyata, kita tidak tahu nilai μ, v, dan a — parameter-parameter ini bergantung pada distribusi prior π(θ) yang tidak pernah kita observasi secara langsung.
Di sinilah Empirical Bayesian Methods hadir sebagai jembatan antara teori Bayesian yang ideal dan realitas data. Ide dasarnya sederhana namun kuat: jika kita punya data dari banyak tertanggung atau kelompok dalam portofolio yang sama, kita bisa mengestimasiμ, v, dan a langsung dari data tersebut — tanpa perlu menentukan distribusi prior secara eksplisit. Data dari seluruh portofolio berperan sebagai cerminan empiris dari distribusi prior yang tak terobservasi.
Terdapat dua pendekatan dalam metode ini. Pendekatan nonparametrik tidak mengasumsikan bentuk distribusi apapun — ia mengestimasi μ, v, a murni dari momen-momen data. Ini seperti membiarkan data berbicara sendiri tanpa prasangka. Pendekatan semiparametrik lebih efisien: ia mengasumsikan bentuk distribusi likelihood (misalnya Poisson untuk frekuensi), tetapi tetap membiarkan distribusi prior bebas tanpa asumsi parametrik. Dengan kombinasi ini, estimator menjadi lebih tajam karena struktur model dimanfaatkan sebaik mungkin.
Section 2 — Definisi Formal
ℹDefinisi Matematis — Masalah Inti Empirical Bayes›
Premi kredibilitas Bühlmann membutuhkan μ, v, a yang tidak diketahui. Empirical Bayes menggantikannya dengan estimator yang dihitung dari data portofolio:
Label: Substitusi estimator empiris ke formula Bühlmann — premi dapat langsung dihitung dari data
Asumsi Eksplisit
Independensi antar kelompok: Kelompok i dan j (i=j) memiliki parameter risiko Θi dan Θj yang independen satu sama lain.
Kondisional i.i.d. dalam kelompok: Diberikan Θi=θi, observasi Xi1,…,Xini saling independen dan memiliki distribusi yang sama.
Proses stasioner: Distribusi Xij∣Θi tidak berubah antar periode j — profil risiko individu tetap konstan.
Representativitas portofolio: Data dari r kelompok dianggap sebagai sampel acak dari distribusi prior π(θ) yang sama — portofolio merepresentasikan populasi.
a^≥0: Jika estimator a^ menghasilkan nilai negatif (yang mungkin terjadi secara aljabar), maka konvensi standar adalah set a^=0, yang berarti k^→∞ dan Z=0 — semua kelompok mendapat premi grand mean μ^.
Section 3 — Jembatan Logika
◈Dari “Parameter Tidak Diketahui” ke “Estimasi dari Data”›
Masalah fundamental Bühlmann adalah: premi ZXˉ+(1−Z)μ membutuhkan μ, v, a yang semuanya bergantung pada distribusi prior π(θ) yang tidak pernah kita ketahui secara eksplisit. Empirical Bayes memecahkan ini dengan observasi kunci: momen data dari seluruh portofolio adalah estimator konsisten dari momen prior. Total variansi data dapat didekomposisi menjadi komponen within-group (≈v) dan between-group (≈a+v/n) — dari sini kita dapat memisahkan v dan a secara empiris.
◈Dekomposisi Variansi — Jantung Metode›
Identitas kunci yang mendasari semua estimator empiris adalah dekomposisi:
Var(Xij)=vE[v(Θ)]+aVar(μ(Θ))
Variansi total data = EVPV (within-group) + VHM (between-group).
Estimator v^ menangkap komponen within-group (variansi di dalam satu kelompok).
Estimator a^ menangkap komponen between-group (variansi antar kelompok), dikoreksi agar tidak terdistorsi oleh komponen within-group.
Derivasi Estimator a^ — Langkah demi Langkah
Konteks: Bühlmann standar — r kelompok, masing-masing ni periode, eksposur per observasi = 1.
Langkah 1 — Hitung expected value dari statistik between-group:
E[i=1∑rni(Xˉi−Xˉ)2]
Kembangkan kuadrat dan ambil ekspektasinya. Gunakan fakta bahwa:
Setelah aljabar yang panjang (lihat Klugman Bab 17), diperoleh:
E[i=1∑rni(Xˉi−Xˉ)2]=(r−1)v+c⋅a
di mana c=m−m∑ni2.
Langkah 3 — Isolasi a:
c⋅a=E[i=1∑rni(Xˉi−Xˉ)2]−(r−1)v
Langkah 4 — Substitusi estimator untuk mendapat a^:
a^=c1[i=1∑rni(Xˉi−Xˉ)2−(r−1)v^]
Langkah 5 — Interpretasi c:
c adalah faktor koreksi yang menghilangkan bias dari bobot eksposur yang tidak seimbang. Perhatikan bahwa c<m selalu berlaku (karena ∑ni2/m>0). Jika semua ni sama (ni=n0 untuk semua i), maka:
c=rn0−rn0r⋅n02=rn0−n0=n0(r−1)✘Dilarang›
Jangan menggunakan c=m−r sebagai rumus universal — formula c bergantung pada distribusi ni antar kelompok. Hanya jika semua ni sama dan mij=1 maka c=n0(r−1).
Jangan menganggap a^ selalu positif — secara aljabar a^ bisa negatif. Jika itu terjadi, set a^=0 (bukan abaikan atau gunakan nilai negatifnya).
Jangan menggunakan v^=μ^ di luar konteks Poisson — persamaan v=μ hanya berlaku untuk distribusi Poisson (di mana mean = variance). Untuk distribusi lain, v^ harus dihitung dari variansi within-group.
Section 4 — Contoh Soal
Soal A — Fundamental
Sebuah portofolio asuransi terdiri dari r=3 kelompok. Data frekuensi klaim tahunan (setiap observasi berbobot 1):
Kelompok
ni
Observasi Xij
Xˉi
1
2
3, 5
4
2
3
2, 4, 3
3
3
2
6, 8
7
Hitung estimator nonparametrik μ^, v^, dan a^.
✓Solusi Soal A›
Pendekatan: Hitung grand mean, lalu within-group variance (v^), lalu between-group variance dikoreksi (a^).
1. Identifikasi Variabel
r=3, n1=2, n2=3, n3=2
m=n1+n2+n3=7
Xˉ1=4, Xˉ2=3, Xˉ3=7
2. Identifikasi Distribusi / Model
Bühlmann standar, eksposur per observasi = 1. Estimator nonparametrik — tidak ada asumsi distribusi.
5. Verificationv^=1,5>0 ✓. a^≈3,656>0 ✓. Nilai a^ jauh lebih besar dari v^, mencerminkan heterogenitas besar antar kelompok (Xˉ3=7 vs Xˉ2=3).
Hasil:μ^=31/7≈4,429; v^=1,5; a^≈3,656
▲Exam Tips — Soal A›
Target waktu: 4 menit. Common trap: Membagi SS between-group dengan (r−1) tanpa faktor koreksi c — ini salah. Faktor c selalu berbeda dari (r−1) kecuali kasus khusus. Shortcut: Hitung c pertama kali sebelum apapun — ini sering menjadi sumber kesalahan utama.
Soal B — Exam-Typical
Lanjutan Soal A. Hitung premi kredibilitas empiris Bühlmann untuk masing-masing kelompok pada tahun berikutnya.
✓Solusi Soal B›
Pendekatan: Gunakan μ^, v^, a^ dari Soal A untuk menghitung k^, Z^i, dan premi P^i.
1. Identifikasi Variabel
Dari Soal A: μ^=31/7, v^=1,5, a^=819/224
2. Identifikasi Distribusi / Model
Bühlmann standar. Premi = Z^iXˉi+(1−Z^i)μ^.
Z^3=2+0,41032≈0,8296(sama dengan kelompok 1)P^3=0,8296×7+0,1704×4,429≈5,807+0,755=6,562
5. Verification
Semua premi berada di antara μ^≈4,429 dan Xˉi. Kelompok 2 (Xˉ2=3<μ^) mendapat premi di bawah μ^; kelompok 3 (Xˉ3=7>μ^) mendapat premi di atas μ^ ✓. k^ kecil (≈0,41) berarti Z tinggi — data individu sangat dominan.
Hasil:P^1≈4,073; P^2≈3,172; P^3≈6,562
▲Exam Tips — Soal B›
Target waktu: 3 menit (setelah Soal A selesai). Common trap: Lupa bahwa k^ kecil berarti Z besar (data lebih dominan dari grand mean), bukan sebaliknya. Shortcut: Jika ni sama untuk beberapa kelompok, Z^i identik — cukup hitung sekali.
Soal C — Challenging
Sebuah perusahaan asuransi memiliki r=4 agen dengan data klaim per polis (Bühlmann-Straub — eksposur berbeda):
Agen i
Tahun 1: (mi1,Xi1)
Tahun 2: (mi2,Xi2)
Tahun 3: (mi3,Xi3)
1
(100, 0{,}04)
(150, 0{,}06)
(200, 0{,}05)
2
(200, 0{,}08)
(200, 0{,}07)
—
3
(50, 0{,}02)
(100, 0{,}03)
(150, 0{,}04)
4
(300, 0{,}05)
—
—
Hitung μ^, v^, a^ menggunakan estimator Bühlmann-Straub nonparametrik, kemudian hitung premi kredibilitas untuk Agen 1 dan 2.
✓Solusi Soal C›
Pendekatan: Bühlmann-Straub dengan eksposur berbeda. Hitung Xˉi tertimbang per agen, lalu grand mean, lalu v^ dan a^ versi Bühlmann-Straub.
1. Identifikasi Variabel
Agen 1: m1=100+150+200=450, n1=3
Agen 2: m2=200+200=400, n2=2
Agen 3: m3=50+100+150=300, n3=3
Agen 4: m4=300, n4=1
Total: m=450+400+300+300=1450
2. Identifikasi Distribusi / Model
Bühlmann-Straub nonparametrik: Xˉi=mi∑jmijXij; v^ menggunakan SS tertimbang.
Xˉ1=450100(0,04)+150(0,06)+200(0,05)=4504+9+10=45023≈0,05111Xˉ2=400200(0,08)+200(0,07)=40016+14=40030=0,075Xˉ3=30050(0,02)+100(0,03)+150(0,04)=3001+3+6=30010≈0,03333Xˉ4=0,05(n4=1, hanya satu observasi)
5. VerificationP^1≈0,0513 berada antara μ^=0,0538 dan Xˉ1=0,0511 ✓. P^2≈0,0731 berada antara μ^ dan Xˉ2=0,075 ✓. k^ besar (≈39) menunjukkan v≫a — heterogenitas antar agen relatif kecil dibanding noise dalam kelompok, sehingga Z tidak setinggi yang diperkirakan meski mi besar.
Hasil:P^1≈0,0513 per polis; P^2≈0,0731 per polis.
▲Exam Tips — Soal C›
Target waktu: 8–10 menit. Common trap 1: Memasukkan Agen 4 (satu periode) ke dalam perhitungan v^ — agen dengan ni=1 memberikan kontribusi nol pada ∑(ni−1) dan SS within. Common trap 2: Lupa menggunakan mi (total eksposur agen) sebagai bobot dalam SS between-group, bukan ni. Shortcut: Susun tabel bantu kolom miXˉi dan miXˉi2 untuk efisiensi kalkulasi.
Section 5 — Verifikasi & Sanity Check
✓Sanity Check 1 — Konsistensi Grand Mean›
Grand mean μ^ harus dapat diverifikasi dua cara: (1) sebagai ∑miXˉi/m, dan (2) sebagai ∑i∑jmijXij/m. Keduanya harus menghasilkan nilai identik. Jika berbeda, ada kesalahan di kalkulasi Xˉi atau mi.
✓Sanity Check 2 — Premi Antara Grand Mean dan Sample Mean›
Untuk setiap kelompok i, premi kredibilitas P^i harus berada di antara μ^ dan Xˉi:
min(μ^,Xˉi)≤P^i≤max(μ^,Xˉi)
Ini selalu berlaku karena 0≤Z^i≤1.
✓Sanity Check 3 — Weighted Average Premi = Grand Mean›
Total premi tertimbang harus kembali ke grand mean:
∑imi∑imiP^i=μ^
Ini adalah properti penting: sistem premi empiris Bühlmann bersifat actuarially balanced.
Metode Alternatif — Semiparametrik Poisson
Untuk model frekuensi klaim di mana Xij∣Θi∼Poisson(Θi), struktur Poisson memberikan shortcut:
v(θ)=θ=μ(θ)⟹E[v(Θ)]=E[μ(Θ)]⟹v=μ
Oleh karena itu cukup gunakan:
v^=μ^=Xˉ
Ini tidak perlu menghitung SS within-group — cukup baca grand mean. Efisiensi besar di exam.
Section 6 — Visualisasi Mental
Dekomposisi Variansi sebagai “Dua Sumber Ketidakpastian”:
Total variasi data X_ij │ ├─── Within-group (variansi di dalam satu kelompok) │ ≈ proses acak / noise alam │ → estimasi v (EVPV) │ └─── Between-group (variansi antar kelompok) ≈ heterogenitas nyata antar profil risiko → estimasi a (VHM), setelah koreksi komponen within
Pengaruh k^=v^/a^ terhadap premi:
Besar k (v >> a): Kecil k (a >> v):Homogen, noise besar Heterogen, noise kecilZ rendah → premi → μ̂ Z tinggi → premi → X̄ᵢ(grand mean mendominasi) (data individu mendominasi)Agen yang baru (m kecil) Agen lama (m besar)pun ditarik ke μ̂ mendapat Z ≈ 1
Hubungan Visual ↔ Rumus
Elemen Visual
Komponen Rumus
Lebar distribusi dalam satu kelompok
v=E[v(Θ)] — EVPV
Jarak antar mean kelompok
a=Var(μ(Θ)) — VHM
Rasio k=v/a
Kompetisi: noise vs heterogenitas nyata
Ukuran kelompok mi
Semakin besar → Zi semakin tinggi
Grand mean μ^
Titik gravitasi seluruh portofolio
Section 7 — Jebakan Umum
⬡Kesalahan Parametrisasi — Bühlmann vs Bühlmann-Straub›
Bühlmann standar: mij=1 untuk semua i,j (eksposur seragam). Bühlmann-Straub: mij berbeda. Jika soal menyebut “eksposur” atau “jumlah polis” yang berbeda antar periode, itu pasti Bühlmann-Straub. Jangan menggunakan formula Bühlmann standar untuk data Bühlmann-Straub.
⬡Kesalahan Konseptual›
Mengira c=r−1 atau c=m−r: Formula c=m−∑mi2/mberbeda dari r−1 kecuali dalam kasus sangat khusus. Selalu hitung c dari definisinya.
Menggunakan v^=μ^ tanpa asumsi Poisson: Identitas v=μ hanya berlaku untuk distribusi Poisson. Soal harus secara eksplisit menyebut Poisson atau memberikan v(θ)=θ.
Memasukkan kelompok dengan ni=1 ke v^: Kelompok dengan hanya satu periode observasi memberikan kontribusi nol ke ∑(ni−1) (pembilang SS) dan nol ke denominator — abaikan dalam kalkulasi v^, tetapi tetap sertakan dalam μ^ dan a^.
Menggunakan nilai negatif a^: Jika kalkulasi menghasilkan a^<0, set a^=0 — ini berarti tidak ada bukti heterogenitas, semua kelompok mendapat premi μ^.
⬡Kesalahan Interpretasi Soal›
Jika soal menyebut “nonparametrik”, hitung v^ dari SS within-group. Jika soal menyebut “semiparametrik dengan model Poisson”, gunakan v^=μ^. Kedua pendekatan menghasilkan estimator a^ dengan formula yang sama — perbedaannya hanya pada cara menghitung v^.
▲Red Flags›
Soal menyebut “data dari beberapa kelompok/agen/tertanggung” tanpa distribusi prior → Empirical Bayes
Soal minta “estimasi v, a, μ dari data” → nonparametrik atau semiparametrik
Muncul kata “eksposur berbeda antar periode” → Bühlmann-Straub, bukan Bühlmann standar
Hasil a^<0 → wajib set ke 0, laporkan Z=0 dan P^i=μ^ untuk semua i
Kelompok dengan ni=1 → sertakan di μ^ dan SS between, tapi abaikan di v^
Section 8 — Ringkasan Eksekutif
≡Must-Remember›
Grand mean (selalu langkah pertama):μ^=m∑imiXˉi
graph TD A["Soal kredibilitas dengan data portofolio?"] -->|"Ya"| B["Distribusi prior diberikan eksplisit?"] A -->|"Tidak"| Z["Bukan topik ini"] B -->|"Ya: Gamma, Beta, dll"| C["Gunakan Bayesian Credibility<br>[[7.3 Bayesian Credibility]]"] B -->|"Tidak: hanya data"| D["Empirical Bayes<br>Estimasi mu, v, a dari data"] D --> E["Eksposur seragam per observasi?"] E -->|"Ya: m_ij = 1"| F["Bühlmann standar<br>n_i = jumlah periode"] E -->|"Tidak: m_ij berbeda"| G["Bühlmann-Straub<br>gunakan m_ij sebagai bobot"] F --> H["Model Poisson disebutkan?"] G --> H H -->|"Ya"| I["Semiparametrik:<br>v-hat = mu-hat = grand mean"] H -->|"Tidak"| J["Nonparametrik:<br>hitung v-hat dari SS within-group"] I --> K["Hitung c, a-hat, k-hat, Z-hat<br>Lalu premi final"] J --> K
❝Follow-up Options›
“Berikan contoh soal variasi semiparametrik Poisson untuk 7.4”