AktuNotes
← Kembali
TA2 · Materi 7.4

Empirical Bayesian Methods

Calculation-Intensive Bobot: 20–25% (bersama Topik 7) Klugman et al. (2019) Bab 16, 17, 18; Tse (2009) Bab 6, 7, 8, 9 (kecuali 9.4)
TA2KredibilitasEmpiricalBayesTeoriRisiko

📊 7.4 — Empirical Bayesian Methods

Ringkasan Cepat

Topik: Empirical Bayesian Methods | Bobot: ~20–25% (Topik 7 keseluruhan) | Difficulty: Calculation-Intensive Ref: Klugman et al. (2019) Bab 16–18; Tse (2009) Bab 6–9 | Prereq: 7.2 Bühlmann and Bühlmann-Straub Models, 7.3 Bayesian Credibility


Section 0 — Pemetaan Topik

Topik TA2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Teori Kredibilitas7.4Estimasi μ\mu, vv, aa dari data; hitung premi kredibilitas empiris (nonparametrik & semiparametrik)20–25% (Topik 7)Calculation-Intensive7.2 Bühlmann and Bühlmann-Straub Models, 7.3 Bayesian Credibility7.1 Classical Credibility, 7.4 Empirical Bayesian MethodsKlugman et al. (2019) Bab 16–18; Tse (2009) Bab 6–9

Section 1 — Intuisi

Dalam model Bühlmann dan Bühlmann-Straub yang telah kita pelajari, formula premi kredibilitas ZXˉ+(1Z)μZ\bar{X} + (1-Z)\mu memerlukan tiga besaran: mean kolektif μ\mu, expected value of process variance vv, dan variance of hypothetical means aa. Masalahnya: dalam praktik asuransi nyata, kita tidak tahu nilai μ\mu, vv, dan aa — parameter-parameter ini bergantung pada distribusi prior π(θ)\pi(\theta) yang tidak pernah kita observasi secara langsung.

Di sinilah Empirical Bayesian Methods hadir sebagai jembatan antara teori Bayesian yang ideal dan realitas data. Ide dasarnya sederhana namun kuat: jika kita punya data dari banyak tertanggung atau kelompok dalam portofolio yang sama, kita bisa mengestimasi μ\mu, vv, dan aa langsung dari data tersebut — tanpa perlu menentukan distribusi prior secara eksplisit. Data dari seluruh portofolio berperan sebagai cerminan empiris dari distribusi prior yang tak terobservasi.

Terdapat dua pendekatan dalam metode ini. Pendekatan nonparametrik tidak mengasumsikan bentuk distribusi apapun — ia mengestimasi μ\mu, vv, aa murni dari momen-momen data. Ini seperti membiarkan data berbicara sendiri tanpa prasangka. Pendekatan semiparametrik lebih efisien: ia mengasumsikan bentuk distribusi likelihood (misalnya Poisson untuk frekuensi), tetapi tetap membiarkan distribusi prior bebas tanpa asumsi parametrik. Dengan kombinasi ini, estimator menjadi lebih tajam karena struktur model dimanfaatkan sebaik mungkin.


Section 2 — Definisi Formal

Definisi Matematis — Masalah Inti Empirical Bayes

Premi kredibilitas Bühlmann membutuhkan μ\mu, vv, aa yang tidak diketahui. Empirical Bayes menggantikannya dengan estimator yang dihitung dari data portofolio:

P^i=Z^iXˉi+(1Z^i)μ^,Z^i=mimi+k^,k^=v^a^\hat{P}_i = \hat{Z}_i \bar{X}_i + (1 - \hat{Z}_i)\hat{\mu}, \qquad \hat{Z}_i = \frac{m_i}{m_i + \hat{k}}, \qquad \hat{k} = \frac{\hat{v}}{\hat{a}}

di mana μ^\hat{\mu}, v^\hat{v}, a^\hat{a} adalah estimator yang dihitung dari data seluruh portofolio.


Tabel Variabel & Parameter

SimbolMaknaCatatan
rrJumlah kelompok / tertanggung dalam portofolioIndeks i=1,,ri = 1, \ldots, r
nin_iJumlah periode observasi untuk kelompok iiBisa berbeda antar kelompok
mim_iBobot eksposur kelompok ii (Bühlmann-Straub)Untuk Bühlmann standar: mi=nim_i = n_i
XijX_{ij}Kerugian per eksposur kelompok ii pada periode jjData observasi mentah
Xˉi\bar{X}_iRata-rata tertimbang kelompok iiXˉi=1mijmijXij\bar{X}_i = \frac{1}{m_i}\sum_j m_{ij} X_{ij} (Bühlmann-Straub)
Xˉ\bar{X}Grand mean seluruh portofolioRata-rata tertimbang dari Xˉi\bar{X}_i
μ\muE[μ(Θ)]E[\mu(\Theta)] — mean kolektifDiestimasi oleh μ^\hat{\mu}
vvE[v(Θ)]E[v(\Theta)] — EVPV (expected value of process variance)Diestimasi oleh v^\hat{v}
aaVar(μ(Θ))\text{Var}(\mu(\Theta)) — VHM (variance of hypothetical means)Diestimasi oleh a^\hat{a}
kkv/av/a — rasio BühlmannDiestimasi oleh k^=v^/a^\hat{k} = \hat{v}/\hat{a}
mmi=1rmi\sum_{i=1}^r m_i — total eksposur portofolioUntuk Bühlmann-Straub
ccmmi2/mm - \sum m_i^2 / m — faktor koreksi dalam estimasi aaSelalu c<mc < m

Rumus Utama

Estimator μ^\hat{\mu} (mean kolektif):

μ^=Xˉ=i=1rmiXˉii=1rmi=i=1rmiXˉim\hat{\mu} = \bar{X} = \frac{\sum_{i=1}^r m_i \bar{X}_i}{\sum_{i=1}^r m_i} = \frac{\sum_{i=1}^r m_i \bar{X}_i}{m}

Label: Grand mean tertimbang oleh eksposur masing-masing kelompok


Estimator v^\hat{v} (EVPV) — Nonparametrik:

v^=1i=1r(ni1)i=1rj=1ni(XijXˉi)2\hat{v} = \frac{1}{\sum_{i=1}^r (n_i - 1)} \sum_{i=1}^r \sum_{j=1}^{n_i} (X_{ij} - \bar{X}_i)^2

Label: Rata-rata variansi within-group; pooled sample variance di seluruh kelompok


Estimator v^\hat{v} (EVPV) — Bühlmann-Straub (bobot berbeda):

v^=1i=1r(ni1)i=1rj=1nimij(XijXˉi)2\hat{v} = \frac{1}{\sum_{i=1}^r (n_i - 1)} \sum_{i=1}^r \sum_{j=1}^{n_i} m_{ij}(X_{ij} - \bar{X}_i)^2

Label: Versi tertimbang untuk kasus Bühlmann-Straub di mana eksposur mijm_{ij} berbeda per observasi


Estimator a^\hat{a} (VHM) — Nonparametrik:

a^=1c[i=1rmi(XˉiXˉ)2(r1)v^]\hat{a} = \frac{1}{c}\left[\sum_{i=1}^r m_i(\bar{X}_i - \bar{X})^2 - (r-1)\hat{v}\right] c=mi=1rmi2mc = m - \frac{\sum_{i=1}^r m_i^2}{m}

Label: Variansi between-group setelah dikoreksi untuk komponen within-group


Estimator a^\hat{a} (VHM) — Bühlmann standar (mi=nim_i = n_i, semua eksposur = 1):

Untuk Bühlmann standar di mana setiap observasi memiliki bobot sama (mij=1m_{ij} = 1):

c=ni=1rni2n,n=i=1rnic = n - \frac{\sum_{i=1}^r n_i^2}{n}, \qquad n = \sum_{i=1}^r n_i

Label: Formula cc menjadi lebih sederhana ketika tidak ada perbedaan eksposur antar periode


Estimator semiparametrik — Kasus Poisson:

Untuk model frekuensi XijΘi=θiPoisson(θi)X_{ij} \mid \Theta_i = \theta_i \sim \text{Poisson}(\theta_i):

v^=μ^=Xˉ(karena v(θ)=θ=μ(θ) untuk Poisson)\hat{v} = \hat{\mu} = \bar{X} \quad \text{(karena } v(\theta) = \theta = \mu(\theta) \text{ untuk Poisson)}

Label: Efisiensi semiparametrik: gunakan struktur model Poisson untuk menghubungkan vv dan μ\mu


Premi kredibilitas empiris akhir:

P^i=Z^iXˉi+(1Z^i)μ^,Z^i=mimi+k^,k^=v^a^\hat{P}_i = \hat{Z}_i \bar{X}_i + (1 - \hat{Z}_i)\hat{\mu}, \qquad \hat{Z}_i = \frac{m_i}{m_i + \hat{k}}, \qquad \hat{k} = \frac{\hat{v}}{\hat{a}}

Label: Substitusi estimator empiris ke formula Bühlmann — premi dapat langsung dihitung dari data


Asumsi Eksplisit

  1. Independensi antar kelompok: Kelompok ii dan jj (iji \neq j) memiliki parameter risiko Θi\Theta_i dan Θj\Theta_j yang independen satu sama lain.
  2. Kondisional i.i.d. dalam kelompok: Diberikan Θi=θi\Theta_i = \theta_i, observasi Xi1,,XiniX_{i1}, \ldots, X_{in_i} saling independen dan memiliki distribusi yang sama.
  3. Proses stasioner: Distribusi XijΘiX_{ij} \mid \Theta_i tidak berubah antar periode jj — profil risiko individu tetap konstan.
  4. Representativitas portofolio: Data dari rr kelompok dianggap sebagai sampel acak dari distribusi prior π(θ)\pi(\theta) yang sama — portofolio merepresentasikan populasi.
  5. a^0\hat{a} \geq 0: Jika estimator a^\hat{a} menghasilkan nilai negatif (yang mungkin terjadi secara aljabar), maka konvensi standar adalah set a^=0\hat{a} = 0, yang berarti k^\hat{k} \to \infty dan Z=0Z = 0 — semua kelompok mendapat premi grand mean μ^\hat{\mu}.

Section 3 — Jembatan Logika

Dari “Parameter Tidak Diketahui” ke “Estimasi dari Data”

Masalah fundamental Bühlmann adalah: premi ZXˉ+(1Z)μZ\bar{X} + (1-Z)\mu membutuhkan μ\mu, vv, aa yang semuanya bergantung pada distribusi prior π(θ)\pi(\theta) yang tidak pernah kita ketahui secara eksplisit. Empirical Bayes memecahkan ini dengan observasi kunci: momen data dari seluruh portofolio adalah estimator konsisten dari momen prior. Total variansi data dapat didekomposisi menjadi komponen within-group (v\approx v) dan between-group (a+v/n\approx a + v/n) — dari sini kita dapat memisahkan vv dan aa secara empiris.

Dekomposisi Variansi — Jantung Metode

Identitas kunci yang mendasari semua estimator empiris adalah dekomposisi:

Var(Xij)=E[v(Θ)]v+Var(μ(Θ))a\text{Var}(X_{ij}) = \underbrace{E[v(\Theta)]}_{v} + \underbrace{\text{Var}(\mu(\Theta))}_{a}

Variansi total data = EVPV (within-group) + VHM (between-group). Estimator v^\hat{v} menangkap komponen within-group (variansi di dalam satu kelompok). Estimator a^\hat{a} menangkap komponen between-group (variansi antar kelompok), dikoreksi agar tidak terdistorsi oleh komponen within-group.


Derivasi Estimator a^\hat{a} — Langkah demi Langkah

Konteks: Bühlmann standar — rr kelompok, masing-masing nin_i periode, eksposur per observasi = 1.

Langkah 1 — Hitung expected value dari statistik between-group:

E[i=1rni(XˉiXˉ)2]E\left[\sum_{i=1}^r n_i(\bar{X}_i - \bar{X})^2\right]

Kembangkan kuadrat dan ambil ekspektasinya. Gunakan fakta bahwa:

E[Xˉi2]=Var(Xˉi)+(E[Xˉi])2=vni+a+μ2E[\bar{X}_i^2] = \text{Var}(\bar{X}_i) + (E[\bar{X}_i])^2 = \frac{v}{n_i} + a + \mu^2 E[Xˉ2]=Var(Xˉ)+μ2=vm+a+μ2ni2am2+E[\bar{X}^2] = \text{Var}(\bar{X}) + \mu^2 = \frac{v}{m} + a + \mu^2 - \frac{\sum n_i^2 \cdot a}{m^2} + \cdots

Langkah 2 — Hasil ekspektasi:

Setelah aljabar yang panjang (lihat Klugman Bab 17), diperoleh:

E[i=1rni(XˉiXˉ)2]=(r1)v+caE\left[\sum_{i=1}^r n_i(\bar{X}_i - \bar{X})^2\right] = (r-1)v + c \cdot a

di mana c=mni2mc = m - \dfrac{\sum n_i^2}{m}.

Langkah 3 — Isolasi aa:

ca=E[i=1rni(XˉiXˉ)2](r1)vc \cdot a = E\left[\sum_{i=1}^r n_i(\bar{X}_i - \bar{X})^2\right] - (r-1)v

Langkah 4 — Substitusi estimator untuk mendapat a^\hat{a}:

a^=1c[i=1rni(XˉiXˉ)2(r1)v^]\hat{a} = \frac{1}{c}\left[\sum_{i=1}^r n_i(\bar{X}_i - \bar{X})^2 - (r-1)\hat{v}\right]

Langkah 5 — Interpretasi cc:

cc adalah faktor koreksi yang menghilangkan bias dari bobot eksposur yang tidak seimbang. Perhatikan bahwa c<mc < m selalu berlaku (karena ni2/m>0\sum n_i^2/m > 0). Jika semua nin_i sama (ni=n0n_i = n_0 untuk semua ii), maka:

c=rn0rn02rn0=rn0n0=n0(r1)c = rn_0 - \frac{r \cdot n_0^2}{rn_0} = rn_0 - n_0 = n_0(r-1)
Dilarang
  1. Jangan menggunakan c=mrc = m - r sebagai rumus universal — formula cc bergantung pada distribusi nin_i antar kelompok. Hanya jika semua nin_i sama dan mij=1m_{ij} = 1 maka c=n0(r1)c = n_0(r-1).
  2. Jangan menganggap a^\hat{a} selalu positif — secara aljabar a^\hat{a} bisa negatif. Jika itu terjadi, set a^=0\hat{a} = 0 (bukan abaikan atau gunakan nilai negatifnya).
  3. Jangan menggunakan v^=μ^\hat{v} = \hat{\mu} di luar konteks Poisson — persamaan v=μv = \mu hanya berlaku untuk distribusi Poisson (di mana mean = variance). Untuk distribusi lain, v^\hat{v} harus dihitung dari variansi within-group.

Section 4 — Contoh Soal

Soal A — Fundamental

Sebuah portofolio asuransi terdiri dari r=3r = 3 kelompok. Data frekuensi klaim tahunan (setiap observasi berbobot 1):

Kelompoknin_iObservasi XijX_{ij}Xˉi\bar{X}_i
123, 54
232, 4, 33
326, 87

Hitung estimator nonparametrik μ^\hat{\mu}, v^\hat{v}, dan a^\hat{a}.

Solusi Soal A

Pendekatan: Hitung grand mean, lalu within-group variance (v^\hat{v}), lalu between-group variance dikoreksi (a^\hat{a}).

1. Identifikasi Variabel

  • r=3r = 3, n1=2n_1 = 2, n2=3n_2 = 3, n3=2n_3 = 2
  • m=n1+n2+n3=7m = n_1 + n_2 + n_3 = 7
  • Xˉ1=4\bar{X}_1 = 4, Xˉ2=3\bar{X}_2 = 3, Xˉ3=7\bar{X}_3 = 7

2. Identifikasi Distribusi / Model Bühlmann standar, eksposur per observasi = 1. Estimator nonparametrik — tidak ada asumsi distribusi.

3. Setup Persamaan

μ^=niXˉim,v^=ij(XijXˉi)2i(ni1),a^=1c[ini(XˉiXˉ)2(r1)v^]\hat{\mu} = \frac{\sum n_i \bar{X}_i}{m}, \quad \hat{v} = \frac{\sum_i \sum_j (X_{ij} - \bar{X}_i)^2}{\sum_i(n_i - 1)}, \quad \hat{a} = \frac{1}{c}\left[\sum_i n_i(\bar{X}_i - \bar{X})^2 - (r-1)\hat{v}\right]

4. Eksekusi Aljabar

μ^\hat{\mu}:

μ^=2(4)+3(3)+2(7)7=8+9+147=3174,429\hat{\mu} = \frac{2(4) + 3(3) + 2(7)}{7} = \frac{8 + 9 + 14}{7} = \frac{31}{7} \approx 4{,}429

v^\hat{v} — hitung SS within-group:

Kelompok 1: (34)2+(54)2=1+1=2(3-4)^2 + (5-4)^2 = 1 + 1 = 2

Kelompok 2: (23)2+(43)2+(33)2=1+1+0=2(2-3)^2 + (4-3)^2 + (3-3)^2 = 1 + 1 + 0 = 2

Kelompok 3: (67)2+(87)2=1+1=2(6-7)^2 + (8-7)^2 = 1 + 1 = 2

v^=2+2+2(21)+(31)+(21)=61+2+1=64=1,5\hat{v} = \frac{2 + 2 + 2}{(2-1)+(3-1)+(2-1)} = \frac{6}{1+2+1} = \frac{6}{4} = 1{,}5

a^\hat{a} — hitung cc dan SS between-group:

c=mni2m=74+9+47=7177=49177=327c = m - \frac{\sum n_i^2}{m} = 7 - \frac{4 + 9 + 4}{7} = 7 - \frac{17}{7} = \frac{49 - 17}{7} = \frac{32}{7}

SS between-group:

ni(XˉiXˉ)2=2 ⁣(4317)2+3 ⁣(3317)2+2 ⁣(7317)2\sum n_i(\bar{X}_i - \bar{X})^2 = 2\!\left(4 - \tfrac{31}{7}\right)^2 + 3\!\left(3 - \tfrac{31}{7}\right)^2 + 2\!\left(7 - \tfrac{31}{7}\right)^2 =2 ⁣(28317)2+3 ⁣(21317)2+2 ⁣(49317)2= 2\!\left(\tfrac{28-31}{7}\right)^2 + 3\!\left(\tfrac{21-31}{7}\right)^2 + 2\!\left(\tfrac{49-31}{7}\right)^2 =2949+310049+232449=18+300+64849=96649= 2 \cdot \frac{9}{49} + 3 \cdot \frac{100}{49} + 2 \cdot \frac{324}{49} = \frac{18 + 300 + 648}{49} = \frac{966}{49} a^=132/7[96649(31)(1,5)]=732[966493]=73296614749=73281949=8192243,656\hat{a} = \frac{1}{32/7}\left[\frac{966}{49} - (3-1)(1{,}5)\right] = \frac{7}{32}\left[\frac{966}{49} - 3\right] = \frac{7}{32} \cdot \frac{966 - 147}{49} = \frac{7}{32} \cdot \frac{819}{49} = \frac{819}{224} \approx 3{,}656

5. Verification v^=1,5>0\hat{v} = 1{,}5 > 0 ✓. a^3,656>0\hat{a} \approx 3{,}656 > 0 ✓. Nilai a^\hat{a} jauh lebih besar dari v^\hat{v}, mencerminkan heterogenitas besar antar kelompok (Xˉ3=7\bar{X}_3 = 7 vs Xˉ2=3\bar{X}_2 = 3).

Hasil: μ^=31/74,429\hat{\mu} = 31/7 \approx 4{,}429; v^=1,5\hat{v} = 1{,}5; a^3,656\hat{a} \approx 3{,}656

Exam Tips — Soal A

Target waktu: 4 menit. Common trap: Membagi SS between-group dengan (r1)(r-1) tanpa faktor koreksi cc — ini salah. Faktor cc selalu berbeda dari (r1)(r-1) kecuali kasus khusus. Shortcut: Hitung cc pertama kali sebelum apapun — ini sering menjadi sumber kesalahan utama.


Soal B — Exam-Typical

Lanjutan Soal A. Hitung premi kredibilitas empiris Bühlmann untuk masing-masing kelompok pada tahun berikutnya.

Solusi Soal B

Pendekatan: Gunakan μ^\hat{\mu}, v^\hat{v}, a^\hat{a} dari Soal A untuk menghitung k^\hat{k}, Z^i\hat{Z}_i, dan premi P^i\hat{P}_i.

1. Identifikasi Variabel Dari Soal A: μ^=31/7\hat{\mu} = 31/7, v^=1,5\hat{v} = 1{,}5, a^=819/224\hat{a} = 819/224

2. Identifikasi Distribusi / Model Bühlmann standar. Premi = Z^iXˉi+(1Z^i)μ^\hat{Z}_i \bar{X}_i + (1-\hat{Z}_i)\hat{\mu}.

3. Setup Persamaan

k^=v^a^,Z^i=nini+k^,P^i=Z^iXˉi+(1Z^i)μ^\hat{k} = \frac{\hat{v}}{\hat{a}}, \qquad \hat{Z}_i = \frac{n_i}{n_i + \hat{k}}, \qquad \hat{P}_i = \hat{Z}_i \bar{X}_i + (1-\hat{Z}_i)\hat{\mu}

4. Eksekusi Aljabar

k^\hat{k}:

k^=1,5819/224=1,5×224819=336819=1122730,4103\hat{k} = \frac{1{,}5}{819/224} = \frac{1{,}5 \times 224}{819} = \frac{336}{819} = \frac{112}{273} \approx 0{,}4103

Kelompok 1 (n1=2n_1 = 2, Xˉ1=4\bar{X}_1 = 4):

Z^1=22+0,4103=22,41030,8296\hat{Z}_1 = \frac{2}{2 + 0{,}4103} = \frac{2}{2{,}4103} \approx 0{,}8296 P^1=0,8296×4+0,1704×4,4293,318+0,755=4,073\hat{P}_1 = 0{,}8296 \times 4 + 0{,}1704 \times 4{,}429 \approx 3{,}318 + 0{,}755 = 4{,}073

Kelompok 2 (n2=3n_2 = 3, Xˉ2=3\bar{X}_2 = 3):

Z^2=33+0,4103=33,41030,8797\hat{Z}_2 = \frac{3}{3 + 0{,}4103} = \frac{3}{3{,}4103} \approx 0{,}8797 P^2=0,8797×3+0,1203×4,4292,639+0,533=3,172\hat{P}_2 = 0{,}8797 \times 3 + 0{,}1203 \times 4{,}429 \approx 2{,}639 + 0{,}533 = 3{,}172

Kelompok 3 (n3=2n_3 = 2, Xˉ3=7\bar{X}_3 = 7):

Z^3=22+0,41030,8296(sama dengan kelompok 1)\hat{Z}_3 = \frac{2}{2 + 0{,}4103} \approx 0{,}8296 \quad \text{(sama dengan kelompok 1)} P^3=0,8296×7+0,1704×4,4295,807+0,755=6,562\hat{P}_3 = 0{,}8296 \times 7 + 0{,}1704 \times 4{,}429 \approx 5{,}807 + 0{,}755 = 6{,}562

5. Verification Semua premi berada di antara μ^4,429\hat{\mu} \approx 4{,}429 dan Xˉi\bar{X}_i. Kelompok 2 (Xˉ2=3<μ^\bar{X}_2 = 3 < \hat{\mu}) mendapat premi di bawah μ^\hat{\mu}; kelompok 3 (Xˉ3=7>μ^\bar{X}_3 = 7 > \hat{\mu}) mendapat premi di atas μ^\hat{\mu} ✓. k^\hat{k} kecil (0,41\approx 0{,}41) berarti ZZ tinggi — data individu sangat dominan.

Hasil: P^14,073\hat{P}_1 \approx 4{,}073; P^23,172\hat{P}_2 \approx 3{,}172; P^36,562\hat{P}_3 \approx 6{,}562

Exam Tips — Soal B

Target waktu: 3 menit (setelah Soal A selesai). Common trap: Lupa bahwa k^\hat{k} kecil berarti ZZ besar (data lebih dominan dari grand mean), bukan sebaliknya. Shortcut: Jika nin_i sama untuk beberapa kelompok, Z^i\hat{Z}_i identik — cukup hitung sekali.


Soal C — Challenging

Sebuah perusahaan asuransi memiliki r=4r = 4 agen dengan data klaim per polis (Bühlmann-Straub — eksposur berbeda):

Agen iiTahun 1: (mi1,Xi1)(m_{i1}, X_{i1})Tahun 2: (mi2,Xi2)(m_{i2}, X_{i2})Tahun 3: (mi3,Xi3)(m_{i3}, X_{i3})
1(100, 0{,}04)(150, 0{,}06)(200, 0{,}05)
2(200, 0{,}08)(200, 0{,}07)
3(50, 0{,}02)(100, 0{,}03)(150, 0{,}04)
4(300, 0{,}05)

Hitung μ^\hat{\mu}, v^\hat{v}, a^\hat{a} menggunakan estimator Bühlmann-Straub nonparametrik, kemudian hitung premi kredibilitas untuk Agen 1 dan 2.

Solusi Soal C

Pendekatan: Bühlmann-Straub dengan eksposur berbeda. Hitung Xˉi\bar{X}_i tertimbang per agen, lalu grand mean, lalu v^\hat{v} dan a^\hat{a} versi Bühlmann-Straub.

1. Identifikasi Variabel

Agen 1: m1=100+150+200=450m_1 = 100+150+200 = 450, n1=3n_1 = 3

Agen 2: m2=200+200=400m_2 = 200+200 = 400, n2=2n_2 = 2

Agen 3: m3=50+100+150=300m_3 = 50+100+150 = 300, n3=3n_3 = 3

Agen 4: m4=300m_4 = 300, n4=1n_4 = 1

Total: m=450+400+300+300=1450m = 450 + 400 + 300 + 300 = 1450

2. Identifikasi Distribusi / Model Bühlmann-Straub nonparametrik: Xˉi=jmijXijmi\bar{X}_i = \frac{\sum_j m_{ij} X_{ij}}{m_i}; v^\hat{v} menggunakan SS tertimbang.

3. Setup Persamaan

Xˉi=jmijXijmi,μ^=imiXˉim\bar{X}_i = \frac{\sum_j m_{ij} X_{ij}}{m_i}, \quad \hat{\mu} = \frac{\sum_i m_i \bar{X}_i}{m} v^=ijmij(XijXˉi)2i(ni1),c=mimi2m\hat{v} = \frac{\sum_i \sum_j m_{ij}(X_{ij} - \bar{X}_i)^2}{\sum_i(n_i - 1)}, \quad c = m - \frac{\sum_i m_i^2}{m}

4. Eksekusi Aljabar

Rata-rata tertimbang per agen Xˉi\bar{X}_i:

Xˉ1=100(0,04)+150(0,06)+200(0,05)450=4+9+10450=234500,05111\bar{X}_1 = \frac{100(0{,}04)+150(0{,}06)+200(0{,}05)}{450} = \frac{4+9+10}{450} = \frac{23}{450} \approx 0{,}05111 Xˉ2=200(0,08)+200(0,07)400=16+14400=30400=0,075\bar{X}_2 = \frac{200(0{,}08)+200(0{,}07)}{400} = \frac{16+14}{400} = \frac{30}{400} = 0{,}075 Xˉ3=50(0,02)+100(0,03)+150(0,04)300=1+3+6300=103000,03333\bar{X}_3 = \frac{50(0{,}02)+100(0{,}03)+150(0{,}04)}{300} = \frac{1+3+6}{300} = \frac{10}{300} \approx 0{,}03333 Xˉ4=0,05(n4=1, hanya satu observasi)\bar{X}_4 = 0{,}05 \quad (n_4 = 1, \text{ hanya satu observasi})

Grand mean μ^\hat{\mu}:

μ^=450(0,05111)+400(0,075)+300(0,03333)+300(0,05)1450\hat{\mu} = \frac{450(0{,}05111) + 400(0{,}075) + 300(0{,}03333) + 300(0{,}05)}{1450} =23+30+10+151450=7814500,05379= \frac{23 + 30 + 10 + 15}{1450} = \frac{78}{1450} \approx 0{,}05379

v^\hat{v} — SS tertimbang within-group (Agen 4 dikecualikan karena n41=0n_4 - 1 = 0):

Agen 1: jm1j(X1jXˉ1)2\sum_j m_{1j}(X_{1j}-\bar{X}_1)^2:

100(0,040,05111)2+150(0,060,05111)2+200(0,050,05111)2100(0{,}04-0{,}05111)^2 + 150(0{,}06-0{,}05111)^2 + 200(0{,}05-0{,}05111)^2 =100(0,01111)2+150(0,00889)2+200(0,00111)2= 100(0{,}01111)^2 + 150(0{,}00889)^2 + 200(0{,}00111)^2 100(0,0001235)+150(0,0000790)+200(0,0000012)\approx 100(0{,}0001235) + 150(0{,}0000790) + 200(0{,}0000012) 0,01235+0,01185+0,00024=0,02444\approx 0{,}01235 + 0{,}01185 + 0{,}00024 = 0{,}02444

Agen 2: jm2j(X2jXˉ2)2\sum_j m_{2j}(X_{2j}-\bar{X}_2)^2:

200(0,080,075)2+200(0,070,075)2=200(0,005)2+200(0,005)2200(0{,}08-0{,}075)^2 + 200(0{,}07-0{,}075)^2 = 200(0{,}005)^2 + 200(0{,}005)^2 =200(0,000025)+200(0,000025)=0,01= 200(0{,}000025) + 200(0{,}000025) = 0{,}01

Agen 3: jm3j(X3jXˉ3)2\sum_j m_{3j}(X_{3j}-\bar{X}_3)^2:

50(0,020,03333)2+100(0,030,03333)2+150(0,040,03333)250(0{,}02-0{,}03333)^2 + 100(0{,}03-0{,}03333)^2 + 150(0{,}04-0{,}03333)^2 =50(0,01333)2+100(0,00333)2+150(0,00667)2= 50(0{,}01333)^2 + 100(0{,}00333)^2 + 150(0{,}00667)^2 50(0,0001777)+100(0,0000111)+150(0,0000444)\approx 50(0{,}0001777) + 100(0{,}0000111) + 150(0{,}0000444) 0,008885+0,001110+0,006660=0,016655\approx 0{,}008885 + 0{,}001110 + 0{,}006660 = 0{,}016655

Total SS within: 0,02444+0,01+0,016655=0,0510950{,}02444 + 0{,}01 + 0{,}016655 = 0{,}051095

i(ni1)=2+1+2+0=5\sum_i(n_i - 1) = 2 + 1 + 2 + 0 = 5 v^=0,05109550,010219\hat{v} = \frac{0{,}051095}{5} \approx 0{,}010219

Faktor cc:

c=14504502+4002+3002+30021450=1450202500+160000+90000+900001450c = 1450 - \frac{450^2 + 400^2 + 300^2 + 300^2}{1450} = 1450 - \frac{202500+160000+90000+90000}{1450} =14505425001450=1450374,138=1075,862= 1450 - \frac{542500}{1450} = 1450 - 374{,}138 = 1075{,}862

a^\hat{a} — SS between-group:

imi(Xˉiμ^)2\sum_i m_i(\bar{X}_i - \hat{\mu})^2:

450(0,051110,05379)2+400(0,0750,05379)2+300(0,033330,05379)2+300(0,050,05379)2450(0{,}05111-0{,}05379)^2 + 400(0{,}075-0{,}05379)^2 + 300(0{,}03333-0{,}05379)^2 + 300(0{,}05-0{,}05379)^2 =450(0,00268)2+400(0,02121)2+300(0,02046)2+300(0,00379)2= 450(0{,}00268)^2 + 400(0{,}02121)^2 + 300(0{,}02046)^2 + 300(0{,}00379)^2 450(7,18×106)+400(4,50×104)+300(4,19×104)+300(1,44×105)\approx 450(7{,}18\times10^{-6}) + 400(4{,}50\times10^{-4}) + 300(4{,}19\times10^{-4}) + 300(1{,}44\times10^{-5}) 0,003231+0,179928+0,125676+0,004314=0,313149\approx 0{,}003231 + 0{,}179928 + 0{,}125676 + 0{,}004314 = 0{,}313149 a^=11075,862[0,313149(41)(0,010219)]=0,3131490,0306571075,862=0,2824921075,8620,0002626\hat{a} = \frac{1}{1075{,}862}\left[0{,}313149 - (4-1)(0{,}010219)\right] = \frac{0{,}313149 - 0{,}030657}{1075{,}862} = \frac{0{,}282492}{1075{,}862} \approx 0{,}0002626

Premi kredibilitas Agen 1 dan 2:

k^=v^a^=0,0102190,000262638,91\hat{k} = \frac{\hat{v}}{\hat{a}} = \frac{0{,}010219}{0{,}0002626} \approx 38{,}91 Z^1=m1m1+k^=450450+38,91450488,910,9204\hat{Z}_1 = \frac{m_1}{m_1 + \hat{k}} = \frac{450}{450 + 38{,}91} \approx \frac{450}{488{,}91} \approx 0{,}9204 P^1=0,9204(0,05111)+0,0796(0,05379)0,04703+0,00428=0,05131\hat{P}_1 = 0{,}9204(0{,}05111) + 0{,}0796(0{,}05379) \approx 0{,}04703 + 0{,}00428 = 0{,}05131 Z^2=400400+38,91400438,910,9114\hat{Z}_2 = \frac{400}{400 + 38{,}91} \approx \frac{400}{438{,}91} \approx 0{,}9114 P^2=0,9114(0,075)+0,0886(0,05379)0,06836+0,00477=0,07312\hat{P}_2 = 0{,}9114(0{,}075) + 0{,}0886(0{,}05379) \approx 0{,}06836 + 0{,}00477 = 0{,}07312

5. Verification P^10,0513\hat{P}_1 \approx 0{,}0513 berada antara μ^=0,0538\hat{\mu} = 0{,}0538 dan Xˉ1=0,0511\bar{X}_1 = 0{,}0511 ✓. P^20,0731\hat{P}_2 \approx 0{,}0731 berada antara μ^\hat{\mu} dan Xˉ2=0,075\bar{X}_2 = 0{,}075 ✓. k^\hat{k} besar (39\approx 39) menunjukkan vav \gg a — heterogenitas antar agen relatif kecil dibanding noise dalam kelompok, sehingga ZZ tidak setinggi yang diperkirakan meski mim_i besar.

Hasil: P^10,0513\hat{P}_1 \approx 0{,}0513 per polis; P^20,0731\hat{P}_2 \approx 0{,}0731 per polis.

Exam Tips — Soal C

Target waktu: 8–10 menit. Common trap 1: Memasukkan Agen 4 (satu periode) ke dalam perhitungan v^\hat{v} — agen dengan ni=1n_i = 1 memberikan kontribusi nol pada (ni1)\sum(n_i - 1) dan SS within. Common trap 2: Lupa menggunakan mim_i (total eksposur agen) sebagai bobot dalam SS between-group, bukan nin_i. Shortcut: Susun tabel bantu kolom miXˉim_i \bar{X}_i dan miXˉi2m_i \bar{X}_i^2 untuk efisiensi kalkulasi.


Section 5 — Verifikasi & Sanity Check

Sanity Check 1 — Konsistensi Grand Mean

Grand mean μ^\hat{\mu} harus dapat diverifikasi dua cara: (1) sebagai miXˉi/m\sum m_i \bar{X}_i / m, dan (2) sebagai ijmijXij/m\sum_i \sum_j m_{ij} X_{ij} / m. Keduanya harus menghasilkan nilai identik. Jika berbeda, ada kesalahan di kalkulasi Xˉi\bar{X}_i atau mim_i.

Sanity Check 2 — Premi Antara Grand Mean dan Sample Mean

Untuk setiap kelompok ii, premi kredibilitas P^i\hat{P}_i harus berada di antara μ^\hat{\mu} dan Xˉi\bar{X}_i:

min(μ^,Xˉi)P^imax(μ^,Xˉi)\min(\hat{\mu},\, \bar{X}_i) \leq \hat{P}_i \leq \max(\hat{\mu},\, \bar{X}_i)

Ini selalu berlaku karena 0Z^i10 \leq \hat{Z}_i \leq 1.

Sanity Check 3 — Weighted Average Premi = Grand Mean

Total premi tertimbang harus kembali ke grand mean:

imiP^iimi=μ^\frac{\sum_i m_i \hat{P}_i}{\sum_i m_i} = \hat{\mu}

Ini adalah properti penting: sistem premi empiris Bühlmann bersifat actuarially balanced.

Metode Alternatif — Semiparametrik Poisson

Untuk model frekuensi klaim di mana XijΘiPoisson(Θi)X_{ij} \mid \Theta_i \sim \text{Poisson}(\Theta_i), struktur Poisson memberikan shortcut:

v(θ)=θ=μ(θ)    E[v(Θ)]=E[μ(Θ)]    v=μv(\theta) = \theta = \mu(\theta) \implies E[v(\Theta)] = E[\mu(\Theta)] \implies v = \mu

Oleh karena itu cukup gunakan:

v^=μ^=Xˉ\hat{v} = \hat{\mu} = \bar{X}

Ini tidak perlu menghitung SS within-group — cukup baca grand mean. Efisiensi besar di exam.


Section 6 — Visualisasi Mental

Dekomposisi Variansi sebagai “Dua Sumber Ketidakpastian”:

Total variasi data X_ij

          ├─── Within-group (variansi di dalam satu kelompok)
          │         ≈ proses acak / noise alam
          │         → estimasi v (EVPV)

          └─── Between-group (variansi antar kelompok)
                    ≈ heterogenitas nyata antar profil risiko
                    → estimasi a (VHM), setelah koreksi komponen within

Pengaruh k^=v^/a^\hat{k} = \hat{v}/\hat{a} terhadap premi:

Besar k (v >> a):          Kecil k (a >> v):
Homogen, noise besar       Heterogen, noise kecil

Z rendah → premi → μ̂      Z tinggi → premi → X̄ᵢ
(grand mean mendominasi)   (data individu mendominasi)

Agen yang baru (m kecil)   Agen lama (m besar)
pun ditarik ke μ̂           mendapat Z ≈ 1

Hubungan Visual ↔ Rumus

Elemen VisualKomponen Rumus
Lebar distribusi dalam satu kelompokv=E[v(Θ)]v = E[v(\Theta)] — EVPV
Jarak antar mean kelompoka=Var(μ(Θ))a = \text{Var}(\mu(\Theta)) — VHM
Rasio k=v/ak = v/aKompetisi: noise vs heterogenitas nyata
Ukuran kelompok mim_iSemakin besar → ZiZ_i semakin tinggi
Grand mean μ^\hat{\mu}Titik gravitasi seluruh portofolio

Section 7 — Jebakan Umum

Kesalahan Parametrisasi — Bühlmann vs Bühlmann-Straub

Bühlmann standar: mij=1m_{ij} = 1 untuk semua i,ji, j (eksposur seragam). Bühlmann-Straub: mijm_{ij} berbeda. Jika soal menyebut “eksposur” atau “jumlah polis” yang berbeda antar periode, itu pasti Bühlmann-Straub. Jangan menggunakan formula Bühlmann standar untuk data Bühlmann-Straub.

Kesalahan Konseptual
  1. Mengira c=r1c = r - 1 atau c=mrc = m - r: Formula c=mmi2/mc = m - \sum m_i^2/m berbeda dari r1r-1 kecuali dalam kasus sangat khusus. Selalu hitung cc dari definisinya.
  2. Menggunakan v^=μ^\hat{v} = \hat{\mu} tanpa asumsi Poisson: Identitas v=μv = \mu hanya berlaku untuk distribusi Poisson. Soal harus secara eksplisit menyebut Poisson atau memberikan v(θ)=θv(\theta) = \theta.
  3. Memasukkan kelompok dengan ni=1n_i = 1 ke v^\hat{v}: Kelompok dengan hanya satu periode observasi memberikan kontribusi nol ke (ni1)\sum(n_i - 1) (pembilang SS) dan nol ke denominator — abaikan dalam kalkulasi v^\hat{v}, tetapi tetap sertakan dalam μ^\hat{\mu} dan a^\hat{a}.
  4. Menggunakan nilai negatif a^\hat{a}: Jika kalkulasi menghasilkan a^<0\hat{a} < 0, set a^=0\hat{a} = 0 — ini berarti tidak ada bukti heterogenitas, semua kelompok mendapat premi μ^\hat{\mu}.
Kesalahan Interpretasi Soal

Jika soal menyebut “nonparametrik”, hitung v^\hat{v} dari SS within-group. Jika soal menyebut “semiparametrik dengan model Poisson”, gunakan v^=μ^\hat{v} = \hat{\mu}. Kedua pendekatan menghasilkan estimator a^\hat{a} dengan formula yang sama — perbedaannya hanya pada cara menghitung v^\hat{v}.

Red Flags
  • Soal menyebut “data dari beberapa kelompok/agen/tertanggung” tanpa distribusi prior → Empirical Bayes
  • Soal minta “estimasi vv, aa, μ\mu dari data” → nonparametrik atau semiparametrik
  • Muncul kata “eksposur berbeda antar periode” → Bühlmann-Straub, bukan Bühlmann standar
  • Hasil a^<0\hat{a} < 0 → wajib set ke 0, laporkan Z=0Z = 0 dan P^i=μ^\hat{P}_i = \hat{\mu} untuk semua ii
  • Kelompok dengan ni=1n_i = 1 → sertakan di μ^\hat{\mu} dan SS between, tapi abaikan di v^\hat{v}

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Grand mean (selalu langkah pertama): μ^=imiXˉim\hat{\mu} = \frac{\sum_i m_i \bar{X}_i}{m}

  2. EVPV nonparametrik: v^=ijmij(XijXˉi)2i(ni1)\hat{v} = \frac{\sum_i \sum_j m_{ij}(X_{ij}-\bar{X}_i)^2}{\sum_i(n_i-1)}

  3. Faktor koreksi dan VHM: c=mimi2m,a^=1c ⁣[imi(Xˉiμ^)2(r1)v^]c = m - \frac{\sum_i m_i^2}{m}, \qquad \hat{a} = \frac{1}{c}\!\left[\sum_i m_i(\bar{X}_i - \hat{\mu})^2 - (r-1)\hat{v}\right]

  4. Shortcut semiparametrik Poisson: v^=μ^=Xˉ\hat{v} = \hat{\mu} = \bar{X}

  5. Premi final: P^i=Z^iXˉi+(1Z^i)μ^,Z^i=mimi+k^,k^=v^a^\hat{P}_i = \hat{Z}_i \bar{X}_i + (1-\hat{Z}_i)\hat{\mu}, \qquad \hat{Z}_i = \frac{m_i}{m_i + \hat{k}}, \qquad \hat{k} = \frac{\hat{v}}{\hat{a}}

Kapan Digunakan

  • Soal memberikan data dari banyak kelompok tanpa menyebutkan distribusi prior secara eksplisit
  • Soal minta mengestimasi μ\mu, vv, aa dari data portofolio
  • Soal menyebut “nonparametrik” atau “semiparametrik” dalam konteks kredibilitas
  • Soal memberikan eksposur berbeda antar kelompok/periode → Bühlmann-Straub empiris

Kapan TIDAK Boleh Digunakan

  • Ketika distribusi prior diberikan secara eksplisit (e.g., Gamma, Beta) → gunakan 7.3 Bayesian Credibility (Bayes eksak)
  • Ketika hanya ada satu kelompok (tidak ada informasi between-group untuk mengestimasi aa)
  • Ketika soal minta Bühlmann teoritis dengan vv dan aa yang sudah diberikan langsung → gunakan 7.2 Bühlmann and Bühlmann-Straub Models tanpa estimasi

Quick Decision Tree

graph TD
    A["Soal kredibilitas dengan data portofolio?"] -->|"Ya"| B["Distribusi prior diberikan eksplisit?"]
    A -->|"Tidak"| Z["Bukan topik ini"]
    B -->|"Ya: Gamma, Beta, dll"| C["Gunakan Bayesian Credibility<br>[[7.3 Bayesian Credibility]]"]
    B -->|"Tidak: hanya data"| D["Empirical Bayes<br>Estimasi mu, v, a dari data"]
    D --> E["Eksposur seragam per observasi?"]
    E -->|"Ya: m_ij = 1"| F["Bühlmann standar<br>n_i = jumlah periode"]
    E -->|"Tidak: m_ij berbeda"| G["Bühlmann-Straub<br>gunakan m_ij sebagai bobot"]
    F --> H["Model Poisson disebutkan?"]
    G --> H
    H -->|"Ya"| I["Semiparametrik:<br>v-hat = mu-hat = grand mean"]
    H -->|"Tidak"| J["Nonparametrik:<br>hitung v-hat dari SS within-group"]
    I --> K["Hitung c, a-hat, k-hat, Z-hat<br>Lalu premi final"]
    J --> K

Follow-up Options
  1. “Berikan contoh soal variasi semiparametrik Poisson untuk 7.4”
  2. “Jelaskan perbedaan antara 7.3 Bayesian Credibility dan 7.4 Empirical Bayesian Methods secara konseptual”
  3. “Buat flashcard 1-halaman untuk formula estimator nonparametrik di 7.4”

📖 Ref: Klugman et al. (2019) Bab 16–18; Tse (2009) Bab 6–9 | 🗓️ 2026-04-19 | #TA2 #EmpiricalBayes #TeoriRisiko