Topik: (a,b,0) and (a,b,1) Distribution Classes | Bobot: ~5–10% | Difficulty: Hard
Ref: Klugman et al. (2019) Loss Models 5th ed., Bab 6 | Prereq:2.1 Frequency MGF and PGF
Section 0 — Pemetaan Topik
Topik TA2
Sub-topik ID
Skill Diuji
Bobot
Difficulty
Prerequisite
Connected Topics
Referensi
Model Frekuensi Klaim
2.2
Mengidentifikasi dan mengklasifikasikan distribusi ke kelas (a,b,0) atau (a,b,1); mendapatkan distribusi kelas (a,b,1) dari (a,b,0) via zero-truncated dan zero-modified; menghitung probabilitas dari relasi rekursif Panjer
Bayangkan seorang aktuaris di perusahaan asuransi kendaraan bermotor sedang menganalisis data frekuensi klaim polis selama setahun. Dari ribuan polis, sebagian besar tidak mengajukan klaim sama sekali (nol klaim), sebagian kecil mengajukan satu klaim, lebih sedikit lagi yang mengajukan dua klaim, dan seterusnya. Pertanyaannya: distribusi probabilitas apa yang paling cocok untuk menggambarkan pola ini? Apakah Poisson, Binomial, Negatif Binomial, atau sesuatu yang lebih fleksibel?
Kelas distribusi (a,b,0) adalah jawaban elegan atas pertanyaan ini. Alih-alih mempelajari setiap distribusi frekuensi secara terpisah, kelas (a,b,0) menyatukan semua distribusi yang memiliki satu sifat bersama: rasio probabilitas titik berturutan pk/pk−1 mengikuti pola linear sederhana dalam k. Dengan dua parameter saja — a dan b — kita bisa menghasilkan Poisson (dengan a=0), Binomial (dengan a<0), dan Negatif Binomial (dengan a>0). Sifat rekursif ini juga menjadi fondasi dari Formula Rekursif Panjer yang akan digunakan di Topik 4.
Namun ada masalah: data dunia nyata seringkali menunjukkan jumlah polis dengan nol klaim yang jauh lebih banyak (atau jauh lebih sedikit) dari yang diprediksi oleh distribusi Poisson atau Binomial standar. Fenomena ini disebut zero-inflation atau zero-deflation. Kelas (a,b,1) hadir untuk mengatasi hal ini — ia memungkinkan kita memodifikasi probabilitas di titik nol secara bebas, sambil mempertahankan relasi rekursif yang sama untuk k≥1. Dengan demikian, dua keluarga besar — distribusi zero-truncated (tanpa masa di titik nol) dan distribusi zero-modified (dengan massa di titik nol yang disesuaikan) — keduanya masuk dalam kelas (a,b,1) dan menjadi alat pemodelan yang sangat fleksibel.
Section 2 — Definisi Formal
ℹDefinisi Matematis — Kelas (a,b,0)›
Distribusi diskrit non-negatif {pk}k=0∞ termasuk kelas (a,b,0) jika dan hanya jika terdapat konstanta a dan b sehingga:
pk−1pk=a+kb,k=1,2,3,…
dengan p0 ditentukan oleh syarat normalisasi ∑k=0∞pk=1.
ℹDefinisi Matematis — Kelas (a,b,1)›
Distribusi diskrit non-negatif {pkT} atau {pkM} termasuk kelas (a,b,1) jika dan hanya jika:
pk−1TpkT=a+kb,k=2,3,4,…
dengan p1T (atau p1M) sebagai titik awal bebas — tidak harus memenuhi relasi di k=1 relatif terhadap p0.
Simbol
Makna
Catatan
pk
Probabilitas P(N=k) dalam kelas (a,b,0)
Termasuk p0>0
a,b
Parameter kelas (a,b,0) atau (a,b,1)
Menentukan jenis distribusi
pkT
Probabilitas distribusi zero-truncated
p0T=0 by definition
pkM
Probabilitas distribusi zero-modified
p0M bebas, bisa =p0 asli
p0M
Probabilitas titik nol yang dimodifikasi
0≤p0M≤1
ψ
Bobot massa di nol untuk zero-modified
ψ=p0M; jika ψ>p0(a,b,0): zero-inflated
c
Konstanta normalisasi zero-truncated
c=1−p0(a,b,0)
Rumus Utama
Tabel klasifikasi kelas (a,b,0) — tiga distribusi utama:
Distribusi
Parameter a
Parameter b
p0
Poisson(λ)
0
λ
e−λ
Binomial(n,q)
−q/(1−q)
(n+1)q/(1−q)
(1−q)n
Neg. Binomial(r,β)
β/(1+β)
(r−1)β/(1+β)
(1+β)−r
Relasi rekursif Panjer kelas (a,b,0):
pk=(a+kb)pk−1,k=1,2,3,…
Label: Cukup ketahui p0, a, dan b — seluruh distribusi dapat dibangun secara rekursif.
Distribusi zero-truncated (ZT) — hubungan dengan (a,b,0):
pkT=1−p0pk,k=1,2,3,…,p0T=0
Label: ZT adalah kondisional: pkT=P(N=k∣N>0) — probabilitas kelas (a,b,0) di-rescale agar total =1 tanpa titik nol.
Relasi rekursif ZT untuk k≥2:
pkT=(a+kb)pk−1T,k=2,3,…
Label: Relasi rekursif tetap berlaku untuk k≥2; hanya titik awal yang berbeda (p1T, bukan p0T).
Distribusi zero-modified (ZM) — hubungan dengan ZT:
pkM=(1−p0M)pkT=1−p01−p0Mpk,k=1,2,3,…
Label: ZM adalah campuran antara massa di titik nol sebesar p0M dan distribusi ZT untuk k≥1.
Mean dan variansi ZT dari distribusi (a,b,0) asal:
Label: Semua momen ZT diperoleh dari momen distribusi asal dibagi (1−p0), kecuali variansi yang perlu penyesuaian.
Mean ZM:
E[NM]=(1−p0M)E[NT]=1−p0(1−p0M)E[N]
Label: Mean ZM = bobot massa pada distribusi ZT dikalikan mean ZT.
Asumsi Eksplisit
N adalah variabel acak diskrit non-negatif dengan support {0,1,2,…} untuk kelas (a,b,0), dan {1,2,3,…} untuk ZT.
Parameter a dan b harus memenuhi syarat agar probabilitas tetap positif dan summable: untuk Binomial n harus integer positif; untuk Poisson λ>0; untuk NegBin r>0, β>0.
Untuk ZT dan ZM: distribusi asal (a,b,0) harus memiliki p0<1 agar ZT dapat terdefinisi.
Untuk ZM: 0≤p0M≤1; nilai p0M=0 menghasilkan ZT; nilai p0M=p0(a,b,0) menghasilkan distribusi asli tidak termodifikasi.
Kelas (a,b,1) mencakup ZT dan ZM — keduanya memenuhi relasi rekursif yang sama untuk k≥2, tetapi p1 tidak harus memenuhi relasi tersebut relatif terhadap p0.
Section 3 — Jembatan Logika
◈Dari Definisi ke Rumus — Mengapa Relasi pk/pk−1=a+b/k?›
Ide di balik kelas (a,b,0) adalah mencari distribusi diskrit yang memiliki rasio probabilitas berturutan berbentuk linear dalam 1/k. Ini bukan arbitrary — ini adalah kondisi paling sederhana yang menghasilkan keluarga distribusi yang cukup kaya. Perhatikan bahwa:
Jika a=0: rasio pk/pk−1=b/k, maka pk=pk−1⋅λ/k → ini persis PMF Poisson dengan λ=b.
Jika a<0: rasio semakin kecil semakin cepat seiring k naik → ekor menurun cepat → ini adalah Binomial yang memiliki support terbatas.
Jika a>0: rasio tidak turun secepat Poisson → ekor lebih berat → ini adalah Negatif Binomial yang overdispersed.
Jadi, parameter amengendalikan berat ekor: a=0 adalah boundary antara light-tail (Binomial) dan heavy-tail (NegBin). Parameter b bersama a menentukan mean distribusi.
◈Support dan Domain›
Kelas (a,b,0): support {0,1,2,…}. p0tidak nol dan ditentukan dari normalisasi. Ini berbeda dengan (a,b,1) di mana p0 bisa bebas.
Untuk Binomial(n,q): support terbatas{0,1,…,n} — relasi rekursif hanya berlaku sampai k=n. Untuk k>n, pk=0 karena a+b/k=−q/(1−q)+(n+1)q/((1−q)k) menjadi negatif untuk k>n.
Kelas (a,b,1): relasi rekursif berlaku mulai k=2 — titik k=1 adalah “titik awal bebas” yang tidak terikat oleh relasi tersebut. Inilah mengapa (a,b,1) lebih fleksibel dari (a,b,0).
Derivasi: Membuktikan Poisson adalah Anggota (a,b,0) dengan a=0, b=λ
Relasi (a,b,0) diwarisi langsung ke ZT untuk k≥2. ∎ Perhatikan bahwa untuk k=1: p1T/p0T tidak terdefinisi karena p0T=0 — itulah mengapa (a,b,1) hanya menuntut relasi berlaku untuk k≥2.
Derivasi: Membangun Zero-Modified dari ZT
Langkah 1 — Mulai dari ZT: {pkT}k=1∞ dengan ∑k=1∞pkT=1.
Langkah 2 — Tentukan bobot massa baru di titik nol: p0M∈[0,1).
Langkah 3 — Distribusi ZM: massa p0M di titik nol, dan massa (1−p0M) dibagi ke k≥1 proporsional dengan ZT:
Jangan gunakan relasi rekursif (a,b,0) untuk k=1 pada distribusi ZT — relasi p1T/p0T tidak terdefinisi karena p0T=0. Untuk menghitung p1T, gunakan p1T=p1/(1−p0) secara langsung, bukan relasi rekursif.
Jangan bingung antara ZT dan ZM — ZT adalah kasus khusus ZM dengan p0M=0. ZM dengan p0M=p0(a,b,0) adalah distribusi asal tak termodifikasi. Jangan menganggap keduanya sama atau saling menggantikan tanpa alasan.
Jangan substitusi parameter (a,b) distribusi lain ke formula Poisson — setiap anggota (a,b,0) memiliki formula p0 yang berbeda. Hitung p0 dari formula distribusi asal, baru gunakan relasi rekursif untuk p1,p2,…
Section 4 — Contoh Soal
Soal A — Fundamental
Distribusi frekuensi klaim N∼Poisson(λ=3). Verifikasi bahwa Poisson termasuk kelas (a,b,0) dengan mengidentifikasi a dan b, lalu hitung p0, p1, p2, p3 menggunakan relasi rekursif Panjer.
✓Solusi Soal A›
Pendekatan: Identifikasi a dan b dari tabel klasifikasi, lalu bangun distribusi secara rekursif dari p0.
1. Identifikasi Variabel
N∼Poisson(λ=3)
Kelas (a,b,0): a=0, b=λ=3
p0=e−λ=e−3
2. Identifikasi Distribusi / Model
Poisson adalah anggota (a,b,0) dengan a=0. Relasi rekursif: pk=(b/k)pk−1=(3/k)pk−1.
Cross-check via formula Poisson: p3=e−3⋅33/3!=e−3⋅27/6=4.5e−3 ✓
5. Verificationp0+p1+p2+p3+…=1. Perhatikan p2=p3: untuk Poisson(3), mode adalah di k=2 dan k=3 (mode ganda untuk λ integer). Ini konsisten karena p3/p2=a+b/3=0+1=1 tepat.
Target waktu: 2–3 menit. Common trap: Lupa bahwa p0=e−λ harus dihitung dulu sebelum rekursi dimulai — jangan mulai rekursi dari p1 tanpa anchor p0. Shortcut: Untuk Poisson, pk=(λ/k)⋅pk−1. Untuk k=λ (integer): pk=pk−1 tepat, sehingga mode terjadi pada k=λ−1 dan k=λ (mode ganda).
Soal B — Exam-Typical
Distribusi frekuensi klaim N memiliki distribusi Negatif Binomial dengan r=2 dan β=1.5. Bentuk distribusi zero-truncatedNT. Hitung p1T, p2T, p3T, E[NT], dan Var(NT).
✓Solusi Soal B›
Pendekatan: Hitung parameter (a,b) NegBin, lalu bangun ZT dengan pkT=pk/(1−p0) dan gunakan relasi rekursif untuk k≥2.
2. Identifikasi Distribusi / Model
NegBin termasuk kelas (a,b,0) dengan a=0.6>0 (heavy-tail relatif Poisson). ZT diperoleh dengan me-rescale semua pk untuk k≥1 agar total =1.
5. VerificationE[NT]=3.571>E[N]=3: ZT memiliki mean lebih besar karena massa di titik nol dihapus dan didistribusi ulang ke nilai positif. Konsisten secara intuitif. Cross-check: p1T>p2T>p3T ✓ (distribusi unimodal menurun untuk β<1/(r−1)… atau cukup verifikasi probabilitas positif dan menurun secara wajar).
Target waktu: 4–5 menit. Common trap: Menerapkan relasi rekursif ZT mulai dari k=1 dengan p0T=0 sebagai anchor — ini menghasilkan p1T=(a+b)⋅0=0, yang salah! Selalu hitung p1T=p1/(1−p0) secara langsung, baru gunakan rekursi dari k=2 ke atas. Shortcut: Hafal formula momen ZT: E[NT]=E[N]/(1−p0) — tidak perlu menghitung ulang dari definisi ekspektasi.
Soal C — Challenging
Sebuah portofolio asuransi jiwa memiliki distribusi frekuensi klaim zero-modified berdasarkan Poisson(λ=2), dengan probabilitas nol klaim yang dimodifikasi menjadi p0M=0.40. Hitung: (a) nilai p0 Poisson asli, (b) p1M, p2M, p3M, (c) E[NM], dan (d) interpretasikan apakah ini kasus zero-inflated atau zero-deflated.
✓Solusi Soal C›
Pendekatan: Bangun ZT Poisson dulu, lalu terapkan ZM dengan p0M=0.40. Bandingkan p0M dengan p0Poisson untuk menentukan inflasi/deflasi.
1. Identifikasi Variabel
Distribusi dasar: N∼Poisson(λ=2); a=0, b=2
p0=e−2≈0.13534
p0M=0.40 (diberikan)
E[N]=λ=2, 1−p0=1−e−2≈0.86466
2. Identifikasi Distribusi / Model
Karena p0M=0.40>p0=0.1353, ini adalah kasus zero-inflated — lebih banyak polis dengan nol klaim dari yang diprediksi Poisson. Distribusi ZM termasuk kelas (a,b,1).
Verifikasi via ZT: E[NT]=E[N]/(1−p0)=2/0.86466≈2.3132, maka E[NM]=(1−p0M)×E[NT]=0.60×2.3132≈1.3879 ✓
5. Verification
Normalisasi: p0M+p1M+p2M+p3M+…=0.40+0.60×∑k=1∞pkT=0.40+0.60×1=1.00 ✓. E[NM]=1.388<E[N]=2: mean turun karena massa besar di titik nol menarik ekspektasi ke bawah. Ini konsisten: zero-inflation mengurangi mean.
Hasil:p0=e−2≈0.1353; p1M≈0.1878, p2M≈0.1878, p3M≈0.1252; E[NM]≈1.388. Ini adalah kasus zero-inflated karena p0M=0.40>p0=0.135.
▲Exam Tips — Soal C›
Target waktu: 5–6 menit. Common trap: Mengalikan pkM=(1−p0M)⋅pk alih-alih menggunakan faktor (1−p0M)/(1−p0)⋅pk — kesalahan ini menghasilkan ∑pkM=1 karena ∑k=1∞pk=1−p0=1. Shortcut: Hitung faktor skala c=(1−p0M)/(1−p0) sekali, lalu kalikan semua pk dengan c. Cek akhir: p0M+c×(1−p0)=p0M+(1−p0M)=1 ✓.
Jika jumlah probabilitas yang dihitung tidak sama dengan 1, kesalahan ada di faktor normalisasi.
✓Cross-check Mean ZT vs Mean Asal›
Selalu periksa arah perubahan mean:
E[NT]=1−p0E[N]>E[N](selalu lebih besar, karena 1−p0<1)E[NM]=1−p0(1−p0M)E[N]⎩⎨⎧>E[N]=E[N]<E[N]jika p0M<p0 (zero-deflated)jika p0M=p0 (tidak termodifikasi)jika p0M>p0 (zero-inflated)
Ini adalah intuition-check wajib: zero-inflation selalu mengurangi mean dari distribusi asalnya.
Metode Alternatif
Untuk menghitung p1T distribusi ZT Negatif Binomial(r,β), bisa juga langsung via:
pkT=pk/(1−p0); semua batang dinaikkan proporsional
Batang k=0 diperbesar (ZM zero-inflated)
p0M>p0; batang k≥1 diperkecil proporsional
Slope menurun pada a>0 (NegBin)
Ekor lebih berat: pk/pk−1→a>0 saat k→∞
Slope menurun cepat pada a<0 (Binomial)
Ekor terpotong: pk=0 untuk k>n
Relasi rekursif = kemiringan log-PMF linear
ln(pk)=ln(pk−1)+ln(a+b/k)
Section 7 — Jebakan Umum
⬡Kesalahan Parametrisasi›
Parameter NegBin KPW vs konvensi lain: KPW menggunakan NegBin(r,β) dengan a=β/(1+β), b=(r−1)β/(1+β), dan p0=(1+β)−r. Beberapa sumber menggunakan parameterisasi (r,p) dengan p=1/(1+β) — ini mengubah nilai a dan b. Selalu verifikasi konvensi mana yang digunakan soal.
Parameter Binomial KPW:a=−q/(1−q), b=(n+1)q/(1−q). Perhatikan anegatif untuk Binomial — ini sering mengejutkan kandidat. Verifikasi: a+b=nq/(1−q)−q/(1−q)=(n−1)q/(1−q)=p1/p0 ✓ menggunakan p1=nq(1−q)n−1 dan p0=(1−q)n.
⬡Kesalahan Konseptual›
Relasi rekursif ZT dimulai dari k=2, bukan k=1: Untuk ZT, relasi pkT/pk−1T=a+b/k hanya valid untuk k≥2. Menggunakannya untuk k=1 (dengan p0T=0 sebagai anchor) menghasilkan p1T=0 — salah fatal.
Zero-inflated ≠ zero-modified: Zero-inflated adalah kasus khusus zero-modified di mana p0M>p0(a,b,0). Zero-modified juga mencakup zero-deflated (p0M<p0). Jangan gunakan keduanya sebagai sinonim.
(a,b,0) adalah subkelas (a,b,1): Distribusi (a,b,0) memenuhi relasi rekursif untuk semuak≥1, termasuk k=1. Kelas (a,b,1) hanya menuntut k≥2, sehingga (a,b,0)⊂(a,b,1).
Momen ZM tidak diperoleh dengan membagi E[N] oleh (1−p0M): Rumus E[NM]=(1−p0M)E[N]/(1−p0), bukan E[N]/(1−p0M). Confusion ini sangat umum.
⬡Kesalahan Interpretasi Soal›
“Distribusi zero-truncated Poisson(2)” — ini adalah distribusi ZT dengan distribusi dasar Poisson. Bukan Poisson(2) yang dipotong pada nilai tertentu (seperti pemotongan dari atas). ZT hanya menghapus titik k=0.
“Tentukan apakah distribusi termasuk (a,b,0) atau (a,b,1)” — jika p0>0 dan relasi berlaku untuk semua k≥1: termasuk (a,b,0). Jika p0=0 atau relasi hanya berlaku untuk k≥2: termasuk (a,b,1) namun tidak (a,b,0).
“Klasifikasikan distribusi berdasarkan rasio pk/pk−1” — hitung rasio untuk beberapa nilai k, lalu cari a dan b dari sistem persamaan a+b/k1=r1 dan a+b/k2=r2. Identifikasi distribusi dari nilai a yang diperoleh.
▲Red Flags›
Soal menyebut “zero-truncated” → ingat: p0T=0; jangan gunakan relasi rekursif untuk k=1; hitung p1T=p1/(1−p0) secara langsung
Soal menyebut “zero-modified” dengan p0M diberikan → hitung faktor skala c=(1−p0M)/(1−p0) dulu, baru kalikan semua pk asli dengan c
Soal memberikan tabel pk dan meminta mengidentifikasi distribusi → hitung dua rasio pk/pk−1 untuk dua nilai k berbeda, selesaikan sistem 2×2 untuk a dan b, lalu cocokan dengan tabel klasifikasi
Soal menyebut “Panjer recursive formula” untuk model agregat → ini adalah aplikasi (a,b,0) di Topik 4; lihat 4.5 Panjer Recursive Formula
Nilai a>0, a=0, atau a<0 → langsung identifikasi: a>0 = NegBin, a=0 = Poisson, a<0 = Binomial
Section 8 — Ringkasan Eksekutif
≡Must-Remember›
Relasi rekursif kelas (a,b,0):
pk−1pk=a+kb,k=1,2,3,…
Tabel klasifikasi (a,b,0) — tiga distribusi utama:
Relasi kelas (a,b,1): Berlaku untuk k≥2 — ZT dan ZM keduanya termasuk (a,b,1).
Kapan Digunakan
Soal memberikan distribusi frekuensi dan meminta mengidentifikasi kelas (a,b,0) → hitung rasio pk/pk−1, cocokan dengan a+b/k
Soal meminta membangun distribusi dari relasi rekursif → tentukan p0, a, b, lalu rekursi
Soal menyebut “zero-truncated” atau “kondisional pada N>0” → gunakan formula ZT
Soal menyebut “zero-modified”, “zero-inflated”, atau “zero-deflated” → gunakan formula ZM dengan p0M yang diberikan
Soal menyebut formula Panjer (Topik 4) → relasi (a,b,0) adalah basis dari Formula Rekursif Panjer; lihat 4.5 Panjer Recursive Formula
Kapan TIDAK Boleh Digunakan
Distribusi frekuensi yang tidak memiliki support {0,1,2,…} tidak dapat langsung diklasifikasikan ke (a,b,0) tanpa transformasi
Untuk distribusi campuran (mixed frequency) seperti Poisson-ETNB: tidak semua distribusi campuran termasuk (a,b,0); lihat 2.4 Mixed Frequency Distributions
Jangan gunakan relasi rekursif ZT untuk k=1 — ini satu-satunya pengecualian yang tidak berlaku dalam (a,b,1)
Quick Decision Tree
graph TD A["Distribusi frekuensi klaim N diberikan"] -->|"Hitung ratio p_k/p_(k-1)"| B["Apakah ratio = a + b/k untuk semua k >= 1?"] B -->|"Ya"| C["Termasuk kelas (a,b,0)"] B -->|"Hanya untuk k >= 2"| D["Termasuk kelas (a,b,1) saja<br>(ZT atau ZM)"] C -->|"a = 0"| E["Poisson: lambda = b"] C -->|"a < 0"| F["Binomial: n dan q dari a dan b"] C -->|"a > 0"| G["NegBin: r dan beta dari a dan b"] C -->|"Perlu ZT"| H["p_k^T = p_k / (1 - p_0)<br>Hati: p_1^T tidak dari rekursi!"] H -->|"Perlu ZM"| I["p_k^M = (1-p_0^M)/(1-p_0) * p_k<br>E[N^M] = (1-p_0^M)*E[N]/(1-p_0)"] I -->|"p_0^M > p_0"| J["Zero-inflated: E[N^M] < E[N]"] I -->|"p_0^M < p_0"| K["Zero-deflated: E[N^M] > E[N]"]
❝Follow-up Options›
“Berikan contoh soal mengidentifikasi distribusi dari tabel pk yang diberikan menggunakan relasi (a,b,0)”