Mixed Frequency Distributions
📊 2.4 — Mixed Frequency Distributions
Ringkasan Cepat›
Topik: Mixed Frequency Distributions | Bobot: ~5–10% | Difficulty: Hard Ref: Klugman et al. (2019), Loss Models 5th ed., Bab 7.3–7.5 | Prereq: 2.1 Frequency MGF and PGF, 2.2 (a,b,0) and (a,b,1) Distribution Classes
Section 0 — Pemetaan Topik
| Topik TA2 | Sub-topik ID | Skill Diuji | Bobot | Difficulty | Prerequisite | Connected Topics | Referensi |
|---|---|---|---|---|---|---|---|
| Model Frekuensi Klaim | 2.4 | Menentukan distribusi frekuensi campuran, khususnya mixed Poisson; menghitung PMF, mean, variance, dan PGF distribusi campuran | 5–10% | Hard | 2.1 Frequency MGF and PGF, 2.2 (a,b,0) and (a,b,1) Distribution Classes | 2.3 Frequency Model Selection, 2.5 Exposure Effect on Frequency, 4.2 Compound Distributions | Klugman et al. (2019) Bab 7.3–7.5 |
Section 1 — Intuisi
Bayangkan sebuah perusahaan asuransi kendaraan bermotor yang mengelola ribuan polis. Secara intuitif, tidak semua pengemudi memiliki profil risiko yang sama. Ada pengemudi yang sangat berhati-hati dan jarang sekali mengajukan klaim, ada yang ceroboh dan sering klaim, dan ada yang berada di antaranya. Jika kita menganggap seluruh portofolio itu homogen dan memodelkannya dengan satu distribusi Poisson tunggal, kita kehilangan informasi penting ini. Hasilnya? Model yang terlalu optimistis pada ekor distribusi — kita meremehkan probabilitas frekuensi klaim yang sangat tinggi.
Di sinilah distribusi frekuensi campuran (mixed frequency distribution) masuk. Ide dasarnya sederhana: parameter distribusi frekuensi — misalnya pada distribusi Poisson — bukan sebuah konstanta, melainkan sebuah variabel acak yang mencerminkan heterogenitas portofolio. Setiap tertanggung menarik parameter -nya sendiri dari suatu distribusi tertentu (disebut mixing distribution), lalu frekuensi klaim mereka berdistribusi Poisson dengan tersebut. Ketika kita amati seluruh portofolio tanpa mengetahui siapa “tipe” mana, distribusi yang kita lihat adalah rata-rata tertimbang dari semua Poisson ini — itulah distribusi mixed Poisson.
Konsekuensi yang sangat penting dan sering diuji: distribusi mixed Poisson hampir selalu memiliki overdispersion, yaitu . Ini berbeda dari Poisson murni di mana . Overdispersion adalah sinyal klinis bahwa portofolio kita heterogen dan mixing sedang terjadi. Dalam praktik aktuaria Indonesia, ini relevan saat kita membangun model frekuensi untuk klaim motor, properti, atau kesehatan di mana segmentasi pemegang polis tidak sempurna.
Section 2 — Definisi Formal
Definisi Matematis — Mixed Distribution›
Misalkan berdistribusi dengan PMF dan adalah variabel acak dengan CDF . Distribusi tidak bersyarat (unconditional / marginal) dari adalah:
| Simbol | Makna | Catatan |
|---|---|---|
| Variabel acak frekuensi klaim yang diamati | Variabel diskrit tidak negatif | |
| Parameter acak (mixing variable) | Variabel kontinu, | |
| PMF bersyarat dari given | Seringkali Poisson: | |
| CDF dari distribusi mixing | Disebut juga structural distribution | |
| PDF dari (jika kontinu) | Contoh: Gamma, Inverse Gaussian | |
| PGF dari | ||
| PGF bersyarat dari given | Untuk Poisson: |
Rumus Utama
PMF distribusi mixed (umum):
Label: Integral dari PMF bersyarat terhadap mixing distribution; ini adalah marginalisasi atas .
PGF distribusi mixed (kunci utama):
Label: PGF dari distribusi campuran adalah ekspektasi dari PGF bersyarat; sangat berguna untuk mixed Poisson.
Mean (via Law of Total Expectation):
Label: Untuk mixed Poisson (), mean sama dengan mean dari mixing distribution.
Variance (via Law of Total Variance):
Label: Dua komponen: variasi within-group dan variasi between-group.
Variance — mixed Poisson spesifik:
Label: Untuk Poisson, , sehingga dan komponen kedua adalah .
Overdispersion mixed Poisson:
Label: Karena , mixed Poisson selalu overdispersed (atau equidispersed jika degenerate).
PGF mixed Poisson:
Label: PGF dari mixed Poisson sama dengan MGF dari yang dievaluasi di .
Asumsi Eksplisit
- Diberikan , frekuensi klaim berdistribusi Poisson() — ini adalah asumsi khusus untuk mixed Poisson.
- hampir pasti (almost surely) agar valid sebagai parameter Poisson.
- dan bersifat conditionally independent across policyholders diberikan .
- Mixing distribution adalah distribusi yang valid (CDF yang well-defined).
- agar terdefinisi; agar terdefinisi.
Section 3 — Jembatan Logika
Dari Definisi ke Rumus›
Kunci untuk memahami mixed Poisson adalah Law of Total Expectation dan Law of Total Variance. Kita tidak pernah mengamati secara langsung — kita hanya mengamati . Karena tersembunyi (latent), kita rata-ratakan (marginalize) semua kemungkinan nilai dengan bobotnya masing-masing (yaitu ). Ini menghasilkan distribusi marginal yang merupakan campuran dari tak hingga banyak distribusi Poisson.
Support dan Domain›
- — frekuensi klaim adalah integer non-negatif.
- — harus positif agar valid sebagai parameter Poisson.
- saat mengevaluasi PGF untuk keperluan probabilitas; bisa kompleks untuk analisis analitik.
Derivasi Variance Mixed Poisson — Step by Step:
Step 1 — Gunakan Law of Total Variance:
Step 2 — Substitusi properti distribusi Poisson ( dan ):
Step 3 — Interpretasi:
Komponen pertama adalah variance yang “sudah ada” jika populasi homogen (pure Poisson). Komponen kedua adalah excess variance akibat heterogenitas portofolio.
Derivasi PGF Mixed Poisson — Step by Step:
Step 1 — Definisi PGF:
Step 2 — PGF Poisson bersyarat adalah :
Step 3 — Kenali bentuk MGF: dengan adalah definisi MGF dari :
Step 4 — Implikasi: Mengetahui MGF dari langsung memberikan PGF dari . Ini adalah shortcut paling powerful untuk mixed Poisson.
Dilarang›
- Jangan samakan untuk mixed Poisson — ini hanya berlaku untuk Poisson murni (pure Poisson). Mixed Poisson selalu memiliki .
- Jangan lupa komponen kedua dalam Law of Total Variance. Sering kali peserta hanya menghitung dan melewatkan .
- Jangan tukar argumen pada rumus PGF: , bukan . Argumen MGF adalah , bukan .
Section 4 — Contoh Soal
Soal A — Fundamental
Soal: Frekuensi klaim mengikuti distribusi mixed Poisson di mana mixing variable dengan dan (sehingga dan ). Tentukan dan .
Solusi Soal A›
Pendekatan: Gunakan rumus langsung mixed Poisson: dan .
1. Identifikasi Variabel
2. Identifikasi Distribusi / Model Mixed Poisson dengan Gamma mixing → hasilnya adalah distribusi Negative Binomial (fakta klasik yang sering diuji).
3. Setup Persamaan
4. Eksekusi Aljabar
5. Verification ✓ — overdispersion terkonfirmasi. Rasio konsisten dengan Negative Binomial yang memang selalu overdispersed.
Hasil: , . Excess variance sebesar mencerminkan heterogenitas portofolio.
Exam Tips — Soal A›
Target waktu: 2 menit. Common trap: Menggunakan (formula Poisson murni). Shortcut: Hafalkan bahwa untuk mixed Poisson, , tidak perlu integrasi apa pun.
Soal B — Exam-Typical
Soal: berdistribusi Poisson() dan berdistribusi Inverse Gaussian dengan mean dan parameter shape sehingga . Tentukan dalam bentuk closed-form, dan hitung .
Solusi Soal B›
Pendekatan: Gunakan . Cari MGF Inverse Gaussian, substitusi, lalu evaluasi di untuk .
1. Identifikasi Variabel
- MGF Inverse Gaussian:
2. Identifikasi Distribusi / Model Mixed Poisson dengan Inverse Gaussian mixing menghasilkan distribusi Poisson-Inverse Gaussian (PIG), dikenal memiliki ekor lebih tebal dari Negative Binomial.
3. Setup Persamaan
4. Eksekusi Aljabar
Substitusi , :
Untuk , evaluasi di :
5. Verification . Cross-check dengan batas: jika ini Poisson murni dengan , maka . Mixed Poisson-IG memberikan yang lebih besar karena massa probabilitas tersebar, termasuk di ekor kiri — masuk akal.
Hasil: dan .
Exam Tips — Soal B›
Target waktu: 4 menit. Common trap: Salah mensubstitusi argumen MGF — ingat selalu , bukan . Shortcut: Kenali kombinasi (mixing, hasil) yang umum: Gamma → NegBin, Inverse Gaussian → PIG, ETNB → Poisson-ETNB.
Soal C — Challenging
Soal: Sebuah portofolio asuransi terdiri dari dua kelas pemegang polis: 40% adalah pengemudi berisiko rendah (low risk) dengan frekuensi klaim Poisson(), dan 60% adalah pengemudi berisiko tinggi (high risk) dengan frekuensi klaim Poisson(). Seorang pemegang polis dipilih secara acak dari portofolio ini. Misalkan adalah frekuensi klaimnya. (a) Tentukan dan . (b) Hitung dan . (c) Tentukan distribusi (mixing distribution) dan verifikasi bahwa .
Solusi Soal C›
Pendekatan: adalah variabel acak diskrit (dua titik: dengan prob , dengan prob ). Gunakan marginalisasi langsung untuk PMF dan rumus mixed Poisson untuk momen.
1. Identifikasi Variabel
- ,
- ,
2. Identifikasi Distribusi / Model Ini adalah discrete mixture of Poissons — mixing distribution adalah diskrit, bukan kontinu. Prinsip marginalisasi tetap sama: jumlahkan (bukan integrasikan) atas nilai-nilai .
3. Setup Persamaan
4. Eksekusi Aljabar
(a) PMF:
(b) Momen:
(c) Verifikasi:
5. Verification — lebih tinggi dari Poisson() murni di mana . Ini wajar: mixing menambah massa di karena sebagian besar polis tipe low-risk (Poisson(1)) memiliki besar. Overdispersion: ✓.
Hasil: , ; , ; identitas overdispersion terkonfirmasi.
Exam Tips — Soal C›
Target waktu: 6 menit. Common trap: Menggunakan rumus kontinu () padahal mixing distribution diskrit — cukup gunakan penjumlahan. Shortcut: Selalu hitung dan terlebih dahulu; semua momen mengikuti otomatis. Jika soal meminta lebih dari 2 nilai, cari PGF dulu lalu differentiate.
Section 5 — Verifikasi & Sanity Check
Cross-Check 1 — Overdispersion Index›
Hitung dispersion index . Untuk mixed Poisson:
Lebih mudah: selalu. Jika hasil Anda memberi , ada kesalahan.
Cross-Check 2 — Konsistensi PGF dengan Momen›
Dari PGF , momen dapat diturunkan:
Sehingga . Gunakan ini untuk memverifikasi momen dari PGF yang diperoleh via .
Cross-Check 3 — Nilai PMF›
Pastikan . Untuk soal diskrit (finite mixture), hitung secara partial sum dan pastikan mendekati 1 untuk yang cukup besar.
Metode Alternatif
Untuk kasus khusus Poisson-Gamma (mixing distribution Gamma()), distribusi marginal adalah Negative Binomial dengan parameter dan :
Artinya, PMF bisa langsung dihitung menggunakan formula Negative Binomial tanpa integrasi — ini adalah shortcut yang sangat menghemat waktu di ujian.
Section 6 — Visualisasi Mental
Distribusi Mixed Poisson — Gambaran Visual:
Bayangkan sumbu-X adalah jumlah klaim dan sumbu-Y adalah probabilitas .
- Poisson(): Distribusi “ramping” dengan puncak di sekitar –, ekor cepat menipis.
- Poisson(): Distribusi lebih “lebar” dengan puncak di –, ekor lebih tebal.
- Mixed (40% Poisson(1) + 60% Poisson(4)): Distribusi bimodal dengan dua tonjolan kecil di kiri (dari komponen ) dan di tengah (dari komponen ), ekor secara keseluruhan lebih tebal dari kedua komponen individual di mean .
Perbandingan Ekor:
Semakin besar , semakin tebal ekor distribusi marginal . Secara visual, mixed Poisson “lebih datar dan lebih lebar” dibanding Poisson murni dengan mean yang sama — ini adalah signature overdispersion.
Representasi Hierarkis:
Level 1 (Unobserved): Λ ~ f_Λ(λ) [mixing distribution]
↓
Level 2 (Observed): N | Λ = λ ~ Poisson(λ)
↓
Marginal: N ~ Mixed Poisson
Struktur hierarkis dua-level ini adalah fondasi model hierarchical / random effects dalam aktuaria.
Hubungan Visual ↔ Rumus
| Elemen Visual | Komponen Rumus |
|---|---|
| Lebar distribusi marginal | |
| Komponen kiri (rendah ) | — kontribusi kecil |
| Tinggi ekor distribusi | Dikontrol oleh ekor — tebal = ekor berat |
| Ketinggian puncak | — puncak sekitar mean |
| Dua tonjolan (discrete mixture) | Setiap komponen Poisson menyumbang satu “puncak lokal” |
Section 7 — Jebakan Umum
Kesalahan Parametrisasi›
Salah: Menggunakan (formula Poisson murni). Benar: untuk mixed Poisson. Komponen tidak boleh diabaikan — bahkan sering lebih besar dari .
Salah: Menggunakan . Benar: . Argumen MGF adalah , bukan . Ini mengikuti dari substitusi PGF Poisson .
Kesalahan Konseptual›
- Confusing compound vs. mixed: Distribusi compound Poisson adalah (jumlah acak dari klaim); distribusi mixed Poisson adalah dengan acak. Keduanya berbeda — jangan tukar.
- Assuming unimodal: Mixed Poisson tidak selalu unimodal. Discrete mixture bisa bimodal atau multimodal, terutama jika komponen-komponen berjauhan.
- Ignoring discrete mixing: Mixing distribution tidak harus kontinu. Finite mixture (diskrit) juga valid dan menghasilkan distribusi mixed Poisson yang sah.
- Menyamakan mixed Poisson dengan Negative Binomial: Poisson-Gamma memang menghasilkan NegBin, tetapi mixed Poisson dengan mixing distribution lain (Inverse Gaussian, Lognormal, dsb.) menghasilkan distribusi yang berbeda dari NegBin.
Kesalahan Interpretasi Soal›
- Soal berbunyi “parameter varies across policyholders” → ini adalah cue untuk mixed Poisson, bukan pure Poisson.
- Soal menyebutkan “randomly selected policyholder” dari populasi heterogen → distribusi yang diminta adalah distribusi marginal (campuran), bukan bersyarat.
- Soal meminta “variance exceeds mean” atau “overdispersed” → ini ciri khas mixed Poisson; jangan gunakan pure Poisson.
Red Flags — Keyword di Soal›
- “Mixing distribution”, “structural distribution”, “heterogeneous portfolio” → gunakan framework mixed Poisson
- “Given , is Poisson()” → setup bersyarat; cari distribusi marginal
- "" atau “overdispersion” → konsistensi dengan mixed Poisson, tidak dengan pure Poisson
- “PGF of ” untuk mixed Poisson → langsung ; cari MGF terlebih dahulu
- “Two types of policyholders” atau “proportion are low-risk” → discrete finite mixture
Section 8 — Ringkasan Eksekutif
Must-Remember›
-
PMF marginal:
-
Mean mixed Poisson:
-
Variance mixed Poisson:
-
Overdispersion:
-
PGF = MGF of mixing:
-
Combo klasik: Poisson + Gamma mixing Negative Binomial
Kapan Digunakan
- Soal menyebutkan bahwa dalam distribusi Poisson bervariasi antar pemegang polis (acak).
- Soal menyebutkan portofolio heterogen dengan beberapa tipe risiko.
- Diminta menghitung distribusi frekuensi klaim untuk pemegang polis yang dipilih secara acak dari populasi campuran.
- Diminta menunjukkan atau membuktikan overdispersion ().
- Diminta PGF dari distribusi frekuensi campuran.
Kapan TIDAK Boleh Digunakan
- Jika sudah diketahui dan konstan (pure Poisson) — tidak ada mixing.
- Jika soal meminta distribusi bersyarat — itu Poisson biasa, bukan marginal.
- Jika distribusi frekuensi yang dimaksud adalah compound (jumlah agregat klaim) — itu bukan mixing, itu compound distribution (Topik 4.2 Compound Distributions).
Quick Decision Tree
graph TD
A["Soal tentang frekuensi klaim N"] --> B{"Apakah lambda diketahui dan konstan?"}
B -->|"Ya"| C["Pure Poisson<br>Var = E = lambda"]
B -->|"Tidak / lambda adalah variabel acak"| D{"Bentuk mixing distribution?"}
D -->|"Gamma(alpha, theta)"| E["Hasil: Negative Binomial<br>E(N) = alpha*theta<br>Var(N) = alpha*theta*(1+theta)"]
D -->|"Inverse Gaussian"| F["Hasil: Poisson-IG<br>PGF = M_Lambda(z-1)"]
D -->|"Diskrit / finite mixture"| G["Discrete mixture<br>p(n) = sum_k w_k * Poisson(lambda_k)"]
D -->|"Distribusi lain"| H["Gunakan:<br>E(N) = E(Lambda)<br>Var(N) = E(Lambda) + Var(Lambda)<br>PGF = M_Lambda(z-1)"]
G --> I["E(N) = sum w_k * lambda_k<br>Var(N) = E(Lambda) + Var(Lambda)"]
Follow-up Options›
- “Berikan contoh soal variasi Poisson-Inverse Gaussian dengan perhitungan PMF lengkap”
- “Jelaskan hubungan 2.4 Mixed Frequency Distributions dengan 4.2 Compound Distributions — apa bedanya mixing vs compounding?”
- “Buat flashcard 1-halaman untuk topik ini”
- “Generate notes 2.5 Exposure Effect on Frequency sebagai kelanjutan topik ini”
📖 Ref: Klugman, Panjer & Willmot (2019), Loss Models 5th ed., Bab 7.3–7.5 | 🗓️ 2026-04-17 | #TA2 #MixedFrequency #MixedPoisson