PAI · AAMAI · 2026
Aktuaria
Indonesia
CF2 · Materi 3.7

Distribusi Majemuk (Compound Distribution)

2026-02-21 Hard Bobot: 20–30% Hogg-McKean-Craig (2019) Bab 2.1–2.4; Miller et al. (2014) Bab 3.7–3.8, 5.8–5.10
CF2ProbabilitasStatistikaMultivariatDistribusiMajemukCompoundDistributionMixtureDistributionPGFMGFAgregatKlaimStopLoss

📊 3.7 — Distribusi Majemuk (Compound Distribution)

Ringkasan Cepat

Topik: Distribusi Majemuk (Compound Distribution) | Bobot: ~20–30% | Difficulty: Hard Ref: Hogg-McKean-Craig (2019) Bab 2.1–2.4; Miller et al. (2014) Bab 3.7–3.8, 5.8–5.10 | Prereq: 3.4 Nilai Harapan dan Variansi Bersyarat, 3.3 Distribusi Bersyarat (Conditional Distribution), 2.3 Fungsi Pembangkit

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 3: Variabel Acak Multivariat3.7Mendefinisikan distribusi majemuk dan distribusi campuran; menurunkan PMF/PDF distribusi majemuk melalui marginalisasi; menghitung E[S]E[S] dan Var(S)\text{Var}(S) via Hukum Ekspektasi dan Variansi Total; menurunkan PGF dan MGF distribusi majemuk; mengidentifikasi distribusi majemuk standar (Poisson-Gamma \to Binomial Negatif, Binomial-Beta \to Beta-Binomial); menghitung momen agregat klaim dalam konteks aktuaria20–30%Hard3.4 Nilai Harapan dan Variansi Bersyarat, 3.3 Distribusi Bersyarat (Conditional Distribution), 2.3 Fungsi Pembangkit, 2.5 Distribusi Diskrit Umum, 2.6 Distribusi Kontinu Umum3.8 Transformasi Variabel Acak Gabungan, 4.3 Teorema Limit Pusat (CLT), 4.5 Estimasi ParameterHogg-McKean-Craig (2019) Bab 2.1–2.4; Miller et al. (2014) Bab 3.7–3.8, 5.8–5.10

Section 1 — Intuisi

Bayangkan sebuah perusahaan reasuransi yang menanggung portofolio kontrak dari ratusan perusahaan asuransi jiwa. Setiap perusahaan asuransi memiliki jumlah klaim NN yang terjadi dalam satu tahun, dan setiap klaim ke-ii memiliki besarnya klaim XiX_i. Pertanyaan paling fundamental bagi aktuaris reasuransi adalah: berapa distribusi dari total klaim agregat S=X1+X2++XNS = X_1 + X_2 + \cdots + X_N? Ini bukan penjumlahan biasa — karena batas atas penjumlahannya sendiri adalah variabel acak NN, bukan konstanta. Inilah jantung dari distribusi majemuk: penjumlahan sejumlah acak variabel acak yang saling independen.

Konsep distribusi majemuk muncul dalam dua varian yang berkaitan erat. Distribusi majemuk (compound distribution) dalam arti sempit adalah distribusi dari S=i=1NXiS = \sum_{i=1}^{N} X_i di mana NN adalah variabel acak (frekuensi klaim) dan XiX_i adalah variabel acak identik dan independen (besaran klaim), independen dari NN. Distribusi campuran (mixture distribution) adalah varian lain: distribusi dari XX yang bersyarat pada parameter acak Θ\Theta — ketika parameter distribusi itu sendiri tidak deterministik melainkan mengikuti distribusi tertentu. Kedua konsep ini terhubung erat dan sering muncul bersama dalam pemodelan aktuaria.

Kepentingan topik ini dalam aktuaria tidak bisa dilebih-lebihkan. Jumlah klaim NN bisa dimodelkan sebagai Poisson, Binomial, atau Negatif Binomial. Besaran klaim XiX_i bisa Eksponensial, Gamma, atau Pareto. Kombinasi keduanya menghasilkan distribusi SS yang — walaupun seringkali tidak memiliki bentuk tertutup yang sederhana — momennya dapat dihitung dengan elegan menggunakan 3.4 Nilai Harapan dan Variansi Bersyarat (Hukum Ekspektasi Total dan Variansi Total), dan fungsi pembangkitnya memiliki struktur yang indah: MS(t)=GN(MX(t))M_S(t) = G_N(M_X(t)) dan GS(t)=GN(GX(t))G_S(t) = G_N(G_X(t)). Formula-formula ini adalah senjata utama yang diuji di CF2.

Section 2 — Definisi Formal

Definisi Matematis

Distribusi Majemuk — Penjumlahan Acak (Compound Sum):

Misalkan NN adalah variabel acak non-negatif bernilai bilangan bulat (frekuensi), dan X1,X2,X_1, X_2, \ldots adalah barisan variabel acak i.i.d. (independent and identically distributed) yang independen dari NN (besaran). Definisikan:

S=i=1NXi,dengan konvensi S=0 jika N=0S = \sum_{i=1}^{N} X_i, \quad \text{dengan konvensi } S = 0 \text{ jika } N = 0

Distribusi dari SS disebut distribusi majemuk dengan frekuensi NN dan besaran XX.

Distribusi Campuran (Mixture Distribution):

Misalkan XΘ=θX \mid \Theta = \theta memiliki distribusi fXΘ(xθ)f_{X|\Theta}(x \mid \theta), dan Θ\Theta adalah variabel acak dengan distribusi fΘ(θ)f_\Theta(\theta) (distribusi prior/pencampur). Distribusi marginal XX adalah:

fX(x)=fXΘ(xθ)fΘ(θ)dθ(kontinu)f_X(x) = \int f_{X|\Theta}(x \mid \theta)\, f_\Theta(\theta)\, d\theta \quad \text{(kontinu)} pX(x)=θpXΘ(xθ)pΘ(θ)(diskrit)p_X(x) = \sum_\theta p_{X|\Theta}(x \mid \theta)\, p_\Theta(\theta) \quad \text{(diskrit)}

MGF Distribusi Majemuk:

MS(t)=E ⁣[etS]=GN ⁣(MX(t))M_S(t) = E\!\left[e^{tS}\right] = G_N\!\left(M_X(t)\right)

di mana GN(z)=E[zN]G_N(z) = E[z^N] adalah PGF dari NN dan MX(t)=E[etX]M_X(t) = E[e^{tX}] adalah MGF dari XX.

PGF Distribusi Majemuk (jika XX diskrit non-negatif):

GS(z)=E ⁣[zS]=GN ⁣(GX(z))G_S(z) = E\!\left[z^S\right] = G_N\!\left(G_X(z)\right)

Variabel & Parameter

SimbolMaknaCatatan
NNVariabel acak frekuensi (jumlah klaim)Bernilai {0,1,2,}\{0, 1, 2, \ldots\}; distribusinya menentukan “berapa banyak”
XiX_iVariabel acak besaran klaim ke-iii.i.d., independen dari NN; distribusinya menentukan “seberapa besar” per klaim
XXBesaran klaim tipikal (satu XiX_i representatif)X=dXiX \stackrel{d}{=} X_i untuk semua ii
S=i=1NXiS = \sum_{i=1}^N X_iTotal agregat klaimVariabel acak majemuk; S=0S = 0 jika N=0N = 0
μX=E[X]\mu_X = E[X]Mean besaran klaim tunggal
σX2=Var(X)\sigma_X^2 = \text{Var}(X)Variansi besaran klaim tunggal
μN=E[N]\mu_N = E[N]Mean frekuensi klaim
σN2=Var(N)\sigma_N^2 = \text{Var}(N)Variansi frekuensi klaim
GN(z)G_N(z)PGF dari NN: E[zN]E[z^N]Lihat 2.3 Fungsi Pembangkit; didefinisikan untuk $
MX(t)M_X(t)MGF dari XX: E[etX]E[e^{tX}]Terdefinisi di sekitar t=0t = 0
MS(t)M_S(t)MGF dari SSMS(t)=GN(MX(t))M_S(t) = G_N(M_X(t)) — komposisi PGF dan MGF
Θ\ThetaParameter acak dalam distribusi campuranDistribusi Θ\Theta disebut distribusi prior atau pencampur

Rumus Utama

E[S]=E[N]E[X]=μNμXE[S] = E[N] \cdot E[X] = \mu_N \cdot \mu_X

Label: Mean Distribusi Majemuk — dari Hukum Ekspektasi Total dengan kondisioning pada NN: E[S]=E[E[SN]]=E[NμX]=μNμXE[S] = E[E[S \mid N]] = E[N \cdot \mu_X] = \mu_N \mu_X.

Var(S)=E[N]Var(X)+Var(N)(E[X])2=μNσX2+σN2μX2\text{Var}(S) = E[N]\cdot\text{Var}(X) + \text{Var}(N)\cdot(E[X])^2 = \mu_N \sigma_X^2 + \sigma_N^2 \mu_X^2

Label: Variansi Distribusi Majemuk — dari Hukum Variansi Total: komponen within =E[N]Var(X)= E[N]\text{Var}(X) (variansi besaran dalam setiap kondisi NN) dan komponen between =Var(N)(E[X])2= \text{Var}(N)(E[X])^2 (variansi akibat fluktuasi frekuensi).

MS(t)=GN ⁣(MX(t))M_S(t) = G_N\!\left(M_X(t)\right)

Label: MGF Distribusi Majemuk — hasil komposisi PGF frekuensi dengan MGF besaran; berlaku karena E[etSN=n]=(MX(t))nE[e^{tS} \mid N=n] = (M_X(t))^n sehingga MS(t)=E[(MX(t))N]=GN(MX(t))M_S(t) = E[(M_X(t))^N] = G_N(M_X(t)).

GS(z)=GN ⁣(GX(z))G_S(z) = G_N\!\left(G_X(z)\right)

Label: PGF Distribusi Majemuk — kasus khusus ketika XX diskrit non-negatif; komposisi PGF-PGF; berguna untuk menurunkan PMF SS melalui ekspansi deret.

E[S2]=μNE[X2]+μN(μN1)μX2E[S^2] = \mu_N\,E[X^2] + \mu_N(\mu_N - 1)\,\mu_X^2

Label: Momen Kedua Distribusi Majemuk — berguna untuk menghitung Var(S)\text{Var}(S) secara alternatif via Var(S)=E[S2](E[S])2\text{Var}(S) = E[S^2] - (E[S])^2; diturunkan dari kondisioning pada NN.

fX(x)=ΘfXΘ(xθ)fΘ(θ)dθf_X(x) = \int_\Theta f_{X|\Theta}(x|\theta)\,f_\Theta(\theta)\,d\theta

Label: Marginalisasi Distribusi Campuran — PDF marginal XX diperoleh dengan mengintegrasikan distribusi bersyarat terhadap distribusi parameter acak; persis operasi marginalisasi dari 3.2 Distribusi Marginal.

Asumsi Eksplisit

  • Independensi XiX_i dan NN: Besaran klaim X1,X2,X_1, X_2, \ldots harus independen dari frekuensi NN. Jika terdapat ketergantungan (misalnya bencana alam menyebabkan sekaligus banyak klaim kecil atau sedikit klaim besar), model distribusi majemuk dasar tidak berlaku.
  • Identik dan independen (XiX_i i.i.d.): Semua besaran klaim harus memiliki distribusi yang sama. Jika setiap klaim memiliki distribusi berbeda (misalnya berbeda-beda per tertanggung), diperlukan model yang lebih kompleks.
  • S=0S = 0 ketika N=0N = 0: Ini adalah konvensi baku; tanpanya, distribusi SS tidak terdefinisi untuk kemungkinan N=0N = 0.
  • Existensi momen: E[S]E[S] dan Var(S)\text{Var}(S) terdefinisi jika E[N]<E[N] < \infty, E[X2]<E[X^2] < \infty, dan Var(N)<\text{Var}(N) < \infty.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Untuk memahami rumus momen distribusi majemuk, kondisikan pada nilai NN. Jika N=nN = n (diketahui), maka S=X1+X2++XnS = X_1 + X_2 + \cdots + X_n adalah jumlah dari nn variabel acak i.i.d. — situasi yang sudah dikenal dari 3.5 Independensi dan Korelasi: E[SN=n]=nμXE[S \mid N=n] = n\mu_X dan Var(SN=n)=nσX2\text{Var}(S \mid N=n) = n\sigma_X^2. Dalam bentuk variabel acak: E[SN]=NμXE[S \mid N] = N\mu_X dan Var(SN)=NσX2\text{Var}(S \mid N) = N\sigma_X^2. Sekarang terapkan 3.4 Nilai Harapan dan Variansi Bersyarat:

Hukum Ekspektasi Total: E[S]=E[E[SN]]=E[NμX]=μXE[N]=μXμNE[S] = E[E[S \mid N]] = E[N\mu_X] = \mu_X E[N] = \mu_X \mu_N

Hukum Variansi Total (EVE’s Law): Var(S)=E[Var(SN)]within+Var(E[SN])between\text{Var}(S) = \underbrace{E[\text{Var}(S \mid N)]}_{\text{within}} + \underbrace{\text{Var}(E[S \mid N])}_{\text{between}} =E[NσX2]+Var(NμX)=σX2E[N]+μX2Var(N)=μNσX2+σN2μX2= E[N\sigma_X^2] + \text{Var}(N\mu_X) = \sigma_X^2 E[N] + \mu_X^2 \text{Var}(N) = \mu_N\sigma_X^2 + \sigma_N^2\mu_X^2

Derivasi MGF via Kondisioning — Rumus Komposisi

Derivasi MS(t)=GN(MX(t))M_S(t) = G_N(M_X(t)) adalah salah satu hasil paling elegan dalam teori probabilitas. Mulai dengan kondisioning pada NN:

MS(t)=E[etS]=E ⁣[E[etSN]]M_S(t) = E[e^{tS}] = E\!\left[E[e^{tS} \mid N]\right]

Untuk N=nN = n tetap: S=X1++XnS = X_1 + \cdots + X_n sehingga etS=etX1etXne^{tS} = e^{tX_1} \cdots e^{tX_n}. Karena XiX_i i.i.d. dan independen dari NN:

E[etSN=n]=E ⁣[et(X1++Xn)]=i=1nE[etXi]=(MX(t))nE[e^{tS} \mid N=n] = E\!\left[e^{t(X_1+\cdots+X_n)}\right] = \prod_{i=1}^n E[e^{tX_i}] = (M_X(t))^n

Dalam bentuk variabel acak: E[etSN]=(MX(t))NE[e^{tS} \mid N] = (M_X(t))^N. Ambil ekspektasi terhadap NN:

MS(t)=E ⁣[(MX(t))N]=GN(MX(t))M_S(t) = E\!\left[(M_X(t))^N\right] = G_N(M_X(t))

di mana di langkah terakhir digunakan definisi PGF: GN(z)=E[zN]G_N(z) = E[z^N] dengan z=MX(t)z = M_X(t).

Distribusi Majemuk Standar yang Diuji di CF2:

(1) Poisson-Gamma \to Binomial Negatif:

Jika XΛPoisson(Λ)X \mid \Lambda \sim \text{Poisson}(\Lambda) dan ΛΓ(α,β)\Lambda \sim \Gamma(\alpha, \beta) (shape α\alpha, rate β\beta), maka distribusi marginal XX adalah Binomial Negatif NB(r,p)\text{NB}(r, p) dengan r=αr = \alpha dan p=β/(1+β)p = \beta/(1+\beta): P(X=x)=(x+α1x)(β1+β)α(11+β)x,x=0,1,2,P(X = x) = \binom{x + \alpha - 1}{x}\left(\frac{\beta}{1+\beta}\right)^\alpha \left(\frac{1}{1+\beta}\right)^x, \quad x = 0, 1, 2, \ldots

Momen: E[X]=α/βE[X] = \alpha/\beta dan Var(X)=α(1+β)/β2>E[X]\text{Var}(X) = \alpha(1+\beta)/\beta^2 > E[X] (overdispersi).

(2) Binomial-Beta \to Beta-Binomial:

Jika XPB(n,P)X \mid P \sim B(n, P) dan PBeta(α,β)P \sim \text{Beta}(\alpha, \beta), maka distribusi marginal XX adalah Beta-Binomial dengan: P(X=x)=(nx)B(α+x,β+nx)B(α,β),x=0,1,,nP(X = x) = \binom{n}{x}\frac{B(\alpha+x,\, \beta+n-x)}{B(\alpha, \beta)}, \quad x = 0, 1, \ldots, n di mana B(,)B(\cdot, \cdot) adalah fungsi Beta.

(3) Compound Poisson (Penjumlahan Acak Poisson):

Jika NPoisson(λ)N \sim \text{Poisson}(\lambda) dan XiX_i i.i.d. dengan MGF MX(t)M_X(t): MS(t)=GN(MX(t))=eλ(MX(t)1)M_S(t) = G_N(M_X(t)) = e^{\lambda(M_X(t) - 1)} karena GN(z)=eλ(z1)G_N(z) = e^{\lambda(z-1)} untuk Poisson. Momen: E[S]=λμXE[S] = \lambda\mu_X dan Var(S)=λE[X2]\text{Var}(S) = \lambda E[X^2].

Dilarang
  1. Dilarang mengabaikan kasus N=0N = 0: Dalam distribusi majemuk, P(S=0)P(N=0)>0P(S = 0) \geq P(N = 0) > 0 umumnya. Saat menghitung PMF atau CDF dari SS, kontribusi dari N=0N = 0 (yang memberikan S=0S = 0) harus selalu disertakan.
  2. Dilarang membalik argumen dalam komposisi MGF/PGF: Rumus yang benar adalah MS(t)=GN(MX(t))M_S(t) = G_N(M_X(t)) — PGF dari frekuensi NN dievaluasi pada MGF besaran XX. Membaliknya menjadi GX(MN(t))G_X(M_N(t)) adalah kesalahan fatal tanpa makna probabilistik yang jelas.
  3. Dilarang menggunakan rumus momen E[S]=μNμXE[S] = \mu_N\mu_X tanpa verifikasi independensi NN dan XiX_i: Jika NN dan XiX_i tidak independen (misalnya bencana menyebabkan korelasi antara jumlah dan besaran klaim), rumus ini tidak berlaku dan momen harus dihitung dari distribusi joint yang sebenarnya.

Section 4 — Contoh Soal

Soal A — Fundamental

Sebuah perusahaan asuransi kendaraan memiliki model klaim sebagai berikut. Jumlah klaim NN dalam satu bulan mengikuti distribusi Poisson dengan mean λ=3\lambda = 3. Besarnya setiap klaim XiX_i (dalam juta rupiah) berdistribusi Eksponensial dengan mean μX=2\mu_X = 2 (yaitu XExp(1/2)X \sim \text{Exp}(1/2), parameter laju 1/21/2), independen satu sama lain dan dari NN. Definisikan S=i=1NXiS = \sum_{i=1}^N X_i sebagai total klaim bulanan.

(a) Hitung E[S]E[S] dan Var(S)\text{Var}(S). (b) Tentukan MGF dari SS.

Solusi Soal A

1. Identifikasi Variabel

  • NPoisson(λ=3)N \sim \text{Poisson}(\lambda = 3): E[N]=Var(N)=3E[N] = \text{Var}(N) = 3.
  • XExp(1/2)X \sim \text{Exp}(1/2) (laju 1/21/2, skala θ=2\theta = 2): E[X]=2E[X] = 2, Var(X)=4\text{Var}(X) = 4, E[X2]=Var(X)+(E[X])2=4+4=8E[X^2] = \text{Var}(X) + (E[X])^2 = 4 + 4 = 8.
  • S=i=1NXiS = \sum_{i=1}^N X_i: distribusi majemuk Compound Poisson-Eksponensial.

2. Identifikasi Distribusi / Model

  • Compound distribution dengan frekuensi Poisson dan besaran Eksponensial.
  • Terapkan rumus momen distribusi majemuk dan komposisi MGF-PGF.

3. Setup Persamaan E[S]=E[N]E[X],Var(S)=E[N]Var(X)+Var(N)(E[X])2E[S] = E[N]\cdot E[X], \qquad \text{Var}(S) = E[N]\cdot\text{Var}(X) + \text{Var}(N)\cdot(E[X])^2 MS(t)=GN(MX(t))=exp ⁣(λ(MX(t)1))M_S(t) = G_N(M_X(t)) = \exp\!\left(\lambda(M_X(t) - 1)\right)

4. Eksekusi Aljabar

(a) Mean dan Variansi SS: E[S]=μNμX=32=6 juta rupiahE[S] = \mu_N \cdot \mu_X = 3 \cdot 2 = 6 \text{ juta rupiah}

Var(S)=μNσX2+σN2μX2=3(4)+3(4)=12+12=24\text{Var}(S) = \mu_N\sigma_X^2 + \sigma_N^2\mu_X^2 = 3(4) + 3(4) = 12 + 12 = 24

Catatan: untuk Poisson μN=σN2=λ=3\mu_N = \sigma_N^2 = \lambda = 3, sehingga Var(S)=λ(E[X2])=3×8=24\text{Var}(S) = \lambda(E[X^2]) = 3 \times 8 = 24 (rumus alternatif untuk Compound Poisson).

(b) MGF dari SS:

MGF dari XExp(1/2)X \sim \text{Exp}(1/2) (laju 1/21/2): MX(t)=1/21/2t=112t,t<12M_X(t) = \frac{1/2}{1/2 - t} = \frac{1}{1 - 2t}, \quad t < \frac{1}{2}

PGF dari NPoisson(λ)N \sim \text{Poisson}(\lambda): GN(z)=eλ(z1)=e3(z1)G_N(z) = e^{\lambda(z-1)} = e^{3(z-1)}

MGF dari SS: MS(t)=GN(MX(t))=exp ⁣(3 ⁣(112t1))=exp ⁣(32t12t)=exp ⁣(6t12t),t<12M_S(t) = G_N(M_X(t)) = \exp\!\left(3\!\left(\frac{1}{1-2t} - 1\right)\right) = \exp\!\left(3 \cdot \frac{2t}{1-2t}\right) = \exp\!\left(\frac{6t}{1-2t}\right), \quad t < \frac{1}{2}

5. Verification

  • E[S]=6E[S] = 6 juta rupiah: rata-rata 3 klaim per bulan, masing-masing rata-rata 2 juta — total 6 juta. Masuk akal. ✓
  • Var(S)=24\text{Var}(S) = 24: lebih besar dari Var(SN=3)=3×4=12\text{Var}(S \mid N=3) = 3 \times 4 = 12 karena ada tambahan variansi akibat fluktuasi frekuensi NN — komponen between =3×4=12= 3 \times 4 = 12. ✓
  • MS(0)=e0=1M_S(0) = e^0 = 1
  • MS(0)=E[S]=6M_S'(0) = E[S] = 6: cek dengan diferensiasi MS(t)=e6t/(12t)M_S(t) = e^{6t/(1-2t)} di t=0t=0: turunan =MS(t)6(12t)2= M_S(t) \cdot \frac{6}{(1-2t)^2}; di t=0t=0: 16=61 \cdot 6 = 6
Exam Tips — Soal A
  • Target waktu: 6–8 menit.
  • Rumus Compound Poisson yang wajib dihafal: Jika NPoisson(λ)N \sim \text{Poisson}(\lambda), maka Var(S)=λE[X2]\text{Var}(S) = \lambda\,E[X^2] (bukan λVar(X)\lambda\,\text{Var}(X)). Ini karena μN=σN2=λ\mu_N = \sigma_N^2 = \lambda, sehingga Var(S)=λσX2+λμX2=λ(σX2+μX2)=λE[X2]\text{Var}(S) = \lambda\sigma_X^2 + \lambda\mu_X^2 = \lambda(\sigma_X^2 + \mu_X^2) = \lambda E[X^2].
  • Common trap — MGF Eksponensial: MGF dari XExp(λrate)X \sim \text{Exp}(\lambda_{\text{rate}}) adalah MX(t)=λrate/(λratet)M_X(t) = \lambda_{\text{rate}}/(\lambda_{\text{rate}} - t) untuk t<λratet < \lambda_{\text{rate}}. Pastikan konsisten antara parametrisasi laju dan skala.
  • Shortcut verifikasi: MS(0)M_S'(0) harus sama dengan E[S]E[S] yang sudah dihitung di bagian (a). Ini cek cepat tanpa perlu menurunkan ulang.

Soal B — Exam-Typical

Jumlah klaim NN dalam satu periode berdistribusi Poisson bersyarat: NΛPoisson(Λ)N \mid \Lambda \sim \text{Poisson}(\Lambda) di mana parameter Λ\Lambda sendiri adalah variabel acak dengan ΛΓ(α=2,β=3)\Lambda \sim \Gamma(\alpha = 2, \beta = 3) (parametrisasi shape-rate, sehingga E[Λ]=α/β=2/3E[\Lambda] = \alpha/\beta = 2/3 dan Var(Λ)=α/β2=2/9\text{Var}(\Lambda) = \alpha/\beta^2 = 2/9).

(a) Identifikasi distribusi marginal dari NN beserta parameternya, menggunakan hasil Poisson-Gamma. (b) Hitung E[N]E[N] dan Var(N)\text{Var}(N) menggunakan Hukum Ekspektasi Total dan Variansi Total. (c) Verifikasi bahwa hasil di (b) konsisten dengan momen distribusi yang ditemukan di (a).

Solusi Soal B

1. Identifikasi Variabel

  • ΛΓ(α=2,β=3)\Lambda \sim \Gamma(\alpha=2, \beta=3) (shape α=2\alpha=2, rate β=3\beta=3): E[Λ]=2/3E[\Lambda] = 2/3, Var(Λ)=2/9\text{Var}(\Lambda) = 2/9.
  • NΛPoisson(Λ)N \mid \Lambda \sim \text{Poisson}(\Lambda): bersyarat pada Λ\Lambda, NN adalah Poisson.
  • Sifat Poisson: E[NΛ]=ΛE[N \mid \Lambda] = \Lambda dan Var(NΛ)=Λ\text{Var}(N \mid \Lambda) = \Lambda.

2. Identifikasi Distribusi / Model

  • Ini adalah distribusi campuran Poisson-Gamma, yang menghasilkan Binomial Negatif sebagai distribusi marginal.
  • Parametrisasi: r=α=2r = \alpha = 2 dan p=β/(1+β)=3/4p = \beta/(1+\beta) = 3/4.

3. Setup Persamaan

Dari Hukum Ekspektasi Total dan Variansi Total (kondisioning pada Λ\Lambda): E[N]=E[E[NΛ]]=E[Λ]E[N] = E[E[N \mid \Lambda]] = E[\Lambda] Var(N)=E[Var(NΛ)]+Var(E[NΛ])=E[Λ]+Var(Λ)\text{Var}(N) = E[\text{Var}(N \mid \Lambda)] + \text{Var}(E[N \mid \Lambda]) = E[\Lambda] + \text{Var}(\Lambda)

4. Eksekusi Aljabar

(a) Distribusi Marginal NN:

Dari hasil Poisson-Gamma standar: jika NΛPoisson(Λ)N \mid \Lambda \sim \text{Poisson}(\Lambda) dan ΛΓ(α,β)\Lambda \sim \Gamma(\alpha, \beta) (shape-rate), maka: NNB ⁣(r=α,  p=β1+β)=NB ⁣(2,  34)N \sim \text{NB}\!\left(r = \alpha,\; p = \frac{\beta}{1+\beta}\right) = \text{NB}\!\left(2,\; \frac{3}{4}\right)

PMF Binomial Negatif (jumlah kegagalan sebelum sukses ke-rr, dengan pp = probabilitas sukses): P(N=n)=(n+r1n)(1p)npr=(n+1n)(14)n ⁣(34)2,n=0,1,2,P(N = n) = \binom{n + r - 1}{n}(1-p)^n p^r = \binom{n+1}{n}\left(\frac{1}{4}\right)^n\!\left(\frac{3}{4}\right)^2, \quad n = 0, 1, 2, \ldots

(b) Momen dari Hukum Total:

E[N]=E[Λ]=αβ=23E[N] = E[\Lambda] = \frac{\alpha}{\beta} = \frac{2}{3}

Var(N)=E[Var(NΛ)]+Var(E[NΛ])\text{Var}(N) = E[\text{Var}(N \mid \Lambda)] + \text{Var}(E[N \mid \Lambda]) =E[Λ]+Var(Λ)=23+29=69+29=89= E[\Lambda] + \text{Var}(\Lambda) = \frac{2}{3} + \frac{2}{9} = \frac{6}{9} + \frac{2}{9} = \frac{8}{9}

(c) Verifikasi dengan momen Binomial Negatif:

Untuk NB(r,p)\text{NB}(r, p) dengan parametrisasi sukses ke-rr (jumlah kegagalan): E[N]=r(1p)p=2(1/4)3/4=2/43/4=23E[N] = \frac{r(1-p)}{p} = \frac{2(1/4)}{3/4} = \frac{2/4}{3/4} = \frac{2}{3} \checkmark

Var(N)=r(1p)p2=2(1/4)(3/4)2=1/29/16=12169=89\text{Var}(N) = \frac{r(1-p)}{p^2} = \frac{2(1/4)}{(3/4)^2} = \frac{1/2}{9/16} = \frac{1}{2} \cdot \frac{16}{9} = \frac{8}{9} \checkmark

5. Verification

  • Var(N)=8/9>E[N]=2/3\text{Var}(N) = 8/9 > E[N] = 2/3: Binomial Negatif selalu memiliki variansi lebih besar dari meannya (overdispersi dibanding Poisson murni). Ini adalah sifat khas dari distribusi campuran — ketidakpastian parameter acak Λ\Lambda menambah variansi. ✓
  • Komponen within (E[Λ]=2/3E[\Lambda] = 2/3) = komponen antara variasi “Poisson murni” yang diharapkan.
  • Komponen between (Var(Λ)=2/9\text{Var}(\Lambda) = 2/9) = tambahan variansi akibat heterogenitas Λ\Lambda. ✓
  • p=3/4p = 3/4: probabilitas sukses yang tinggi mengindikasikan relatif sedikit kegagalan (klaim) sebelum mencapai r=2r = 2 “sukses” — konsisten dengan E[N]=2/3<1E[N] = 2/3 < 1. ✓
Exam Tips — Soal B
  • Target waktu: 7–9 menit.
  • Pola Poisson-Gamma wajib dihafal: NΛPoisson(Λ)N \mid \Lambda \sim \text{Poisson}(\Lambda), ΛΓ(α,β)\Lambda \sim \Gamma(\alpha, \beta) \Rightarrow NNB(α,β/(1+β))N \sim \text{NB}(\alpha, \beta/(1+\beta)). Selalu nyatakan parametrisasi NB yang digunakan (ada beberapa konvensi).
  • Rumus momen via Hukum Total vs momen distribusi NB: Di exam, menghitung momen via Hukum Ekspektasi/Variansi Total seringkali lebih cepat daripada mengingat rumus momen NB — cukup ingat E[N]=E[Λ]E[N] = E[\Lambda] dan Var(N)=E[Λ]+Var(Λ)\text{Var}(N) = E[\Lambda] + \text{Var}(\Lambda).
  • Common trap — parametrisasi Gamma: Perhatikan apakah soal menggunakan parametrisasi shape-rate (α,β)(\alpha, \beta) atau shape-scale (α,θ)(\alpha, \theta) di mana θ=1/β\theta = 1/\beta. Rumus E[Λ]E[\Lambda] berbeda: α/β\alpha/\beta (rate) vs αθ\alpha\theta (scale).

Soal C — Challenging

Misalkan S=i=1NXiS = \sum_{i=1}^N X_i di mana NGeom(p)N \sim \text{Geom}(p) (dengan PMF P(N=n)=(1p)npP(N = n) = (1-p)^n p untuk n=0,1,2,n = 0, 1, 2, \ldots, yaitu jumlah kegagalan sebelum sukses pertama) dan XiiidBernoulli(q)X_i \stackrel{\text{iid}}{\sim} \text{Bernoulli}(q), independen dari NN. Semua XiX_i bernilai 0 atau 1.

(a) Hitung E[S]E[S] dan Var(S)\text{Var}(S). (b) Tentukan PGF dari SS, yaitu GS(z)=GN(GX(z))G_S(z) = G_N(G_X(z)). (c) Dari PGF, identifikasi distribusi dari SS beserta parameternya. (d) Hitung P(S=0)P(S = 0) dan P(S=2)P(S = 2).

Solusi Soal C

1. Identifikasi Variabel

  • NGeom(p)N \sim \text{Geom}(p) (jumlah kegagalan): P(N=n)=(1p)npP(N=n) = (1-p)^n p, n=0,1,2,n = 0,1,2,\ldots E[N]=(1p)/pE[N] = (1-p)/p, Var(N)=(1p)/p2\text{Var}(N) = (1-p)/p^2.
  • XBernoulli(q)X \sim \text{Bernoulli}(q): E[X]=qE[X] = q, Var(X)=q(1q)\text{Var}(X) = q(1-q), E[X2]=qE[X^2] = q.
  • S=i=1NXiS = \sum_{i=1}^N X_i: compound Geometric-Bernoulli.

2. Identifikasi Distribusi / Model

  • Compound distribution; karena XiX_i adalah Bernoulli, SS menghitung jumlah “sukses” dalam NN percobaan di mana NN sendiri adalah Geometrik.
  • Antisipasi: komposisi PGF Geometrik dan PGF Bernoulli kemungkinan menghasilkan distribusi yang dikenal.

3. Setup Persamaan

PGF dari Geom(p)\text{Geom}(p) (dengan support {0,1,2,}\{0,1,2,\ldots\}, PMF =p(1p)n= p(1-p)^n): GN(z)=E[zN]=n=0znp(1p)n=pn=0[z(1p)]n=p1z(1p),z<11pG_N(z) = E[z^N] = \sum_{n=0}^{\infty} z^n p(1-p)^n = p\sum_{n=0}^{\infty}[z(1-p)]^n = \frac{p}{1 - z(1-p)}, \quad |z| < \frac{1}{1-p}

PGF dari XBernoulli(q)X \sim \text{Bernoulli}(q): GX(z)=E[zX]=(1q)z0+qz1=1q+qzG_X(z) = E[z^X] = (1-q)z^0 + qz^1 = 1 - q + qz

4. Eksekusi Aljabar

(a) Mean dan Variansi SS: E[S]=E[N]E[X]=1ppq=q(1p)pE[S] = E[N]\cdot E[X] = \frac{1-p}{p} \cdot q = \frac{q(1-p)}{p}

Var(S)=E[N]Var(X)+Var(N)(E[X])2\text{Var}(S) = E[N]\cdot\text{Var}(X) + \text{Var}(N)\cdot(E[X])^2 =1ppq(1q)+1pp2q2= \frac{1-p}{p}\cdot q(1-q) + \frac{1-p}{p^2}\cdot q^2 =q(1p)p ⁣[(1q)+qp]=q(1p)pp(1q)+qp=q(1p)(ppq+q)p2= \frac{q(1-p)}{p}\!\left[(1-q) + \frac{q}{p}\right] = \frac{q(1-p)}{p}\cdot\frac{p(1-q) + q}{p} = \frac{q(1-p)(p - pq + q)}{p^2}

(b) PGF dari SS: GS(z)=GN(GX(z))=p1GX(z)(1p)G_S(z) = G_N(G_X(z)) = \frac{p}{1 - G_X(z)(1-p)}

Substitusi GX(z)=1q+qzG_X(z) = 1 - q + qz: GS(z)=p1(1q+qz)(1p)G_S(z) = \frac{p}{1 - (1-q+qz)(1-p)}

Sederhanakan penyebut: 1(1p)(1q+qz)=1(1p)+(1p)q(1p)qz=p+q(1p)q(1p)z1 - (1-p)(1-q+qz) = 1 - (1-p) + (1-p)q - (1-p)qz = p + q(1-p) - q(1-p)z =p+q(1p)(1z)= p + q(1-p)(1-z)

Sehingga: GS(z)=pp+q(1p)(1z)=pp+q(1p)11q(1p)p+q(1p)(z...)G_S(z) = \frac{p}{p + q(1-p)(1-z)} = \frac{p}{p + q(1-p)} \cdot \frac{1}{1 - \frac{q(1-p)}{p + q(1-p)}(z-\text{...})}

Faktorkan: misalkan p~=p+q(1p)=p+qpq\tilde{p} = p + q(1-p) = p + q - pq (probabilitas S=0S = 0, yaitu gabungan N=0N=0 atau semua Xi=0X_i = 0):

GS(z)=p/p~1(1p/p~)zp~p~=pp+q(1p)q(1p)zG_S(z) = \frac{p/\tilde{p}}{1 - (1 - p/\tilde{p})z} \cdot \frac{\tilde{p}}{\tilde{p}} = \frac{p}{p + q(1-p) - q(1-p)z}

Tulis ulang dengan membagi atas bawah dengan p+q(1p)p + q(1-p): GS(z)=p/(p+q(1p))1q(1p)p+q(1p)zG_S(z) = \frac{p/(p+q(1-p))}{1 - \frac{q(1-p)}{p+q(1-p)} z}

(c) Identifikasi Distribusi SS:

PGF berbentuk p1(1p)z\dfrac{p^*}{1 - (1-p^*)z} di mana p=pp+q(1p)p^* = \dfrac{p}{p + q(1-p)}.

Ini adalah PGF dari distribusi Geometrik dengan parameter sukses pp^*: GGeom(p)(z)=p1(1p)zG_{\text{Geom}(p^*)}(z) = \frac{p^*}{1-(1-p^*)z}

\therefore SGeom(p)S \sim \text{Geom}(p^*) dengan p=pp+q(1p)=pp+qpqp^* = \dfrac{p}{p + q(1-p)} = \dfrac{p}{p + q - pq}.

(d) Probabilitas spesifik:

Dari PMF Geometrik dengan P(S=s)=(1p)spP(S = s) = (1-p^*)^s p^*:

P(S=0)=p=pp+q(1p)P(S = 0) = p^* = \frac{p}{p + q(1-p)}

Verifikasi langsung: P(S=0)=P(N=0)+n=1P(N=n)P(semua Xi=0)P(S = 0) = P(N = 0) + \sum_{n=1}^{\infty} P(N=n) \cdot P(\text{semua } X_i = 0) =p+n=1(1p)np(1q)n=p+pn=1[(1p)(1q)]n=p+p(1p)(1q)1(1p)(1q)= p + \sum_{n=1}^{\infty}(1-p)^n p \cdot (1-q)^n = p + p\sum_{n=1}^{\infty}[(1-p)(1-q)]^n = p + p\cdot\frac{(1-p)(1-q)}{1-(1-p)(1-q)}

Ini konsisten dengan pp^* di atas (verifikasi aljabar ditinggalkan).

P(S=2)=(1p)2p=(q(1p)p+q(1p))2pp+q(1p)P(S = 2) = (1-p^*)^2 p^* = \left(\frac{q(1-p)}{p+q(1-p)}\right)^2 \cdot \frac{p}{p+q(1-p)}

5. Verification

  • GS(1)=p/(p+q(1p)q(1p))=p/p=1G_S(1) = p/(p+q(1-p)-q(1-p)) = p/p = 1
  • GS(1)=E[S]=q(1p)/pG_S'(1) = E[S] = q(1-p)/p: diferensiasi GS(z)G_S(z) di z=1z=1 harus menghasilkan E[S]E[S]
  • Untuk q=1q = 1 (semua Xi=1X_i = 1): S=NGeom(p)S = N \sim \text{Geom}(p) dan p=p/(p+1(1p))=p/1=pp^* = p/(p + 1 \cdot (1-p)) = p/1 = p — konsisten karena S=NGeom(p)S = N \sim \text{Geom}(p)
  • Untuk q=0q = 0 (semua Xi=0X_i = 0): S=0S = 0 selalu, p=p/(p+0)=1p^* = p/(p+0) = 1, sehingga P(S=0)=1P(S=0) = 1 — konsisten ✓
Exam Tips — Soal C
  • Target waktu: 15–18 menit.
  • Strategi PGF: Setelah mendapatkan ekspresi GS(z)G_S(z), selalu usahakan menyederhanakannya ke bentuk standar yang dikenal (Geometrik, Binomial, Poisson, dll.). Kenali bentuk-bentuk PGF standar:
    • Geometrik Geom(p)\text{Geom}(p): p/(1(1p)z)p/(1-(1-p)z)
    • Binomial B(n,p)B(n,p): (1p+pz)n(1-p+pz)^n
    • Poisson (λ)(\lambda): eλ(z1)e^{\lambda(z-1)}
    • Binomial Negatif NB(r,p)\text{NB}(r,p): (p/(1(1p)z))r(p/(1-(1-p)z))^r
  • Common trap — kasus khusus sebagai verifikasi: Cek q=0q=0 dan q=1q=1 sebagai kasus batas untuk memverifikasi konsistensi jawaban — teknik ini sangat efisien dan sering mendeteksi kesalahan aljabar.
  • Common trap — PGF vs MGF: Komposisi PGF digunakan (GS=GNGXG_S = G_N \circ G_X) karena XX diskrit non-negatif. Jika XX kontinu, gunakan MGF: MS(t)=GN(MX(t))M_S(t) = G_N(M_X(t)).

Section 5 — Verifikasi & Sanity Check

Verifikasi Momen Distribusi Majemuk
  • E[S]=μNμXE[S] = \mu_N \mu_X harus lebih besar dari 0 jika μN>0\mu_N > 0 dan μX>0\mu_X > 0.
  • Var(S)E[N]Var(X)\text{Var}(S) \geq E[N]\text{Var}(X): variansi total selalu \geq variansi yang disebabkan oleh fluktuasi besaran saja (komponen within). Komponen between =Var(N)μX20= \text{Var}(N)\mu_X^2 \geq 0 selalu menambah variansi.
  • Khusus Compound Poisson: Var(S)=λE[X2]λ(E[X])2=(E[S])2/λ\text{Var}(S) = \lambda E[X^2] \geq \lambda(E[X])^2 = (E[S])^2/\lambda — rasio variansi-mean selalu \geq mean per klaim.
Verifikasi MGF/PGF
  • MS(0)=GN(MX(0))=GN(1)=1M_S(0) = G_N(M_X(0)) = G_N(1) = 1 selalu ✓
  • MS(0)=E[S]=μNμXM_S'(0) = E[S] = \mu_N\mu_X: diferensiasi MGF di t=0t=0 harus sama dengan mean yang dihitung terpisah.
  • GS(1)=GN(GX(1))=GN(1)=1G_S(1) = G_N(G_X(1)) = G_N(1) = 1
  • GS(1)=E[S]G_S'(1) = E[S]: diferensiasi PGF di z=1z=1 menghasilkan mean.
Verifikasi Distribusi Campuran
  • Distribusi marginal yang diperoleh dari campuran harus merupakan distribusi valid: semua probabilitas 0\geq 0 dan jumlah = 1.
  • Momen yang diperoleh via Hukum Total harus konsisten dengan momen distribusi marginal yang teridentifikasi.
  • Untuk Poisson-Gamma: Var(N)>E[N]\text{Var}(N) > E[N] (overdispersi dibanding Poisson murni) — ini selalu terpenuhi karena komponen between >0> 0.

Metode Alternatif

Menghitung PMF SS secara langsung (untuk kasus sederhana):

P(S=s)=n=0P(N=n)P(X1++Xn=s)P(S = s) = \sum_{n=0}^{\infty} P(N=n) \cdot P(X_1+\cdots+X_n = s)

Untuk s=0s = 0: P(S=0)=P(N=0)+n=1P(N=n)P(X1==Xn=0)P(S=0) = P(N=0) + \sum_{n=1}^{\infty} P(N=n) \cdot P(X_1=\cdots=X_n=0). Metode ini layak untuk nilai ss kecil tetapi menjadi tidak praktis untuk distribusi umum.

Menggunakan MGF untuk mengidentifikasi distribusi SS:

Setelah mendapatkan MS(t)=GN(MX(t))M_S(t) = G_N(M_X(t)), bandingkan bentuknya dengan MGF distribusi-distribusi standar:

  • eμ(et1)e^{\mu(e^t-1)}: Poisson(μ\mu)
  • (pet/(1(1p)et))r(pe^t/(1-(1-p)e^t))^r: Geometrik/NB
  • eλ(et1)e^{\lambda(e^t-1)} untuk Compound Poisson-Poisson (XPoissonX \sim \text{Poisson}): juga Poisson (sifat reproduktif)

Rumus momen kedua alternatif (lebih cepat untuk soal tertentu):

E[S2]=E[N]E[X2]+E[N(N1)](E[X])2E[S^2] = E[N]\,E[X^2] + E[N(N-1)]\,(E[X])^2

Sehingga Var(S)=E[S2](E[S])2=E[N]E[X2]+E[N(N1)]μX2(E[N])2μX2\text{Var}(S) = E[S^2] - (E[S])^2 = E[N]E[X^2] + E[N(N-1)]\mu_X^2 - (E[N])^2\mu_X^2

=E[N]E[X2]+μX2[E[N2]E[N](E[N])2]=μNE[X2]μX2μN+μX2σN2= E[N]E[X^2] + \mu_X^2[E[N^2]-E[N]-(E[N])^2] = \mu_N E[X^2] - \mu_X^2\mu_N + \mu_X^2\sigma_N^2

=μN(σX2+μX2μX2)+σN2μX2=μNσX2+σN2μX2= \mu_N(\sigma_X^2 + \mu_X^2 - \mu_X^2) + \sigma_N^2\mu_X^2 = \mu_N\sigma_X^2 + \sigma_N^2\mu_X^2

Section 6 — Visualisasi Mental

Distribusi majemuk sebagai “dua tahap ketidakpastian”: Bayangkan proses dua lapis. Tahap pertama: alam “mengocok dadu” untuk menentukan berapa banyak klaim NN yang terjadi. Tahap kedua: untuk setiap klaim, alam “mengocok dadu lagi” untuk menentukan besarnya. Total SS adalah hasil akhir setelah kedua tahap selesai. Variansi total SS mencerminkan ketidakpastian dari kedua sumber: fluktuasi jumlah klaim (komponen between) dan fluktuasi besaran per klaim (komponen within).

Distribusi campuran sebagai “populasi yang heterogen”: Untuk distribusi campuran XΘf(θ)X \mid \Theta \sim f(\cdot|\theta), bayangkan populasi nasabah yang secara intrinsik heterogen — setiap nasabah memiliki parameter risiko θ\theta yang berbeda (yang tidak dapat diobservasi langsung). Distribusi marginal XX adalah campuran dari semua distribusi individual ini, tertimbang oleh distribusi Θ\Theta dalam populasi. Akibatnya, distribusi marginal selalu lebih “tersebar” (overdispersi) dibanding distribusi individual rata-rata — inilah mengapa Binomial Negatif (campuran Poisson) memiliki variansi lebih besar dari Poisson murni.

Visualisasi PMF distribusi majemuk: Untuk S=i=1NXiS = \sum_{i=1}^N X_i dengan XiX_i diskrit, PMF dari SS adalah campuran tertimbang dari PMF konvolusi: P(S=s)=nP(N=n)P(konvolusi ke-n=s)P(S=s) = \sum_n P(N=n) \cdot P(\text{konvolusi ke-}n = s). Grafik batang PMF SS biasanya memiliki puncak di sekitar μNμX\mu_N\mu_X tetapi dengan ekor yang lebih panjang dibanding distribusi normal — mencerminkan overdispersi khas distribusi majemuk.

Hubungan Visual ↔ Rumus

Dua sumber variansi dalam dekomposisi EVE: Var(S)=μNσX2variansi besaran(within claims)+σN2μX2variansi frekuensi(between periods)\text{Var}(S) = \underbrace{\mu_N\sigma_X^2}_{\substack{\text{variansi besaran} \\ \text{(within claims)}}} + \underbrace{\sigma_N^2\mu_X^2}_{\substack{\text{variansi frekuensi} \\ \text{(between periods)}}}

Komposisi fungsi pembangkit mencerminkan struktur dua tahap: GS(z)=GN(GX(z)tahap 2: besaran)tahap 1: frekuensi menggunakan PGF besaran sebagai argumenG_S(z) = G_N(\underbrace{G_X(z)}_{\text{tahap 2: besaran}}) \longleftrightarrow \text{tahap 1: frekuensi menggunakan PGF besaran sebagai argumen}

Overdispersi dari distribusi campuran: Var(X)=E[Var(XΘ)]+Var(E[XΘ])>E[Var(XΘ)]marginal lebih tersebar dari kondisional rata-rata\text{Var}(X) = E[\text{Var}(X|\Theta)] + \text{Var}(E[X|\Theta]) > E[\text{Var}(X|\Theta)] \longleftrightarrow \text{marginal lebih tersebar dari kondisional rata-rata}

Section 7 — Jebakan Umum

Kesalahan Parametrisasi

Kesalahan pada Rumus Var(S)\text{Var}(S) untuk Compound Poisson:

Salah: Var(S)=λVar(X)\text{Var}(S) = \lambda\,\text{Var}(X) (hanya komponen within)

Benar: Var(S)=λVar(X)+λ(E[X])2=λE[X2]\text{Var}(S) = \lambda\,\text{Var}(X) + \lambda\,(E[X])^2 = \lambda\,E[X^2]

Untuk Compound Poisson, μN=σN2=λ\mu_N = \sigma_N^2 = \lambda, sehingga kedua komponen EVE menjadi λσX2\lambda\sigma_X^2 dan λμX2\lambda\mu_X^2. Rumus kompak λE[X2]\lambda E[X^2] hanya berlaku untuk Poisson — untuk frekuensi lain, gunakan rumus umum μNσX2+σN2μX2\mu_N\sigma_X^2 + \sigma_N^2\mu_X^2.

Kesalahan Parametrisasi Gamma dalam Poisson-Gamma:

Hati-hati: Parametrisasi Gamma shape-rate (α,β)(\alpha, \beta) menghasilkan E[Λ]=α/βE[\Lambda] = \alpha/\beta, sedangkan shape-scale (α,θ)(\alpha, \theta) menghasilkan E[Λ]=αθE[\Lambda] = \alpha\theta. Selalu periksa konteks soal sebelum mensubstitusikan nilai parameter.

Kesalahan Konseptual
  1. Mengabaikan kasus N=0N = 0 saat menghitung PMF SS. P(S=0)P(S=0) mencakup dua skenario: N=0N=0 (tidak ada klaim sama sekali) DAN N>0N > 0 tetapi semua Xi=0X_i = 0 (jika XX bisa bernilai 0). Sering kali soal menguji kemampuan ini secara eksplisit.
  2. Membalik argumen komposisi PGF/MGF. Rumus yang benar: GS(z)=GN(GX(z))G_S(z) = G_N(G_X(z)) — PGF frekuensi NN dievaluasi pada PGF besaran XX. Bukan sebaliknya.
  3. Mengira distribusi campuran (mixture) sama dengan distribusi majemuk (compound sum). Distribusi campuran adalah marginalisasi X=XΘX = X|\Theta terhadap parameter acak — hasilnya tetap satu variabel acak. Distribusi majemuk adalah penjumlahan S=i=1NXiS = \sum_{i=1}^N X_i — hasilnya adalah agregat yang bisa bernilai lebih besar dari setiap XiX_i individual.
  4. Menggunakan rumus E[S]=μNμXE[S] = \mu_N\mu_X ketika NN dan XiX_i tidak independen. Rumus ini hanya berlaku di bawah asumsi independensi penuh antara NN dan setiap XiX_i.
Kesalahan Interpretasi Soal
  • “Jumlah klaim mengikuti Poisson bersyarat pada Λ\Lambda → ini adalah distribusi campuran, bukan compound sum. Hasil marginalnya adalah Binomial Negatif (Poisson-Gamma), bukan Poisson murni.
  • “Total klaim S=X1+X2++XNS = X_1 + X_2 + \cdots + X_N dengan NN acak” → ini adalah compound sum. Terapkan rumus E[S]=μNμXE[S] = \mu_N\mu_X dan Var(S)=μNσX2+σN2μX2\text{Var}(S) = \mu_N\sigma_X^2 + \sigma_N^2\mu_X^2.
  • “Hitung P(S>c)P(S > c) untuk threshold cc → ini adalah probabilitas ekor distribusi majemuk; jarang memiliki bentuk tertutup. Di CF2, biasanya diselesaikan melalui MGF/PGF atau aproksimasi normal (CLT).
  • “Identifikasi distribusi SS dari PGF-nya” → kenali bentuk PGF standar: Geometrik, Binomial, Poisson, NB. Bentuk p/(1(1p)z)p/(1-(1-p)z) adalah PGF Geometrik; (pz/(1(1p)z))r(pz/(1-(1-p)z))^r atau (p/(1(1p)z))r(p/(1-(1-p)z))^r adalah PGF NB tergantung konvensi.
Red Flags
  • Soal menyebut ”NN acak” dalam penjumlahan: Langsung kenali sebagai compound sum — terapkan rumus momen dan komposisi PGF/MGF.
  • Soal menyebut “parameter distribusi sendiri adalah variabel acak”: Ini adalah distribusi campuran — kondisioning pada parameter, lalu marginalisasi via Hukum Total.
  • Overdispersi: Var(S)>E[S]\text{Var}(S) > E[S] untuk data klaim riil → indikasi kuat bahwa model Poisson murni tidak cukup dan distribusi majemuk/campuran diperlukan.
  • Soal meminta MGF SS dan frekuensi adalah Poisson: Gunakan MS(t)=eλ(MX(t)1)M_S(t) = e^{\lambda(M_X(t)-1)} langsung — tidak perlu substitusi ulang dari PGF Poisson setiap kali.
  • Komposisi PGF menghasilkan PGF distribusi yang dikenal: Catat pola: Geometrik \circ Bernoulli = Geometrik; NB \circ Bernoulli = NB; Poisson \circ Poisson = Poisson (sifat reproduktif Compound Poisson).

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Mean distribusi majemuk: E[S]=E[N]E[X]=μNμXE[S] = E[N]\cdot E[X] = \mu_N\mu_X
  2. Variansi distribusi majemuk (EVE’s Law) — dua komponen: Var(S)=E[N]Var(X)within+Var(N)(E[X])2between=μNσX2+σN2μX2\text{Var}(S) = \underbrace{E[N]\cdot\text{Var}(X)}_{\text{within}} + \underbrace{\text{Var}(N)\cdot(E[X])^2}_{\text{between}} = \mu_N\sigma_X^2 + \sigma_N^2\mu_X^2
  3. Compound Poisson — rumus kompak (wajib hafal): NPoisson(λ)    Var(S)=λE[X2]N \sim \text{Poisson}(\lambda) \implies \text{Var}(S) = \lambda\,E[X^2]
  4. MGF/PGF distribusi majemuk — komposisi (PGF frekuensi \circ MGF/PGF besaran): MS(t)=GN(MX(t)),GS(z)=GN(GX(z))M_S(t) = G_N(M_X(t)), \quad G_S(z) = G_N(G_X(z))
  5. Poisson-Gamma \to Binomial Negatif (distribusi campuran wajib hafal): NΛPoisson(Λ),  ΛΓ(α,β)    NNB ⁣(α,β1+β)N|\Lambda \sim \text{Poisson}(\Lambda),\; \Lambda \sim \Gamma(\alpha, \beta) \implies N \sim \text{NB}\!\left(\alpha, \frac{\beta}{1+\beta}\right) dengan E[N]=α/βE[N] = \alpha/\beta dan Var(N)=α(1+β)/β2\text{Var}(N) = \alpha(1+\beta)/\beta^2.

Kapan Digunakan

  • Trigger keywords: “total klaim agregat”, “penjumlahan acak”, "S=i=1NXiS = \sum_{i=1}^N X_i", “frekuensi klaim acak”, “distribusi parameter acak”, “campuran distribusi”, “Poisson bersyarat”, “overdispersi”, “compound distribution”, “mixture distribution”.
  • Tipe skenario soal:
    • Diberikan distribusi NN dan XX; hitung E[S]E[S], Var(S)\text{Var}(S), dan MGF/PGF dari SS.
    • Identifikasi distribusi marginal dari model campuran (Poisson-Gamma \to NB, Binomial-Beta \to Beta-Binomial).
    • Hitung momen marginal menggunakan Hukum Ekspektasi Total dan Variansi Total.
    • Dari PGF/MGF SS yang diperoleh, identifikasi distribusi SS beserta parameternya.
    • Hitung probabilitas spesifik P(S=s)P(S = s) untuk nilai ss tertentu.

Kapan TIDAK Boleh Digunakan

  • Jika NN adalah konstanta (bukan variabel acak): Ketika N=nN = n tetap, S=X1++XnS = X_1 + \cdots + X_n adalah penjumlahan biasa — gunakan sifat momen penjumlahan dan konvolusi dari 3.5 Independensi dan Korelasi dan 3.8 Transformasi Variabel Acak Gabungan, bukan rumus distribusi majemuk.
  • Jika XiX_i tidak i.i.d.: Rumus E[S]=μNμXE[S] = \mu_N\mu_X dan Var(S)=μNσX2+σN2μX2\text{Var}(S) = \mu_N\sigma_X^2 + \sigma_N^2\mu_X^2 membutuhkan XiX_i identik dan independen. Untuk besaran klaim yang heterogen, diperlukan formula yang lebih umum.
  • Jika soal hanya tentang distribusi bersyarat SN=nS \mid N = n: Ini adalah distribusi dari penjumlahan nn variabel i.i.d. biasa — gunakan teknik konvolusi atau MGF dari 3.8 Transformasi Variabel Acak Gabungan.

Quick Decision Tree

graph TD
    A["Soal melibatkan penjumlahan atau parameter acak"] --> B["Apa jenis model yang dihadapi?"]
    B --> C["S = sum X_i dengan N acak<br>(Compound Sum)"]
    B --> D["X | Theta ~ f(x|theta), Theta acak<br>(Mixture Distribution)"]
    C --> E["Hitung momen S"]
    C --> F["Hitung MGF atau PGF dari S"]
    E --> G["E[S] = mu_N * mu_X<br>Var(S) = mu_N * Var(X) + Var(N) * (mu_X)^2<br>Jika N Poisson: Var(S) = lambda * E[X^2]"]
    F --> H["Frekuensi N diskrit, besaran X kontinu:<br>M_S(t) = G_N(M_X(t))"]
    F --> I["Frekuensi N diskrit, besaran X diskrit:<br>G_S(z) = G_N(G_X(z))"]
    I --> J["Cocokkan bentuk G_S(z)<br>dengan PGF distribusi dikenal"]
    D --> K["Hitung momen marginal via Hukum Total:<br>E[X] = E[E[X|Theta]]<br>Var(X) = E[Var(X|Theta)] + Var(E[X|Theta])"]
    D --> L["Identifikasi distribusi marginal X:<br>Poisson-Gamma? -> NB<br>Binomial-Beta? -> Beta-Binomial"]

Follow-up Options
  1. “Buktikan secara detail bahwa Poisson(Λ\Lambda) dengan ΛΓ(α,β)\Lambda \sim \Gamma(\alpha, \beta) menghasilkan Binomial Negatif, termasuk penurunan PMF-nya melalui integrasi”
  2. “Jelaskan hubungan 3.7 Distribusi Majemuk (Compound Distribution) dengan 3.8 Transformasi Variabel Acak Gabungan dalam konteks model agregat klaim dan aproksimasi distribusi SS
  3. “Buat flashcard 1-halaman untuk topik ini”

📖 Ref: Hogg-McKean-Craig (2019) Bab 2.1–2.4; Miller et al. (2014) Bab 3.7–3.8, 5.8–5.10 | 🗓️ 2026-02-21 | #CF2 #Multivariat #DistribusiMajemuk #CompoundDistribution #MixtureDistribution #PGF #MGF #AgregatKlaim