AktuNotes
← Kembali
TA2 · Materi 1.3

Techniques for Creating New Distributions

Hard Bobot: 5–10% Klugman, Panjer & Willmot (2019) Loss Models 5th ed., Bab 4
TA2TopicModelBesarKlaimNewDistributionsMixingTransformationTeoriRisiko

📊 1.3 — Techniques for Creating New Distributions

Ringkasan Cepat

Topik: Techniques for Creating New Distributions | Bobot: ~5–10% | Difficulty: Hard Ref: Klugman et al. (2019) Loss Models 5th ed., Bab 4 | Prereq: 1.1 Moment and Probability Generating Functions, 1.2 Distribution Classes and Extreme Value

Section 0 — Pemetaan Topik

Topik TA2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Model Besar Klaim1.3Membentuk distribusi baru via perkalian konstanta, raising to a power, exponentiation, dan mixing; menentukan PDF/CDF/momen distribusi hasil transformasi5–10%Hard1.1 Moment and Probability Generating Functions, 1.2 Distribution Classes and Extreme Value1.4 Tail Characteristics, 3.1 Coverage Modifications on Severity and Frequency, 6.1 Parameter Estimation MethodsKPW (2019) Bab 4

Section 1 — Intuisi

Bayangkan seorang aktuaris di perusahaan asuransi kendaraan bermotor di Jakarta. Data historis menunjukkan bahwa klaim kerusakan kendaraan mengikuti distribusi Eksponensial — sederhana, namun terlalu ringan untuk menangkap klaim besar yang sesekali muncul. Lalu muncul pertanyaan: apakah ada cara untuk “memodifikasi” distribusi ini agar lebih sesuai dengan pola klaim dunia nyata, tanpa harus memulai dari nol?

Jawabannya adalah: ya, dan inilah inti dari topik ini. Para aktuaris telah mengembangkan empat teknik sistematis untuk “membangun” distribusi baru dari distribusi yang sudah dikenal. Teknik pertama adalah perkalian konstanta — bayangkan mengubah satuan dari rupiah ke juta rupiah, atau menyesuaikan inflasi; secara matematis ini meregangkan atau menyempitkan distribusi tanpa mengubah bentuknya. Teknik kedua adalah raising to a power (pemangkatan) — mengubah variabel acak menjadi pangkat tertentu, yang menghasilkan distribusi baru dengan ekor yang bisa lebih berat atau lebih ringan. Teknik ketiga adalah exponentiation — mengambil nilai ee dipangkatkan variabel acak, yang sangat berguna untuk mengubah distribusi Normal menjadi Lognormal. Teknik keempat, yang paling powerful, adalah mixing — mencampurkan beberapa distribusi berdasarkan suatu bobot acak, seperti satu portofolio yang terdiri dari polis risiko rendah dan risiko tinggi yang bercampur.

Keempat teknik ini adalah pondasi dari “toolbox” pemodelan distribusi klaim. Hampir semua distribusi yang digunakan dalam aktuaria (Weibull, Lognormal, Burr, Inverse Gaussian, dll.) dapat diturunkan dari distribusi sederhana melalui kombinasi teknik-teknik ini. Memahami teknik transformasi juga sangat berguna ketika menganalisis dampak coverage modifications seperti deductible dan policy limit — karena menerapkan deductible pada klaim pada dasarnya adalah transformasi distribusi.

Section 2 — Definisi Formal

Definisi Matematis — Empat Teknik Transformasi

Misalkan XX adalah variabel acak dengan CDF FX(x)F_X(x), PDF fX(x)f_X(x), dan support yang sesuai. Empat teknik berikut menghasilkan variabel acak baru YY:

1. Perkalian Konstanta (Multiplication by a Constant / Scale Transformation):

Y=cX,c>0Y = cX, \quad c > 0

2. Raising to a Power (Power Transformation):

Y=X1/τ,τ0Y = X^{1/\tau}, \quad \tau \neq 0

3. Exponentiation:

Y=eXY = e^X

4. Mixing (Scale Mixture):

FY(y)=0FYΛ(yλ)dFΛ(λ)F_Y(y) = \int_0^\infty F_{Y\mid\Lambda}(y \mid \lambda)\, dF_\Lambda(\lambda)
SimbolMaknaCatatan
ccKonstanta positif (faktor skala)Inflasi, konversi satuan
τ\tauParameter pangkat (power parameter)τ>0\tau > 0: distribusi Transformed; τ<0\tau < 0: Inverse
Y=X1/τY = X^{1/\tau}Variabel hasil power transformationUntuk τ=1\tau = 1: tidak berubah
Λ\LambdaVariabel acak mixing parameterSering ΛGamma\Lambda \sim \text{Gamma} atau Inverse Gaussian\text{Inverse Gaussian}
FYΛ(yλ)F_{Y\mid\Lambda}(y\mid\lambda)CDF bersyarat YY given Λ=λ\Lambda = \lambdaBiasanya distribusi sederhana (Eksponensial, Gamma)
u(λ)u(\lambda)Fungsi bobot mixingHarus merupakan PDF valid: u(λ)dλ=1\int u(\lambda)\,d\lambda = 1
μY\mu_YMean distribusi baruDihitung dari distribusi asal via transformasi
CV\text{CV}Coefficient of variationUkuran relatif dispersi: σ/μ\sigma / \mu

Rumus Utama

[Teknik 1] Scale Transformation — PDF dan Momen:

fY(y)=1cfX ⁣(yc),y>0f_Y(y) = \frac{1}{c}\, f_X\!\left(\frac{y}{c}\right), \quad y > 0

Label: Meregangkan/menyempitkan distribusi; jika c>1c > 1 distribusi “melebar” ke kanan.

E[Yk]=ckE[Xk]E[Y^k] = c^k\, E[X^k]

Label: Momen ke-kk distribusi baru adalah ckc^k kali momen ke-kk distribusi asal.

[Teknik 2a] Transformed Distribution (τ>0\tau > 0) — PDF:

Jika Y=X1/τY = X^{1/\tau} dan XX kontinu positif, maka dengan substitusi x=yτx = y^\tau:

fY(y)=τyτ1fX(yτ),y>0f_Y(y) = \tau\, y^{\tau - 1}\, f_X(y^\tau), \quad y > 0

Label: Teknik ini menghasilkan keluarga “Transformed” — misal Transformed Gamma, Transformed Beta.

[Teknik 2b] Inverse Distribution (τ<0\tau < 0, ekuivalen Y=1/XY = 1/X) — PDF:

Jika Y=X1=1/XY = X^{-1} = 1/X:

fY(y)=1y2fX ⁣(1y),y>0f_Y(y) = \frac{1}{y^2}\, f_X\!\left(\frac{1}{y}\right), \quad y > 0

Label: Menghasilkan keluarga “Inverse” — misal Inverse Gamma, Inverse Weibull, Inverse Pareto.

[Teknik 2c] Hubungan CDF untuk Power Transformation (τ>0\tau > 0):

FY(y)=FX(yτ)F_Y(y) = F_X(y^\tau)

Label: Cara cepat mendapatkan CDF distribusi hasil transformasi — tidak perlu integrasi ulang.

[Teknik 3] Exponentiation — PDF Lognormal dari Normal:

Jika XN(μ,σ2)X \sim N(\mu, \sigma^2) dan Y=eXY = e^X, maka YLognormal(μ,σ2)Y \sim \text{Lognormal}(\mu, \sigma^2):

fY(y)=1yσ2πexp ⁣((lnyμ)22σ2),y>0f_Y(y) = \frac{1}{y\sigma\sqrt{2\pi}} \exp\!\left(-\frac{(\ln y - \mu)^2}{2\sigma^2}\right), \quad y > 0

Label: Exponentiation mengubah distribusi simetris Normal menjadi distribusi right-skewed Lognormal.

E[Yk]=ekμ+k2σ2/2E[Y^k] = e^{k\mu + k^2\sigma^2/2}

Label: Momen ke-kk Lognormal dalam bentuk parameter Normal asal.

[Teknik 4] Mixing — Mean dan Variansi:

E[Y]=EΛ[E[YΛ]]E[Y] = E_\Lambda[E[Y \mid \Lambda]] Var(Y)=EΛ[Var(YΛ)]+VarΛ(E[YΛ])\text{Var}(Y) = E_\Lambda[\text{Var}(Y \mid \Lambda)] + \text{Var}_\Lambda(E[Y \mid \Lambda])

Label: Law of total expectation dan law of total variance — variansi campuran selalu lebih besar dari variansi rata-rata komponen.

[Teknik 4] Mixing — Contoh Penting: Gamma Mixture of Exponentials = Pareto:

Jika YΛEksponensial(1/Λ)Y \mid \Lambda \sim \text{Eksponensial}(1/\Lambda) dan ΛGamma(α,θ)\Lambda \sim \text{Gamma}(\alpha, \theta), maka:

YPareto(α,θ)Y \sim \text{Pareto}(\alpha, \theta)

Label: Ini adalah hasil mixing paling penting dalam aktuaria — menjelaskan mengapa Pareto memiliki ekor lebih berat dari Eksponensial.

Asumsi Eksplisit

  1. Untuk teknik 1–3: variabel acak asal XX harus kontinu dengan support positif (kecuali exponentiation yang mensyaratkan XX bersupport real).
  2. Untuk power transformation: τ0\tau \neq 0; untuk τ<0\tau < 0 interpretasikan sebagai invers lalu angkat pangkat.
  3. Untuk mixing: fungsi bobot u(λ)u(\lambda) atau FΛ(λ)F_\Lambda(\lambda) harus merupakan distribusi probabilitas yang valid.
  4. Transformasi bersifat satu-ke-satu (monotone) sehingga formula change-of-variable berlaku secara langsung.
  5. Momen distribusi baru terdefinisi finite jika momen distribusi asal yang bersesuaian finite.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus — Prinsip Change of Variable

Semua teknik 1–3 adalah aplikasi dari satu prinsip tunggal: change of variable untuk variabel acak kontinu. Jika Y=g(X)Y = g(X) dengan gg monotone increasing dan differentiable, maka:

fY(y)=fX(g1(y))ddyg1(y)f_Y(y) = f_X(g^{-1}(y)) \cdot \left|\frac{d}{dy} g^{-1}(y)\right|

Inilah “mesin” di balik semua rumus transformasi. Teknik 1 (Y=cXY = cX): g1(y)=y/cg^{-1}(y) = y/c, turunannya 1/c1/c. Teknik 2 (Y=X1/τY = X^{1/\tau}): g1(y)=yτg^{-1}(y) = y^\tau, turunannya τyτ1\tau y^{\tau-1}. Teknik 3 (Y=eXY = e^X): g1(y)=lnyg^{-1}(y) = \ln y, turunannya 1/y1/y.

Untuk mixing (teknik 4), prinsip yang bekerja berbeda: ini adalah marginalisasi — kita “rata-ratakan” distribusi bersyarat YΛY \mid \Lambda terhadap distribusi prior Λ\Lambda. Hasilnya adalah distribusi marginal YY yang secara otomatis lebih heavy-tailed daripada komponen-komponennya.

Support dan Domain
  • Teknik 1 & 2: Jika X>0X > 0, maka Y=cX>0Y = cX > 0 dan Y=X1/τ>0Y = X^{1/\tau} > 0. Support tetap positif.
  • Teknik 3: XX bisa bersupport (,)(-\infty, \infty) (seperti Normal), tetapi Y=eX>0Y = e^X > 0 selalu. Ini adalah cara membentuk distribusi positif dari distribusi tak terbatas.
  • Teknik 4 (mixing): Support YY adalah gabungan support dari semua YΛ=λY \mid \Lambda = \lambda. Jika tiap komponen bersupport positif, maka distribusi campuran juga bersupport positif.
  • Inverse transformation (Y=1/XY = 1/X): Jika XX bersupport (0,)(0, \infty), maka Y=1/XY = 1/X juga bersupport (0,)(0, \infty). Namun perilaku ekor terbalik: ekor kanan XX menjadi ekor kiri YY dan sebaliknya.

Derivasi: Distribusi Pareto dari Gamma Mixture of Exponentials

Ini adalah derivasi mixing paling penting di TA2.

Langkah 1 — Setup: YΛ=λEksponensial dengan mean 1/λY \mid \Lambda = \lambda \sim \text{Eksponensial dengan mean } 1/\lambda, sehingga:

fYΛ(yλ)=λeλy,y>0f_{Y\mid\Lambda}(y \mid \lambda) = \lambda e^{-\lambda y}, \quad y > 0

Langkah 2 — Prior: ΛGamma(α,θ)\Lambda \sim \text{Gamma}(\alpha, \theta) (parameterisasi KPW: mean =αθ= \alpha\theta):

fΛ(λ)=λα1eλ/θθαΓ(α),λ>0f_\Lambda(\lambda) = \frac{\lambda^{\alpha-1} e^{-\lambda/\theta}}{\theta^\alpha \Gamma(\alpha)}, \quad \lambda > 0

Langkah 3 — Marginal fY(y)f_Y(y) via integrasi:

fY(y)=0λeλyλα1eλ/θθαΓ(α)dλ=1θαΓ(α)0λαeλ(y+1/θ)dλf_Y(y) = \int_0^\infty \lambda e^{-\lambda y} \cdot \frac{\lambda^{\alpha-1} e^{-\lambda/\theta}}{\theta^\alpha \Gamma(\alpha)}\, d\lambda = \frac{1}{\theta^\alpha \Gamma(\alpha)} \int_0^\infty \lambda^\alpha e^{-\lambda(y + 1/\theta)}\, d\lambda

Langkah 4 — Kenali integran sebagai kernel Gamma: 0λαeλ(y+1/θ)dλ=Γ(α+1)(y+1/θ)α+1\int_0^\infty \lambda^\alpha e^{-\lambda(y+1/\theta)}\, d\lambda = \frac{\Gamma(\alpha+1)}{(y + 1/\theta)^{\alpha+1}}

Langkah 5 — Substitusi dan sederhanakan (dengan β=1/θ\beta = 1/\theta):

fY(y)=Γ(α+1)θαΓ(α)1(y+1/θ)α+1=αθα1(y+1/θ)α+1=α/θ(1+y/θ)α+1θf_Y(y) = \frac{\Gamma(\alpha+1)}{\theta^\alpha \Gamma(\alpha)} \cdot \frac{1}{(y + 1/\theta)^{\alpha+1}} = \frac{\alpha}{\theta^\alpha} \cdot \frac{1}{(y + 1/\theta)^{\alpha+1}} = \frac{\alpha / \theta}{(1 + y/\theta)^{\alpha+1} \cdot \theta}

Sederhanakan lebih lanjut:

fY(y)=αθα(θ+y)α+1,y>0f_Y(y) = \frac{\alpha \theta^\alpha}{(\theta + y)^{\alpha+1}}, \quad y > 0

Ini adalah PDF Pareto(α,θ)(\alpha, \theta) dari KPW. ∎

Kesimpulan penting: Pareto memiliki ekor jauh lebih berat dari Eksponensial karena ia adalah campuran dari banyak Eksponensial dengan rate yang bervariasi mengikuti Gamma. Polis berisiko tinggi (rate kecil = klaim besar) menarik ekor kanan menjadi power-law, bukan eksponensial decay.

Derivasi: PDF Transformed Gamma dari Power Transformation

Jika XGamma(α,θ)X \sim \text{Gamma}(\alpha, \theta) dan Y=X1/τY = X^{1/\tau} (dengan τ>0\tau > 0), maka YY disebut Transformed Gamma(α,θ,τ)(\alpha, \theta, \tau).

Langkah 1 — Hubungan CDF: FY(y)=P(Yy)=P(X1/τy)=P(Xyτ)=FX(yτ)F_Y(y) = P(Y \leq y) = P(X^{1/\tau} \leq y) = P(X \leq y^\tau) = F_X(y^\tau)

Langkah 2 — Turunkan untuk mendapat PDF:

fY(y)=ddyFX(yτ)=fX(yτ)τyτ1f_Y(y) = \frac{d}{dy} F_X(y^\tau) = f_X(y^\tau) \cdot \tau y^{\tau-1}

Langkah 3 — Substitusi fX(x)=xα1ex/θθαΓ(α)f_X(x) = \frac{x^{\alpha-1} e^{-x/\theta}}{\theta^\alpha \Gamma(\alpha)} dengan x=yτx = y^\tau:

fY(y)=(yτ)α1eyτ/θθαΓ(α)τyτ1=τyτα1eyτ/θθαΓ(α),y>0f_Y(y) = \frac{(y^\tau)^{\alpha-1} e^{-y^\tau/\theta}}{\theta^\alpha \Gamma(\alpha)} \cdot \tau y^{\tau-1} = \frac{\tau\, y^{\tau\alpha - 1} e^{-y^\tau/\theta}}{\theta^\alpha \Gamma(\alpha)}, \quad y > 0

Kasus khusus: τ=2\tau = 2Rayleigh-like; α=1\alpha = 1Weibull(τ,θ)(\tau, \theta).

Dilarang
  1. Jangan turunkan PDF langsung tanpa Jacobian saat melakukan change of variable — selalu kalikan dengan dy/dx|dy/dx| atau dx/dy|dx/dy|. Melupakan faktor Jacobian adalah kesalahan paling umum dalam soal transformasi.
  2. Jangan gunakan rumus PDF teknik 2 untuk τ<0\tau < 0 secara langsung — untuk inverse (Y=1/XY = 1/X), gunakan formula khusus fY(y)=y2fX(1/y)f_Y(y) = y^{-2} f_X(1/y) yang merupakan kasus τ=1\tau = -1.
  3. Jangan asumsikan mixing selalu menghasilkan distribusi yang sama keluarga dengan komponen-komponennya — Gamma mixing of Exponentials menghasilkan Pareto, bukan Eksponensial atau Gamma. Identifikasi distribusi hasil mixing selalu dari bentuk PDF marginal.

Section 4 — Contoh Soal

Soal A — Fundamental

Variabel acak XGamma(α=3,θ=1000)X \sim \text{Gamma}(\alpha = 3, \theta = 1000). Misalkan Y=2XY = 2X (inflasi 100% diterapkan pada distribusi klaim). Tentukan E[Y]E[Y], Var(Y)\text{Var}(Y), dan tuliskan PDF fY(y)f_Y(y).

Solusi Soal A

Pendekatan: Terapkan Teknik 1 (scale transformation) secara langsung — c=2c = 2.

1. Identifikasi Variabel

  • XGamma(α=3,θ=1000)X \sim \text{Gamma}(\alpha = 3, \theta = 1000): E[X]=αθ=3000E[X] = \alpha\theta = 3000, Var(X)=αθ2=3,000,000\text{Var}(X) = \alpha\theta^2 = 3{,}000{,}000
  • Y=cXY = cX dengan c=2c = 2

2. Identifikasi Distribusi / Model Scale transformation pada distribusi Gamma menghasilkan Gamma dengan parameter skala yang berubah. Y=2XGamma(α=3,θ=2000)Y = 2X \sim \text{Gamma}(\alpha = 3, \theta' = 2000) — parameter bentuk α\alpha tidak berubah, hanya parameter skala θ\theta yang dikalikan cc.

3. Setup Persamaan

fY(y)=1cfX ⁣(yc)=12fX ⁣(y2)f_Y(y) = \frac{1}{c}\, f_X\!\left(\frac{y}{c}\right) = \frac{1}{2}\, f_X\!\left(\frac{y}{2}\right) E[Yk]=ckE[Xk]E[Y^k] = c^k\, E[X^k]

4. Eksekusi Aljabar

PDF Gamma asal: fX(x)=xα1ex/θθαΓ(α)=x2ex/1000109Γ(3)f_X(x) = \frac{x^{\alpha-1} e^{-x/\theta}}{\theta^\alpha \Gamma(\alpha)} = \frac{x^2 e^{-x/1000}}{10^9 \cdot \Gamma(3)}

PDF hasil transformasi:

fY(y)=12(y/2)2ey/2000100032=y2ey/20004109222=y2ey/200020003Γ(3)f_Y(y) = \frac{1}{2} \cdot \frac{(y/2)^2 e^{-y/2000}}{1000^3 \cdot 2} = \frac{y^2 e^{-y/2000}}{4 \cdot 10^9 \cdot 2 \cdot 2 \cdot 2} = \frac{y^2 e^{-y/2000}}{2000^3 \cdot \Gamma(3)}

Ini adalah PDF Gamma(3,2000)(3, 2000)

Momen:

E[Y]=2E[X]=2×3000=6000E[Y] = 2 \cdot E[X] = 2 \times 3000 = 6000 Var(Y)=4Var(X)=4×3,000,000=12,000,000\text{Var}(Y) = 4 \cdot \text{Var}(X) = 4 \times 3{,}000{,}000 = 12{,}000{,}000

5. Verification Distribusi Gamma(3,2000)(3, 2000): E[Y]=3×2000=6000E[Y] = 3 \times 2000 = 6000 ✓ dan Var(Y)=3×20002=12,000,000\text{Var}(Y) = 3 \times 2000^2 = 12{,}000{,}000 ✓. Variansi naik 4 kali (bukan 2 kali) karena Var(cX)=c2Var(X)\text{Var}(cX) = c^2 \text{Var}(X).

Hasil: YGamma(3,2000)Y \sim \text{Gamma}(3, 2000), E[Y]=6000E[Y] = 6000, Var(Y)=12,000,000\text{Var}(Y) = 12{,}000{,}000.

Exam Tips — Soal A

Target waktu: 2–3 menit. Common trap: Variansi naik sebanding c2c^2, bukan cc. Banyak kandidat menulis Var(Y)=2×3,000,000=6,000,000\text{Var}(Y) = 2 \times 3{,}000{,}000 = 6{,}000{,}000 — ini salah. Shortcut: Untuk distribusi Gamma, Y=cXY = cX hanya mengubah θcθ\theta \to c\theta; α\alpha tidak berubah. Langsung tulis YGamma(α,cθ)Y \sim \text{Gamma}(\alpha, c\theta) tanpa harus menurunkan PDF dari awal.


Soal B — Exam-Typical

Variabel acak XWeibull(τ=2,θ=500)X \sim \text{Weibull}(\tau = 2, \theta = 500) dengan PDF fX(x)=τθτxτ1e(x/θ)τf_X(x) = \frac{\tau}{\theta^\tau} x^{\tau-1} e^{-(x/\theta)^\tau}. Tentukan PDF dan CDF dari Y=X2Y = X^2.

Solusi Soal B

Pendekatan: Terapkan power transformation. Hubungan: Y=X2=X1/(1/2)Y = X^2 = X^{1/(1/2)}, sehingga ini adalah Teknik 2 dengan τbaru=1/2\tau_{\text{baru}} = 1/2 (atau interpretasikan langsung sebagai Y=X2Y = X^2 dengan change of variable).

1. Identifikasi Variabel

  • XWeibull(τ=2,θ=500)X \sim \text{Weibull}(\tau = 2, \theta = 500): fX(x)=25002xe(x/500)2f_X(x) = \frac{2}{500^2} x\, e^{-(x/500)^2}, support x>0x > 0
  • Transformasi: Y=X2Y = X^2, sehingga X=Y1/2=YX = Y^{1/2} = \sqrt{Y}, support y>0y > 0

2. Identifikasi Distribusi / Model Power transformation Y=X2Y = X^2 adalah monotone increasing untuk x>0x > 0. Gunakan metode CDF karena lebih langsung daripada Jacobian untuk soal ini.

3. Setup Persamaan

Metode CDF:

FY(y)=P(Yy)=P(X2y)=P(Xy)=FX(y)F_Y(y) = P(Y \leq y) = P(X^2 \leq y) = P(X \leq \sqrt{y}) = F_X(\sqrt{y}) fY(y)=ddyFX(y)=fX(y)12yf_Y(y) = \frac{d}{dy} F_X(\sqrt{y}) = f_X(\sqrt{y}) \cdot \frac{1}{2\sqrt{y}}

4. Eksekusi Aljabar

CDF Weibull: FX(x)=1e(x/θ)τ=1e(x/500)2F_X(x) = 1 - e^{-(x/\theta)^\tau} = 1 - e^{-(x/500)^2}

FY(y)=FX(y)=1e(y/500)2=1ey/5002=1ey/250,000F_Y(y) = F_X(\sqrt{y}) = 1 - e^{-(\sqrt{y}/500)^2} = 1 - e^{-y/500^2} = 1 - e^{-y/250{,}000}

PDF:

fY(y)=fX(y)12y=25002ye(y/500)212yf_Y(y) = f_X(\sqrt{y}) \cdot \frac{1}{2\sqrt{y}} = \frac{2}{500^2} \cdot \sqrt{y} \cdot e^{-(\sqrt{y}/500)^2} \cdot \frac{1}{2\sqrt{y}} =2500212ey/250,000=1250,000ey/250,000= \frac{2}{500^2} \cdot \frac{1}{2} \cdot e^{-y/250{,}000} = \frac{1}{250{,}000}\, e^{-y/250{,}000}

Ini adalah PDF Eksponensial dengan mean θ=250,000\theta' = 250{,}000.

5. Verification FY()=1e=1F_Y(\infty) = 1 - e^{-\infty} = 1 ✓. fY(y)>0f_Y(y) > 0 untuk y>0y > 0 ✓. Fakta menarik: X2EksponensialX^2 \sim \text{Eksponensial} ketika XWeibull(τ=2)X \sim \text{Weibull}(\tau=2) — ini konsisten dengan fakta bahwa Weibull(2)(2) adalah distribusi Rayleigh, dan kuadratnya adalah Eksponensial.

Hasil: FY(y)=1ey/250,000F_Y(y) = 1 - e^{-y/250{,}000}, fY(y)=1250,000ey/250,000f_Y(y) = \frac{1}{250{,}000} e^{-y/250{,}000}, yaitu YEksponensial(250,000)Y \sim \text{Eksponensial}(250{,}000).

Exam Tips — Soal B

Target waktu: 3–4 menit. Common trap: Jangan lupa faktor 12y\frac{1}{2\sqrt{y}} (Jacobian) saat menurunkan PDF dari CDF. Shortcut: Metode CDF FY(y)=FX(y)F_Y(y) = F_X(\sqrt{y}) jauh lebih cepat daripada Jacobian langsung untuk power transformations. Hafalkan: FY(y)=FX(yτ)F_Y(y) = F_X(y^\tau) untuk Y=X1/τY = X^{1/\tau}.


Soal C — Challenging

Jumlah klaim NN suatu polis asuransi jiwa kelompok mengikuti distribusi Poisson bersyarat: NΛPoisson(Λ)N \mid \Lambda \sim \text{Poisson}(\Lambda), di mana mixing parameter ΛGamma(α=3,θ=0.5)\Lambda \sim \text{Gamma}(\alpha = 3, \theta = 0.5). Tentukan distribusi marginal NN, hitung P(N=0)P(N = 0) dan P(N=1)P(N = 1), serta hitung E[N]E[N] dan Var(N)\text{Var}(N).

Solusi Soal C

Pendekatan: Gunakan Teknik 4 (mixing). Poisson-Gamma mixture menghasilkan distribusi Binomial Negatif — kenali pola ini tanpa harus mengintegrasi manual untuk setiap soal.

1. Identifikasi Variabel

  • NΛPoisson(Λ)N \mid \Lambda \sim \text{Poisson}(\Lambda): P(N=kΛ)=eΛΛkk!P(N = k \mid \Lambda) = \frac{e^{-\Lambda} \Lambda^k}{k!}
  • ΛGamma(α=3,θ=0.5)\Lambda \sim \text{Gamma}(\alpha = 3, \theta = 0.5): E[Λ]=αθ=1.5E[\Lambda] = \alpha\theta = 1.5, Var(Λ)=αθ2=0.75\text{Var}(\Lambda) = \alpha\theta^2 = 0.75

2. Identifikasi Distribusi / Model Poisson–Gamma mixture selalu menghasilkan distribusi Binomial Negatif. Parameter:

  • r=α=3r = \alpha = 3 (parameter bentuk)
  • p=11+θ=11+0.5=23p = \frac{1}{1 + \theta} = \frac{1}{1 + 0.5} = \frac{2}{3} (dalam parameterisasi KPW)
  • atau ekuivalen: β=θ=0.5\beta = \theta = 0.5 sehingga NNegBin(r=3,β=0.5)N \sim \text{NegBin}(r = 3, \beta = 0.5)

3. Setup Persamaan

Distribusi marginal via integrasi (untuk verifikasi):

P(N=k)=0eλλkk!λα1eλ/θθαΓ(α)dλP(N = k) = \int_0^\infty \frac{e^{-\lambda} \lambda^k}{k!} \cdot \frac{\lambda^{\alpha-1} e^{-\lambda/\theta}}{\theta^\alpha \Gamma(\alpha)}\, d\lambda =1k!θαΓ(α)0λk+α1eλ(1+1/θ)dλ= \frac{1}{k!\, \theta^\alpha \Gamma(\alpha)} \int_0^\infty \lambda^{k+\alpha-1} e^{-\lambda(1+1/\theta)}\, d\lambda

4. Eksekusi Aljabar

Integral adalah kernel Gamma dengan parameter k+αk+\alpha dan rate 1+1/θ=(1+θ)/θ1 + 1/\theta = (1+\theta)/\theta:

0λk+α1eλ(1+1/θ)dλ=Γ(k+α)(1+θθ)k+α\int_0^\infty \lambda^{k+\alpha-1} e^{-\lambda(1+1/\theta)}\, d\lambda = \frac{\Gamma(k+\alpha)}{\left(\frac{1+\theta}{\theta}\right)^{k+\alpha}}

Substitusi kembali:

P(N=k)=Γ(k+α)k!Γ(α)θk(1+θ)k+α=(k+α1k)(11+θ)α(θ1+θ)kP(N = k) = \frac{\Gamma(k+\alpha)}{k!\, \Gamma(\alpha)} \cdot \frac{\theta^k}{(1+\theta)^{k+\alpha}} = \binom{k+\alpha-1}{k} \left(\frac{1}{1+\theta}\right)^\alpha \left(\frac{\theta}{1+\theta}\right)^k

Ini adalah PMF Binomial Negatif(r=α,β=θ)(r=\alpha, \beta=\theta) dari KPW.

Dengan α=3\alpha = 3, θ=0.5\theta = 0.5, 1+θ=1.51+\theta = 1.5:

P(N=0)=(11.5)3=(23)3=8270.2963P(N = 0) = \left(\frac{1}{1.5}\right)^3 = \left(\frac{2}{3}\right)^3 = \frac{8}{27} \approx 0.2963 P(N=1)=(31)(23)30.51.5=3×827×13=2481=8270.2963P(N = 1) = \binom{3}{1} \cdot \left(\frac{2}{3}\right)^3 \cdot \frac{0.5}{1.5} = 3 \times \frac{8}{27} \times \frac{1}{3} = \frac{24}{81} = \frac{8}{27} \approx 0.2963

Momen via law of total expectation:

E[N]=EΛ[E[NΛ]]=E[Λ]=αθ=1.5E[N] = E_\Lambda[E[N \mid \Lambda]] = E[\Lambda] = \alpha\theta = 1.5 Var(N)=E[Var(NΛ)]+Var(E[NΛ])\text{Var}(N) = E[\text{Var}(N \mid \Lambda)] + \text{Var}(E[N \mid \Lambda]) =E[Λ]+Var(Λ)=1.5+0.75=2.25= E[\Lambda] + \text{Var}(\Lambda) = 1.5 + 0.75 = 2.25

Cross-check via NegBin: E[N]=rβ=3×0.5=1.5E[N] = r\beta = 3 \times 0.5 = 1.5 ✓ dan Var(N)=rβ(1+β)=3×0.5×1.5=2.25\text{Var}(N) = r\beta(1+\beta) = 3 \times 0.5 \times 1.5 = 2.25 ✓.

5. Verification P(N=0)+P(N=1)=0.2963+0.2963=0.5926P(N=0) + P(N=1) = 0.2963 + 0.2963 = 0.5926 — masuk akal untuk distribusi dengan mean 1.5. Var(N)=2.25>E[N]=1.5\text{Var}(N) = 2.25 > E[N] = 1.5: konsisten dengan overdispersion khas distribusi campuran (mixing selalu menambah variansi dibanding Poisson murni dengan mean sama).

Hasil: NNegBin(r=3,β=0.5)N \sim \text{NegBin}(r=3, \beta=0.5); P(N=0)=8/270.296P(N=0) = 8/27 \approx 0.296; P(N=1)=8/270.296P(N=1) = 8/27 \approx 0.296; E[N]=1.5E[N] = 1.5; Var(N)=2.25\text{Var}(N) = 2.25.

Exam Tips — Soal C

Target waktu: 5–6 menit. Common trap: Banyak kandidat menghitung Var(N)\text{Var}(N) hanya sebagai E[Λ]=1.5E[\Lambda] = 1.5 (seperti Poisson biasa) — salah! Mixing selalu menambah variansi via VarΛ(E[NΛ])=Var(Λ)\text{Var}_\Lambda(E[N\mid\Lambda]) = \text{Var}(\Lambda). Shortcut: Hafalkan tiga pasangan mixing penting: (1) Poisson-Gamma → NegBin; (2) Poisson-InvGaussian → Poisson-InvGaussian; (3) Eksponensial-Gamma → Pareto. Kenali pola dari parameter yang diberikan dan langsung tulis distribusi hasilnya.

Section 5 — Verifikasi & Sanity Check

Cross-check Scale Transformation via Momen

Untuk Y=cXY = cX, selalu verifikasi menggunakan dua properti:

CV(Y)CV(X)=1(coefficient of variation tidak berubah)\frac{\text{CV}(Y)}{\text{CV}(X)} = 1 \qquad \text{(coefficient of variation tidak berubah)}

Ini karena CV(Y)=SD(Y)E[Y]=cSD(X)cE[X]=CV(X)\text{CV}(Y) = \frac{\text{SD}(Y)}{E[Y]} = \frac{c \cdot \text{SD}(X)}{c \cdot E[X]} = \text{CV}(X).

Jika hasil CV berubah setelah scale transformation, ada kesalahan dalam perhitungan momen.

Cross-check Mixing via Overdispersion

Untuk distribusi campuran, variansi selalu lebih besar daripada distribusi komponen dengan mean yang sama. Secara spesifik, karena VarΛ(E[YΛ])0\text{Var}_\Lambda(E[Y\mid\Lambda]) \geq 0:

Var(Y)=E[Var(YΛ)]+Var(E[YΛ])E[Var(YΛ)]\text{Var}(Y) = E[\text{Var}(Y\mid\Lambda)] + \text{Var}(E[Y\mid\Lambda]) \geq E[\text{Var}(Y\mid\Lambda)]

Artinya: distribusi marginal YY selalu lebih dispersed daripada rata-rata komponen. Ini adalah sanity check wajib: jika Var(N)E[N]\text{Var}(N) \leq E[N] untuk Poisson mixture, ada yang salah.

Metode Alternatif

Untuk power transformation, ada dua pendekatan ekuivalen: (1) metode CDFFY(y)=FX(yτ)F_Y(y) = F_X(y^\tau), kemudian turunkan untuk PDF; (2) metode Jacobian langsung — hitung dx/dy|dx/dy| lalu kalikan fXf_X dengan Jacobian. Metode CDF biasanya lebih cepat dan lebih sedikit peluang salah di soal ujian. Untuk distribusi Lognormal, perhatikan bahwa momen ke-kk dapat dihitung langsung menggunakan E[Yk]=ekμ+k2σ2/2E[Y^k] = e^{k\mu + k^2\sigma^2/2} tanpa perlu menghitung MGF secara eksplisit.

Section 6 — Visualisasi Mental

Diagram empat teknik transformasi:

DISTRIBUSI ASAL X

       ├──── Teknik 1: Y = cX ──────────────────── Distribusi sama, skala bergeser
       │                                             (Gamma → Gamma, θ → cθ)

       ├──── Teknik 2: Y = X^(1/τ) ──────────────── "Transformed" family
       │          τ > 0                               (Gamma → Transformed Gamma → Weibull)
       │          τ < 0 (Y = 1/X)                     (Gamma → Inverse Gamma)

       ├──── Teknik 3: Y = e^X ─────────────────── Distribusi baru, right-skewed
       │          (hanya untuk X ~ Normal/dsb)        (Normal → Lognormal)

       └──── Teknik 4: Mixing ──────────────────── Distribusi heavy-tail baru
                  X | Λ ~ F_X(·|λ)                   (Poisson+Gamma → NegBin)
                  Λ ~ F_Λ(·)                          (Eksponensial+Gamma → Pareto)

Pengaruh terhadap bentuk kurva:

  • Teknik 1 (scale): Kurva melebar (jika c>1c>1) atau menyempit (jika c<1c<1) secara horizontal; bentuk tidak berubah. Mode, median, mean semua dikalikan cc.
  • Teknik 2 (power, τ>1\tau > 1): Ekor kanan semakin berat; distribusi menjadi lebih right-skewed.
  • Teknik 2 (power, 0<τ<10 < \tau < 1): Ekor kanan menipis; distribusi menjadi lebih terkonsentrasi.
  • Teknik 3 (exponentiation): Distribusi simetris menjadi right-skewed dengan ekor yang panjang.
  • Teknik 4 (mixing): Selalu menambah dispersi — ekor menjadi lebih berat daripada komponen individual.

Hubungan Visual ↔ Rumus

Elemen VisualKomponen Rumus
Kurva melebar horizontal (Teknik 1)fY(y)=1cfX(y/c)f_Y(y) = \frac{1}{c} f_X(y/c), skala θcθ\theta \to c\theta
Ekor kanan memanjang (Teknik 2, τ>1\tau > 1)FY(y)=FX(yτ)F_Y(y) = F_X(y^\tau), nilai besar yy dikompres lebih lambat
Simetri hilang (Teknik 3)fY(y)=1yσ2πe(lnyμ)2/2σ2f_Y(y) = \frac{1}{y\sigma\sqrt{2\pi}} e^{-(\ln y - \mu)^2/2\sigma^2}
Kurva lebih “datar” dan berekor panjang (mixing)Var(Y)=E[Var(YΛ)]+Var(E[YΛ])\text{Var}(Y) = E[\text{Var}(Y\mid\Lambda)] + \text{Var}(E[Y\mid\Lambda])

Section 7 — Jebakan Umum

Kesalahan Parametrisasi
  • Power vs Transformed: Notasi berbeda di sumber berbeda. KPW mendefinisikan “Transformed Gamma(α,θ,τ)(\alpha, \theta, \tau)” sebagai Y=X1/τY = X^{1/\tau} dengan XGamma(α,θ)X \sim \text{Gamma}(\alpha, \theta). Beberapa sumber mendefinisikan sebaliknya (τ\tau vs 1/τ1/\tau). Selalu cek: apakah parameter τ\tau di soal adalah eksponen atau invers eksponen?
  • Parameterisasi mixing: ΛGamma(α,θ)\Lambda \sim \text{Gamma}(\alpha, \theta) dalam KPW berarti mean =αθ= \alpha\theta. Beberapa sumber menggunakan ΛGamma(α,β)\Lambda \sim \text{Gamma}(\alpha, \beta) dengan β\beta sebagai rate (bukan skala), sehingga mean =α/β= \alpha/\beta. Ini mengubah hasil Pareto secara dramatis — verifikasi konvensi sebelum menghitung.
Kesalahan Konseptual
  1. Lupa Jacobian: Rumus fY(y)=fX(g1(y))f_Y(y) = f_X(g^{-1}(y)) tidak lengkap tanpa faktor dg1(y)/dy|dg^{-1}(y)/dy|. Ini adalah kesalahan teknis paling umum dalam soal transformasi.
  2. Scale Transformation ≠ Power Transformation: Y=2XY = 2X (scale, c=2c=2) sangat berbeda dari Y=X2Y = X^2 (power, τ=1/2\tau=1/2). Keduanya memodifikasi distribusi dengan cara yang berbeda.
  3. Mixing bukan convolution: Distribusi campuran (mixture) berbeda dari distribusi penjumlahan (compound/convolution). Y=X1+X2Y = X_1 + X_2 (compound) berbeda dari YY yang diambil dari X1X_1 dengan probabilitas pp atau dari X2X_2 dengan probabilitas 1p1-p (mixture).
  4. Variance of mixture: Banyak kandidat menghitung Var(Y)=E[Var(YΛ)]\text{Var}(Y) = E[\text{Var}(Y\mid\Lambda)] saja — ini hanya komponen pertama. Komponen kedua Var(E[YΛ])\text{Var}(E[Y\mid\Lambda]) wajib ditambahkan.
Kesalahan Interpretasi Soal
  • “Distribusi YY dengan Y=lnXY = \ln X — ini bukan exponentiation, ini transformasi log. Y=lnXY = \ln X jika XLognormalX \sim \text{Lognormal} menghasilkan Normal. Beda arah dengan Y=eXY = e^X yang mengubah Normal → Lognormal.
  • “Mixture of two distributions” — bisa berarti (a) scale mixture dengan mixing parameter acak (Teknik 4), atau (b) finite mixture: FY=pF1+(1p)F2F_Y = pF_1 + (1-p)F_2 dengan pp tetap. Baca soal dengan teliti untuk membedakan keduanya.
  • “Inverse distribution” — dalam KPW, “Inverse Gamma” berarti distribusi dari Y=1/XY = 1/X dengan XGammaX \sim \text{Gamma}. Jangan bingung dengan “reciprocal” dalam arti umum.
Red Flags
  • Soal menyebut “Pareto” tanpa menjelaskan asal-usulnya → kemungkinan besar ada Gamma mixing of Exponentials di baliknya; verifikasi via parameter α\alpha dan θ\theta
  • Soal menyebut “Weibull” → ini adalah power transformation dari Eksponensial: X=YτX = Y^\tau dengan XEksponensialX \sim \text{Eksponensial}; manfaatkan FWeibull(y)=1e(y/θ)τF_{\text{Weibull}}(y) = 1 - e^{-(y/\theta)^\tau} secara langsung
  • Soal menyebut “Transformed Gamma” atau “Inverse Gamma” → segera identifikasi teknik yang digunakan (power transformation atau inverse) sebelum menulis PDF
  • Soal memberikan distribusi bersyarat XΛX \mid \Lambda dan distribusi Λ\Lambda → Teknik 4, gunakan law of total expectation/variance untuk momen dan integrasikan untuk PMF/PDF marginal

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Scale TransformationY=cXY = cX: PDF, CDF, dan momen berubah hanya dalam faktor cc:
E[Yk]=ckE[Xk],CV tidak berubahE[Y^k] = c^k E[X^k], \quad \text{CV tidak berubah}
  1. Power TransformationY=X1/τY = X^{1/\tau}, metode CDF paling efisien:
FY(y)=FX(yτ),fY(y)=τyτ1fX(yτ)F_Y(y) = F_X(y^\tau), \quad f_Y(y) = \tau\, y^{\tau-1} f_X(y^\tau)
  1. ExponentiationY=eXY = e^X, XN(μ,σ2)X \sim N(\mu, \sigma^2) menghasilkan Lognormal:
E[Yk]=ekμ+k2σ2/2E[Y^k] = e^{k\mu + k^2\sigma^2/2}
  1. Mixing — Momen via Law of Total Variance:
Var(Y)=E[Var(YΛ)]+Var(E[YΛ])\text{Var}(Y) = E[\text{Var}(Y\mid\Lambda)] + \text{Var}(E[Y\mid\Lambda])
  1. Tiga pasangan mixing kanonik yang wajib dihafalkan:
Poisson(Λ)+ΛGamma(α,θ)    NNegBin(r=α,β=θ)\text{Poisson}(\Lambda) + \Lambda \sim \text{Gamma}(\alpha,\theta) \;\Rightarrow\; N \sim \text{NegBin}(r=\alpha,\, \beta=\theta) Eksponensial(1/Λ)+ΛGamma(α,θ)    YPareto(α,θ)\text{Eksponensial}(1/\Lambda) + \Lambda \sim \text{Gamma}(\alpha,\theta) \;\Rightarrow\; Y \sim \text{Pareto}(\alpha,\theta)

Kapan Digunakan

  • Soal menyebutkan “inflasi” atau “perubahan satuan” pada distribusi klaim → Teknik 1 (scale)
  • Soal menyebutkan “Weibull”, “Transformed Gamma”, “Inverse Gamma/Pareto” → Teknik 2 (power)
  • Soal menyebutkan “Lognormal berasal dari Normal” atau “log transformation” → Teknik 3 (exponentiation)
  • Soal memberikan distribusi bersyarat dan mixing distribution → Teknik 4 (mixing); gunakan law of total expectation/variance untuk momen
  • Soal meminta PDF/CDF distribusi baru dari distribusi yang sudah dikenal

Kapan TIDAK Boleh Digunakan

  • Teknik 1–3 tidak berlaku untuk transformasi non-monotone (misalnya Y=X2Y = X^2 jika support XX mencakup nilai negatif) — perlu perlakuan khusus untuk fungsi non-monotone
  • Teknik 4 tidak menghasilkan distribusi yang sama dengan penjumlahan (convolution) — jangan gunakan rumus mixing untuk menghitung distribusi total klaim (gunakan model agregat, bukan mixing)
  • Formula momen E[Yk]=ckE[Xk]E[Y^k] = c^k E[X^k] hanya berlaku untuk scale transformation Y=cXY = cX, bukan untuk power transformation umum

Quick Decision Tree

graph TD
    A["Distribusi baru dari distribusi asal?"] -->|"Y = cX, c konstan"| B["Teknik 1: Scale Transformation<br>E[Y^k] = c^k E[X^k]<br>F_Y(y) = F_X(y/c)"]
    A -->|"Y = X^(1/tau), tau konstan"| C["Teknik 2: Power Transformation<br>F_Y(y) = F_X(y^tau)<br>f_Y(y) = tau * y^(tau-1) * f_X(y^tau)"]
    A -->|"Y = e^X"| D["Teknik 3: Exponentiation<br>Normal -> Lognormal<br>E[Y^k] = exp(k*mu + k^2*sigma^2/2)"]
    A -->|"Y | Lambda ~ F, Lambda ~ G"| E["Teknik 4: Mixing<br>Var(Y) = E[Var(Y|L)] + Var(E[Y|L])"]
    E -->|"Poisson + Gamma"| F["Hasil: NegBin(r=alpha, beta=theta)"]
    E -->|"Eksponensial + Gamma"| G["Hasil: Pareto(alpha, theta)"]
    C -->|"tau < 0 atau Y = 1/X"| H["Inverse Distribution<br>f_Y(y) = y^(-2) * f_X(1/y)"]

Follow-up Options
  1. “Berikan contoh soal variasi Lognormal moments dari teknik exponentiation”
  2. “Jelaskan hubungan 1.3 Techniques for Creating New Distributions dengan 3.1 Coverage Modifications on Severity and Frequency
  3. “Buat flashcard 1-halaman untuk empat teknik transformasi dan pasangan mixing kanonik”

📖 Ref: Klugman, Panjer & Willmot (2019) Loss Models 5th ed., Bab 4 | 🗓️ 2026-04-16 | #TA2 #Transformasi #Mixing #ModelBesarKlaim