Techniques for Creating New Distributions
📊 1.3 — Techniques for Creating New Distributions
Ringkasan Cepat›
Topik: Techniques for Creating New Distributions | Bobot: ~5–10% | Difficulty: Hard Ref: Klugman et al. (2019) Loss Models 5th ed., Bab 4 | Prereq: 1.1 Moment and Probability Generating Functions, 1.2 Distribution Classes and Extreme Value
Section 0 — Pemetaan Topik
| Topik TA2 | Sub-topik ID | Skill Diuji | Bobot | Difficulty | Prerequisite | Connected Topics | Referensi |
|---|---|---|---|---|---|---|---|
| Model Besar Klaim | 1.3 | Membentuk distribusi baru via perkalian konstanta, raising to a power, exponentiation, dan mixing; menentukan PDF/CDF/momen distribusi hasil transformasi | 5–10% | Hard | 1.1 Moment and Probability Generating Functions, 1.2 Distribution Classes and Extreme Value | 1.4 Tail Characteristics, 3.1 Coverage Modifications on Severity and Frequency, 6.1 Parameter Estimation Methods | KPW (2019) Bab 4 |
Section 1 — Intuisi
Bayangkan seorang aktuaris di perusahaan asuransi kendaraan bermotor di Jakarta. Data historis menunjukkan bahwa klaim kerusakan kendaraan mengikuti distribusi Eksponensial — sederhana, namun terlalu ringan untuk menangkap klaim besar yang sesekali muncul. Lalu muncul pertanyaan: apakah ada cara untuk “memodifikasi” distribusi ini agar lebih sesuai dengan pola klaim dunia nyata, tanpa harus memulai dari nol?
Jawabannya adalah: ya, dan inilah inti dari topik ini. Para aktuaris telah mengembangkan empat teknik sistematis untuk “membangun” distribusi baru dari distribusi yang sudah dikenal. Teknik pertama adalah perkalian konstanta — bayangkan mengubah satuan dari rupiah ke juta rupiah, atau menyesuaikan inflasi; secara matematis ini meregangkan atau menyempitkan distribusi tanpa mengubah bentuknya. Teknik kedua adalah raising to a power (pemangkatan) — mengubah variabel acak menjadi pangkat tertentu, yang menghasilkan distribusi baru dengan ekor yang bisa lebih berat atau lebih ringan. Teknik ketiga adalah exponentiation — mengambil nilai dipangkatkan variabel acak, yang sangat berguna untuk mengubah distribusi Normal menjadi Lognormal. Teknik keempat, yang paling powerful, adalah mixing — mencampurkan beberapa distribusi berdasarkan suatu bobot acak, seperti satu portofolio yang terdiri dari polis risiko rendah dan risiko tinggi yang bercampur.
Keempat teknik ini adalah pondasi dari “toolbox” pemodelan distribusi klaim. Hampir semua distribusi yang digunakan dalam aktuaria (Weibull, Lognormal, Burr, Inverse Gaussian, dll.) dapat diturunkan dari distribusi sederhana melalui kombinasi teknik-teknik ini. Memahami teknik transformasi juga sangat berguna ketika menganalisis dampak coverage modifications seperti deductible dan policy limit — karena menerapkan deductible pada klaim pada dasarnya adalah transformasi distribusi.
Section 2 — Definisi Formal
Definisi Matematis — Empat Teknik Transformasi›
Misalkan adalah variabel acak dengan CDF , PDF , dan support yang sesuai. Empat teknik berikut menghasilkan variabel acak baru :
1. Perkalian Konstanta (Multiplication by a Constant / Scale Transformation):
2. Raising to a Power (Power Transformation):
3. Exponentiation:
4. Mixing (Scale Mixture):
| Simbol | Makna | Catatan |
|---|---|---|
| Konstanta positif (faktor skala) | Inflasi, konversi satuan | |
| Parameter pangkat (power parameter) | : distribusi Transformed; : Inverse | |
| Variabel hasil power transformation | Untuk : tidak berubah | |
| Variabel acak mixing parameter | Sering atau | |
| CDF bersyarat given | Biasanya distribusi sederhana (Eksponensial, Gamma) | |
| Fungsi bobot mixing | Harus merupakan PDF valid: | |
| Mean distribusi baru | Dihitung dari distribusi asal via transformasi | |
| Coefficient of variation | Ukuran relatif dispersi: |
Rumus Utama
[Teknik 1] Scale Transformation — PDF dan Momen:
Label: Meregangkan/menyempitkan distribusi; jika distribusi “melebar” ke kanan.
Label: Momen ke- distribusi baru adalah kali momen ke- distribusi asal.
[Teknik 2a] Transformed Distribution () — PDF:
Jika dan kontinu positif, maka dengan substitusi :
Label: Teknik ini menghasilkan keluarga “Transformed” — misal Transformed Gamma, Transformed Beta.
[Teknik 2b] Inverse Distribution (, ekuivalen ) — PDF:
Jika :
Label: Menghasilkan keluarga “Inverse” — misal Inverse Gamma, Inverse Weibull, Inverse Pareto.
[Teknik 2c] Hubungan CDF untuk Power Transformation ():
Label: Cara cepat mendapatkan CDF distribusi hasil transformasi — tidak perlu integrasi ulang.
[Teknik 3] Exponentiation — PDF Lognormal dari Normal:
Jika dan , maka :
Label: Exponentiation mengubah distribusi simetris Normal menjadi distribusi right-skewed Lognormal.
Label: Momen ke- Lognormal dalam bentuk parameter Normal asal.
[Teknik 4] Mixing — Mean dan Variansi:
Label: Law of total expectation dan law of total variance — variansi campuran selalu lebih besar dari variansi rata-rata komponen.
[Teknik 4] Mixing — Contoh Penting: Gamma Mixture of Exponentials = Pareto:
Jika dan , maka:
Label: Ini adalah hasil mixing paling penting dalam aktuaria — menjelaskan mengapa Pareto memiliki ekor lebih berat dari Eksponensial.
Asumsi Eksplisit
- Untuk teknik 1–3: variabel acak asal harus kontinu dengan support positif (kecuali exponentiation yang mensyaratkan bersupport real).
- Untuk power transformation: ; untuk interpretasikan sebagai invers lalu angkat pangkat.
- Untuk mixing: fungsi bobot atau harus merupakan distribusi probabilitas yang valid.
- Transformasi bersifat satu-ke-satu (monotone) sehingga formula change-of-variable berlaku secara langsung.
- Momen distribusi baru terdefinisi finite jika momen distribusi asal yang bersesuaian finite.
Section 3 — Jembatan Logika
Dari Definisi ke Rumus — Prinsip Change of Variable›
Semua teknik 1–3 adalah aplikasi dari satu prinsip tunggal: change of variable untuk variabel acak kontinu. Jika dengan monotone increasing dan differentiable, maka:
Inilah “mesin” di balik semua rumus transformasi. Teknik 1 (): , turunannya . Teknik 2 (): , turunannya . Teknik 3 (): , turunannya .
Untuk mixing (teknik 4), prinsip yang bekerja berbeda: ini adalah marginalisasi — kita “rata-ratakan” distribusi bersyarat terhadap distribusi prior . Hasilnya adalah distribusi marginal yang secara otomatis lebih heavy-tailed daripada komponen-komponennya.
Support dan Domain›
- Teknik 1 & 2: Jika , maka dan . Support tetap positif.
- Teknik 3: bisa bersupport (seperti Normal), tetapi selalu. Ini adalah cara membentuk distribusi positif dari distribusi tak terbatas.
- Teknik 4 (mixing): Support adalah gabungan support dari semua . Jika tiap komponen bersupport positif, maka distribusi campuran juga bersupport positif.
- Inverse transformation (): Jika bersupport , maka juga bersupport . Namun perilaku ekor terbalik: ekor kanan menjadi ekor kiri dan sebaliknya.
Derivasi: Distribusi Pareto dari Gamma Mixture of Exponentials
Ini adalah derivasi mixing paling penting di TA2.
Langkah 1 — Setup: , sehingga:
Langkah 2 — Prior: (parameterisasi KPW: mean ):
Langkah 3 — Marginal via integrasi:
Langkah 4 — Kenali integran sebagai kernel Gamma:
Langkah 5 — Substitusi dan sederhanakan (dengan ):
Sederhanakan lebih lanjut:
Ini adalah PDF Pareto dari KPW. ∎
Kesimpulan penting: Pareto memiliki ekor jauh lebih berat dari Eksponensial karena ia adalah campuran dari banyak Eksponensial dengan rate yang bervariasi mengikuti Gamma. Polis berisiko tinggi (rate kecil = klaim besar) menarik ekor kanan menjadi power-law, bukan eksponensial decay.
Derivasi: PDF Transformed Gamma dari Power Transformation
Jika dan (dengan ), maka disebut Transformed Gamma.
Langkah 1 — Hubungan CDF:
Langkah 2 — Turunkan untuk mendapat PDF:
Langkah 3 — Substitusi dengan :
Kasus khusus: → Rayleigh-like; → Weibull.
Dilarang›
- Jangan turunkan PDF langsung tanpa Jacobian saat melakukan change of variable — selalu kalikan dengan atau . Melupakan faktor Jacobian adalah kesalahan paling umum dalam soal transformasi.
- Jangan gunakan rumus PDF teknik 2 untuk secara langsung — untuk inverse (), gunakan formula khusus yang merupakan kasus .
- Jangan asumsikan mixing selalu menghasilkan distribusi yang sama keluarga dengan komponen-komponennya — Gamma mixing of Exponentials menghasilkan Pareto, bukan Eksponensial atau Gamma. Identifikasi distribusi hasil mixing selalu dari bentuk PDF marginal.
Section 4 — Contoh Soal
Soal A — Fundamental
Variabel acak . Misalkan (inflasi 100% diterapkan pada distribusi klaim). Tentukan , , dan tuliskan PDF .
Solusi Soal A›
Pendekatan: Terapkan Teknik 1 (scale transformation) secara langsung — .
1. Identifikasi Variabel
- : ,
- dengan
2. Identifikasi Distribusi / Model Scale transformation pada distribusi Gamma menghasilkan Gamma dengan parameter skala yang berubah. — parameter bentuk tidak berubah, hanya parameter skala yang dikalikan .
3. Setup Persamaan
4. Eksekusi Aljabar
PDF Gamma asal:
PDF hasil transformasi:
Ini adalah PDF Gamma ✓
Momen:
5. Verification Distribusi Gamma: ✓ dan ✓. Variansi naik 4 kali (bukan 2 kali) karena .
Hasil: , , .
Exam Tips — Soal A›
Target waktu: 2–3 menit. Common trap: Variansi naik sebanding , bukan . Banyak kandidat menulis — ini salah. Shortcut: Untuk distribusi Gamma, hanya mengubah ; tidak berubah. Langsung tulis tanpa harus menurunkan PDF dari awal.
Soal B — Exam-Typical
Variabel acak dengan PDF . Tentukan PDF dan CDF dari .
Solusi Soal B›
Pendekatan: Terapkan power transformation. Hubungan: , sehingga ini adalah Teknik 2 dengan (atau interpretasikan langsung sebagai dengan change of variable).
1. Identifikasi Variabel
- : , support
- Transformasi: , sehingga , support
2. Identifikasi Distribusi / Model Power transformation adalah monotone increasing untuk . Gunakan metode CDF karena lebih langsung daripada Jacobian untuk soal ini.
3. Setup Persamaan
Metode CDF:
4. Eksekusi Aljabar
CDF Weibull:
PDF:
Ini adalah PDF Eksponensial dengan mean .
5. Verification ✓. untuk ✓. Fakta menarik: ketika — ini konsisten dengan fakta bahwa Weibull adalah distribusi Rayleigh, dan kuadratnya adalah Eksponensial.
Hasil: , , yaitu .
Exam Tips — Soal B›
Target waktu: 3–4 menit. Common trap: Jangan lupa faktor (Jacobian) saat menurunkan PDF dari CDF. Shortcut: Metode CDF jauh lebih cepat daripada Jacobian langsung untuk power transformations. Hafalkan: untuk .
Soal C — Challenging
Jumlah klaim suatu polis asuransi jiwa kelompok mengikuti distribusi Poisson bersyarat: , di mana mixing parameter . Tentukan distribusi marginal , hitung dan , serta hitung dan .
Solusi Soal C›
Pendekatan: Gunakan Teknik 4 (mixing). Poisson-Gamma mixture menghasilkan distribusi Binomial Negatif — kenali pola ini tanpa harus mengintegrasi manual untuk setiap soal.
1. Identifikasi Variabel
- :
- : ,
2. Identifikasi Distribusi / Model Poisson–Gamma mixture selalu menghasilkan distribusi Binomial Negatif. Parameter:
- (parameter bentuk)
- (dalam parameterisasi KPW)
- atau ekuivalen: sehingga
3. Setup Persamaan
Distribusi marginal via integrasi (untuk verifikasi):
4. Eksekusi Aljabar
Integral adalah kernel Gamma dengan parameter dan rate :
Substitusi kembali:
Ini adalah PMF Binomial Negatif dari KPW.
Dengan , , :
Momen via law of total expectation:
Cross-check via NegBin: ✓ dan ✓.
5. Verification — masuk akal untuk distribusi dengan mean 1.5. : konsisten dengan overdispersion khas distribusi campuran (mixing selalu menambah variansi dibanding Poisson murni dengan mean sama).
Hasil: ; ; ; ; .
Exam Tips — Soal C›
Target waktu: 5–6 menit. Common trap: Banyak kandidat menghitung hanya sebagai (seperti Poisson biasa) — salah! Mixing selalu menambah variansi via . Shortcut: Hafalkan tiga pasangan mixing penting: (1) Poisson-Gamma → NegBin; (2) Poisson-InvGaussian → Poisson-InvGaussian; (3) Eksponensial-Gamma → Pareto. Kenali pola dari parameter yang diberikan dan langsung tulis distribusi hasilnya.
Section 5 — Verifikasi & Sanity Check
Cross-check Scale Transformation via Momen›
Untuk , selalu verifikasi menggunakan dua properti:
Ini karena .
Jika hasil CV berubah setelah scale transformation, ada kesalahan dalam perhitungan momen.
Cross-check Mixing via Overdispersion›
Untuk distribusi campuran, variansi selalu lebih besar daripada distribusi komponen dengan mean yang sama. Secara spesifik, karena :
Artinya: distribusi marginal selalu lebih dispersed daripada rata-rata komponen. Ini adalah sanity check wajib: jika untuk Poisson mixture, ada yang salah.
Metode Alternatif
Untuk power transformation, ada dua pendekatan ekuivalen: (1) metode CDF — , kemudian turunkan untuk PDF; (2) metode Jacobian langsung — hitung lalu kalikan dengan Jacobian. Metode CDF biasanya lebih cepat dan lebih sedikit peluang salah di soal ujian. Untuk distribusi Lognormal, perhatikan bahwa momen ke- dapat dihitung langsung menggunakan tanpa perlu menghitung MGF secara eksplisit.
Section 6 — Visualisasi Mental
Diagram empat teknik transformasi:
DISTRIBUSI ASAL X
│
├──── Teknik 1: Y = cX ──────────────────── Distribusi sama, skala bergeser
│ (Gamma → Gamma, θ → cθ)
│
├──── Teknik 2: Y = X^(1/τ) ──────────────── "Transformed" family
│ τ > 0 (Gamma → Transformed Gamma → Weibull)
│ τ < 0 (Y = 1/X) (Gamma → Inverse Gamma)
│
├──── Teknik 3: Y = e^X ─────────────────── Distribusi baru, right-skewed
│ (hanya untuk X ~ Normal/dsb) (Normal → Lognormal)
│
└──── Teknik 4: Mixing ──────────────────── Distribusi heavy-tail baru
X | Λ ~ F_X(·|λ) (Poisson+Gamma → NegBin)
Λ ~ F_Λ(·) (Eksponensial+Gamma → Pareto)
Pengaruh terhadap bentuk kurva:
- Teknik 1 (scale): Kurva melebar (jika ) atau menyempit (jika ) secara horizontal; bentuk tidak berubah. Mode, median, mean semua dikalikan .
- Teknik 2 (power, ): Ekor kanan semakin berat; distribusi menjadi lebih right-skewed.
- Teknik 2 (power, ): Ekor kanan menipis; distribusi menjadi lebih terkonsentrasi.
- Teknik 3 (exponentiation): Distribusi simetris menjadi right-skewed dengan ekor yang panjang.
- Teknik 4 (mixing): Selalu menambah dispersi — ekor menjadi lebih berat daripada komponen individual.
Hubungan Visual ↔ Rumus
| Elemen Visual | Komponen Rumus |
|---|---|
| Kurva melebar horizontal (Teknik 1) | , skala |
| Ekor kanan memanjang (Teknik 2, ) | , nilai besar dikompres lebih lambat |
| Simetri hilang (Teknik 3) | |
| Kurva lebih “datar” dan berekor panjang (mixing) |
Section 7 — Jebakan Umum
Kesalahan Parametrisasi›
- Power vs Transformed: Notasi berbeda di sumber berbeda. KPW mendefinisikan “Transformed Gamma” sebagai dengan . Beberapa sumber mendefinisikan sebaliknya ( vs ). Selalu cek: apakah parameter di soal adalah eksponen atau invers eksponen?
- Parameterisasi mixing: dalam KPW berarti mean . Beberapa sumber menggunakan dengan sebagai rate (bukan skala), sehingga mean . Ini mengubah hasil Pareto secara dramatis — verifikasi konvensi sebelum menghitung.
Kesalahan Konseptual›
- Lupa Jacobian: Rumus tidak lengkap tanpa faktor . Ini adalah kesalahan teknis paling umum dalam soal transformasi.
- Scale Transformation ≠ Power Transformation: (scale, ) sangat berbeda dari (power, ). Keduanya memodifikasi distribusi dengan cara yang berbeda.
- Mixing bukan convolution: Distribusi campuran (mixture) berbeda dari distribusi penjumlahan (compound/convolution). (compound) berbeda dari yang diambil dari dengan probabilitas atau dari dengan probabilitas (mixture).
- Variance of mixture: Banyak kandidat menghitung saja — ini hanya komponen pertama. Komponen kedua wajib ditambahkan.
Kesalahan Interpretasi Soal›
- “Distribusi dengan ” — ini bukan exponentiation, ini transformasi log. jika menghasilkan Normal. Beda arah dengan yang mengubah Normal → Lognormal.
- “Mixture of two distributions” — bisa berarti (a) scale mixture dengan mixing parameter acak (Teknik 4), atau (b) finite mixture: dengan tetap. Baca soal dengan teliti untuk membedakan keduanya.
- “Inverse distribution” — dalam KPW, “Inverse Gamma” berarti distribusi dari dengan . Jangan bingung dengan “reciprocal” dalam arti umum.
Red Flags›
- Soal menyebut “Pareto” tanpa menjelaskan asal-usulnya → kemungkinan besar ada Gamma mixing of Exponentials di baliknya; verifikasi via parameter dan
- Soal menyebut “Weibull” → ini adalah power transformation dari Eksponensial: dengan ; manfaatkan secara langsung
- Soal menyebut “Transformed Gamma” atau “Inverse Gamma” → segera identifikasi teknik yang digunakan (power transformation atau inverse) sebelum menulis PDF
- Soal memberikan distribusi bersyarat dan distribusi → Teknik 4, gunakan law of total expectation/variance untuk momen dan integrasikan untuk PMF/PDF marginal
Section 8 — Ringkasan Eksekutif
Must-Remember›
- Scale Transformation — : PDF, CDF, dan momen berubah hanya dalam faktor :
- Power Transformation — , metode CDF paling efisien:
- Exponentiation — , menghasilkan Lognormal:
- Mixing — Momen via Law of Total Variance:
- Tiga pasangan mixing kanonik yang wajib dihafalkan:
Kapan Digunakan
- Soal menyebutkan “inflasi” atau “perubahan satuan” pada distribusi klaim → Teknik 1 (scale)
- Soal menyebutkan “Weibull”, “Transformed Gamma”, “Inverse Gamma/Pareto” → Teknik 2 (power)
- Soal menyebutkan “Lognormal berasal dari Normal” atau “log transformation” → Teknik 3 (exponentiation)
- Soal memberikan distribusi bersyarat dan mixing distribution → Teknik 4 (mixing); gunakan law of total expectation/variance untuk momen
- Soal meminta PDF/CDF distribusi baru dari distribusi yang sudah dikenal
Kapan TIDAK Boleh Digunakan
- Teknik 1–3 tidak berlaku untuk transformasi non-monotone (misalnya jika support mencakup nilai negatif) — perlu perlakuan khusus untuk fungsi non-monotone
- Teknik 4 tidak menghasilkan distribusi yang sama dengan penjumlahan (convolution) — jangan gunakan rumus mixing untuk menghitung distribusi total klaim (gunakan model agregat, bukan mixing)
- Formula momen hanya berlaku untuk scale transformation , bukan untuk power transformation umum
Quick Decision Tree
graph TD
A["Distribusi baru dari distribusi asal?"] -->|"Y = cX, c konstan"| B["Teknik 1: Scale Transformation<br>E[Y^k] = c^k E[X^k]<br>F_Y(y) = F_X(y/c)"]
A -->|"Y = X^(1/tau), tau konstan"| C["Teknik 2: Power Transformation<br>F_Y(y) = F_X(y^tau)<br>f_Y(y) = tau * y^(tau-1) * f_X(y^tau)"]
A -->|"Y = e^X"| D["Teknik 3: Exponentiation<br>Normal -> Lognormal<br>E[Y^k] = exp(k*mu + k^2*sigma^2/2)"]
A -->|"Y | Lambda ~ F, Lambda ~ G"| E["Teknik 4: Mixing<br>Var(Y) = E[Var(Y|L)] + Var(E[Y|L])"]
E -->|"Poisson + Gamma"| F["Hasil: NegBin(r=alpha, beta=theta)"]
E -->|"Eksponensial + Gamma"| G["Hasil: Pareto(alpha, theta)"]
C -->|"tau < 0 atau Y = 1/X"| H["Inverse Distribution<br>f_Y(y) = y^(-2) * f_X(1/y)"]
Follow-up Options›
- “Berikan contoh soal variasi Lognormal moments dari teknik exponentiation”
- “Jelaskan hubungan 1.3 Techniques for Creating New Distributions dengan 3.1 Coverage Modifications on Severity and Frequency”
- “Buat flashcard 1-halaman untuk empat teknik transformasi dan pasangan mixing kanonik”
📖 Ref: Klugman, Panjer & Willmot (2019) Loss Models 5th ed., Bab 4 | 🗓️ 2026-04-16 | #TA2 #Transformasi #Mixing #ModelBesarKlaim