Inversion Method for Random Variables
📊 8.2 — Inversion Method for Random Variables
Ringkasan Cepat›
Topik: Inversion Method for Random Variables | Bobot: ~5–10% | Difficulty: Hard Ref: Klugman et al. (2019), Loss Models 5th ed., Bab 19.3; Tse (2009), Bab 14 | Prereq: 8.1 Monte Carlo Simulation Concepts, 1.2 Distribution Classes and Extreme Value
Section 0 — Pemetaan Topik
| Topik TA2 | Sub-topik ID | Skill Diuji | Bobot | Difficulty | Prerequisite | Connected Topics | Referensi |
|---|---|---|---|---|---|---|---|
| Simulasi | 8.2 | Mensimulasikan nilai dari distribusi diskrit dan kontinu menggunakan metode inversi; menurunkan fungsi invers CDF secara analitik; mengaplikasikan metode inversi pada distribusi campuran dan mixed | 5–10% | Hard | 8.1 Monte Carlo Simulation Concepts, 1.2 Distribution Classes and Extreme Value | 8.1 Monte Carlo Simulation Concepts, 8.3 Permutation Test and Bootstrap, 4.2 Compound Distributions | Klugman et al. (2019), Bab 19.3; Tse (2009), Bab 14 |
Section 1 — Intuisi
Bayangkan seorang aktuaris yang ingin mensimulasikan 10.000 skenario klaim asuransi properti untuk keperluan stress-testing portofolio. Ia mengetahui bahwa besar klaim mengikuti distribusi Lognormal dengan parameter tertentu — tetapi bagaimana ia bisa “menghasilkan” ribuan angka acak yang mengikuti distribusi itu dari komputer, yang hanya mampu menghasilkan angka acak seragam antara 0 dan 1?
Di sinilah metode inversi hadir sebagai jembatan yang elegan. Kunci utamanya adalah teorema probabilitas yang sederhana namun kuat: jika adalah bilangan acak seragam pada , maka — di mana adalah fungsi invers dari CDF distribusi target — akan mengikuti distribusi yang diinginkan. Dengan kata lain, kita tinggal “membalik” CDF: ambil bilangan acak seragam sebagai probabilitas, cari nilai yang menghasilkan probabilitas tersebut, dan itulah simulasi kita.
Tantangannya terletak pada dua hal. Pertama, untuk distribusi kontinu, kita perlu menemukan secara analitik — yang tidak selalu mudah (distribusi Normal misalnya tidak memiliki bentuk tertutup). Kedua, untuk distribusi diskrit, metode inversi bekerja secara berbeda: kita mencari nilai diskrit yang CDF-nya pertama kali melampaui bilangan seragam yang dihasilkan. Memahami kedua kasus ini dengan tepat — beserta kasus khusus seperti distribusi campuran (mixture) — adalah inti dari topik ini.
Section 2 — Definisi Formal
Definisi Matematis — Probability Integral Transform›
Jika adalah variabel acak dengan CDF yang kontinu dan strictly increasing, dan , maka:
Sebaliknya (inverse direction): jika kontinu, maka .
| Simbol | Makna | Catatan |
|---|---|---|
| Bilangan acak seragam | ; dihasilkan komputer | |
| CDF dari distribusi target | Fungsi yang ingin disimulasikan | |
| Fungsi invers CDF (quantile function) | ||
| Nilai simulasi ke- | untuk bilangan seragam | |
| Probabilitas titik untuk distribusi diskrit | , | |
| CDF kumulatif diskrit | secara konvensi | |
| Bobot komponen ke- dalam distribusi campuran | , | |
| CDF komponen ke- dalam distribusi campuran | Masing-masing adalah distribusi valid |
Rumus Utama
[Inversion — Kontinu] Simulasi dari distribusi kontinu:
Label: Selesaikan terhadap secara analitik untuk mendapatkan , lalu substitusikan yang dihasilkan.
[Inversion — Eksponensial] Invers CDF distribusi Eksponensial():
Label: Karena juga, bisa disederhanakan: . Kedua bentuk ekuivalen.
[Inversion — Pareto] Invers CDF distribusi Pareto dua-parameter ():
Label: Ekuivalen dengan karena .
[Inversion — Weibull] Invers CDF distribusi Weibull() dengan :
Label: Generalisasi Eksponensial; ketika reduksi ke .
[Inversion — Diskrit] Algoritma simulasi distribusi diskrit:
Label: Temukan indeks terkecil sehingga . Ekuivalen: jika jatuh di interval .
[Inversion — Campuran] Simulasi dari distribusi campuran :
Label: Dua bilangan seragam independen dibutuhkan: untuk memilih komponen, untuk simulasi dari komponen tersebut.
Asumsi Eksplisit
- Ketersediaan analitik (kontinu): Metode inversi paling efisien ketika invers CDF memiliki bentuk tertutup. Jika tidak (misalnya Normal, Gamma), diperlukan pendekatan numerik.
- Generator bilangan seragam berkualitas: Kualitas simulasi bergantung pada generator pseudorandom yang memberikan i.i.d. .
- Distribusi diskrit — nilai terurut: Nilai harus tersusun naik agar algoritma pencarian interval bekerja.
- Distribusi campuran — bobot diketahui: Bobot komponen harus berjumlah 1 dan masing-masing non-negatif.
- Independensi bilangan seragam: Untuk distribusi campuran, (pemilih komponen) dan (simulasi dalam komponen) harus independen.
Section 3 — Jembatan Logika
Dari Definisi ke Rumus — Mengapa Mengikuti Distribusi ? Bukti probability integral transform bersifat elegan. Kita ingin menunjukkan . Karena adalah fungsi yang monoton tidak-turun dan kontinu, operasi inversi bersifat order-preserving: jika dan hanya jika . Sehingga , karena dan . Ini adalah bukti satu baris yang kuat — dan menjelaskan mengapa syarat “kontinu dan strictly increasing” diperlukan agar invers terdefinisi dengan baik.›
Distribusi Diskrit — Mengapa Menggunakan ? Untuk distribusi diskrit, CDF berbentuk tangga (step function) dan tidak invertible dalam arti biasa. Solusinya adalah menggunakan generalized inverse: . Dalam praktik, artinya: temukan nilai terkecil sehingga . Konvensi (bukan ) memastikan — tepat sesuai probabilitas yang diinginkan.›
Derivasi Invers CDF Eksponensial — step-by-step:
Langkah 1: Mulai dari CDF Eksponensial:
Langkah 2: Set dan selesaikan untuk :
Langkah 3: Ambil logaritma natural:
Langkah 4: Sederhanakan menggunakan sifat simetri Uniform:
Langkah 5: Verifikasi: ketika , ; ketika , . Range konsisten dengan support Eksponensial. ✓
Derivasi Invers CDF Pareto — step-by-step:
Langkah 1: CDF Pareto dua-parameter:
Langkah 2: Set :
Langkah 3: Pangkatkan dengan pada kedua ruas:
Langkah 4: Selesaikan untuk :
Langkah 5: Karena , bentuk alternatif: . Verifikasi: saat , ; saat , . ✓
Dilarang›
- Jangan menggunakan dan sekaligus dalam simulasi yang sama untuk menghasilkan dua nilai berbeda — keduanya ekuivalen secara distribusional, bukan dua nilai independen. Untuk dua simulasi independen, gunakan dua bilangan seragam independen dan .
- Jangan menggunakan atau (bukan ) pada distribusi diskrit — konvensi ketidaksamaan yang keliru mengubah probabilitas titik yang dihasilkan.
- Jangan menerapkan rumus invers distribusi kontinu untuk bilangan seragam atau — nilainya tidak terdefinisi (menghasilkan atau ); dalam praktik bilangan seragam dihasilkan pada terbuka.
Section 4 — Contoh Soal
Soal A — Fundamental
Bilangan acak seragam berikut dihasilkan: , , . Simulasikan tiga nilai dari distribusi Eksponensial dengan mean . Gunakan formula .
Solusi Soal A›
Pendekatan: Substitusikan langsung setiap ke formula invers CDF Eksponensial .
1. Identifikasi Variabel
- Distribusi: Eksponensial(),
- Bilangan seragam: , ,
- Formula invers:
2. Identifikasi Distribusi / Model Eksponensial kontinu dengan invers CDF tertutup. Metode inversi langsung tanpa aproksimasi.
3. Setup Persamaan
4. Eksekusi Aljabar
5. Verification Semua nilai positif ✓ (support Eksponensial: ). konsisten dengan — metode inversi bersifat order-preserving ✓. Nilai (karena ) — masuk akal sebagai konfirmasi.
Hasil: , , .
Exam Tips — Soal A›
Target waktu: 2 menit. Common trap: Menggunakan alih-alih — keduanya ekuivalen secara distribusional tetapi menghasilkan nilai numerik berbeda untuk spesifik yang diberikan. Soal biasanya menetapkan salah satu formula; ikuti formula yang diminta soal. Shortcut: ; .
Soal B — Exam-Typical
Variabel acak diskrit memiliki distribusi:
| 1 | 2 | 3 | 4 | 5 | |
|---|---|---|---|---|---|
| 0.10 | 0.25 | 0.35 | 0.20 | 0.10 |
Bilangan acak seragam yang dihasilkan adalah , , . Simulasikan tiga nilai dari distribusi ini menggunakan metode inversi.
Solusi Soal B›
Pendekatan: Bangun tabel CDF kumulatif, lalu tentukan nilai untuk setiap dengan mencari interval yang memuat .
1. Identifikasi Variabel
- Distribusi diskrit dengan 5 nilai:
- Probabilitas:
- Bilangan seragam: , ,
2. Identifikasi Distribusi / Model Distribusi diskrit — gunakan aturan jika .
3. Setup Persamaan
Bangun tabel CDF kumulatif:
| Interval | ||||
|---|---|---|---|---|
| 1 | 1 | 0.10 | 0.10 | |
| 2 | 2 | 0.25 | 0.35 | |
| 3 | 3 | 0.35 | 0.70 | |
| 4 | 4 | 0.20 | 0.90 | |
| 5 | 5 | 0.10 | 1.00 |
4. Eksekusi Aljabar
Untuk : Cari interval yang memuat .
Untuk : Cari interval yang memuat .
Untuk : Cari interval yang memuat .
5. Verification Cek: setiap jatuh tepat di satu interval ✓ (interval-interval partisi secara exhaustive). Proporsi hasil: dari 3 simulasi, nilai yang dihasilkan adalah 1, 3, 5 — tidak ada kesimpulan statistik dari 3 observasi, tetapi nilai mungkin ✓.
Hasil: , , .
Exam Tips — Soal B›
Target waktu: 3 menit. Common trap: Menggunakan (pertidaksamaan terbalik) — ini mengubah nilai yang dihasilkan di batas interval. Konvensi standar adalah : batas kiri terbuka, batas kanan tertutup. Common trap kedua: Tidak membangun tabel CDF kumulatif terlebih dahulu dan mencoba “mengira” interval — selalu bangun tabel eksplisit. Shortcut: Mulai dari ujung kiri tabel dan gerakkan ke kanan sampai pertama kali — ini adalah prosedur “first such that .”
Soal C — Challenging
Besar klaim mengikuti distribusi campuran (mixture): dengan probabilitas , klaim berasal dari distribusi Eksponensial dengan mean ; dengan probabilitas , klaim berasal dari distribusi Pareto dengan dan .
Bilangan acak seragam yang tersedia (gunakan secara berurutan): (untuk memilih komponen), (untuk simulasi dalam komponen).
Simulasikan satu nilai klaim menggunakan metode inversi dua-tahap.
Solusi Soal C›
Pendekatan: Langkah 1 — gunakan untuk memilih komponen distribusi. Langkah 2 — gunakan untuk mensimulasikan nilai dari komponen terpilih menggunakan formula invers CDF masing-masing.
1. Identifikasi Variabel
- Distribusi campuran: (Eksponensial, ), (Pareto, , )
- untuk pemilihan komponen; untuk simulasi dalam komponen
- Invers CDF Eksponensial:
- Invers CDF Pareto:
2. Identifikasi Distribusi / Model Distribusi campuran dua komponen. Prosedur dua-tahap: pemilihan komponen (diskrit, berdasarkan ) lalu simulasi dari komponen (kontinu, invers CDF).
3. Setup Persamaan
Tahap 1 — Pemilihan komponen:
Tahap 2 — Simulasi dari komponen terpilih:
4. Eksekusi Aljabar
Tahap 1: Cek vs :
Tahap 2: Simulasikan dari Eksponensial menggunakan :
5. Verification Komponen Eksponensial terpilih dengan peluang — benar bahwa memilih komponen ini ✓. Nilai sesuai support Eksponensial ✓. Sebagai perbandingan: jika , komponen Pareto akan dipilih dan nilai klaim cenderung jauh lebih besar (distribusi Pareto ekor-berat) — ini konsisten dengan sifat campuran.
Hasil: Klaim disimulasikan dari komponen Eksponensial; .
Exam Tips — Soal C›
Target waktu: 5 menit. Common trap terbesar: Menggunakan hanya satu bilangan seragam untuk kedua tahap — pemilihan komponen dan simulasi dalam komponen membutuhkan dua bilangan seragam independen. Soal biasanya menyediakan bilangan seragam secara berurutan; identifikasi mana untuk tahap 1 dan mana untuk tahap 2. Common trap kedua: Menggunakan sebagai kondisi memilih Komponen 1 (terbalik) — konvensi: Komponen 1 dipilih jika . Shortcut: Tulis tabel partisi kumulatif untuk komponen: Komponen 1 jika ; Komponen 2 jika .
Section 5 — Verifikasi & Sanity Check
Cek Konsistensi Range Nilai yang Disimulasikan›
Nilai yang disimulasikan harus selalu berada dalam support distribusi target:
- Eksponensial: untuk semua ✓ (karena untuk )
- Pareto: untuk semua ✓ (karena untuk )
- Diskrit: — hasil harus selalu berupa salah satu nilai yang mungkin ✓
Jika hasil simulasi di luar support, ada kesalahan dalam formula invers atau substitusi.
Cek Order-Preserving Property›
Metode inversi bersifat order-preserving: jika , maka . Gunakan ini untuk verifikasi cepat: ketika beberapa diberikan dalam urutan menaik, nilai yang dihasilkan harus juga urut menaik (untuk distribusi kontinu). Jika tidak, ada kesalahan kalkulasi.
Metode Alternatif — Simulasi Normal via Box-Muller
Untuk distribusi Normal standar yang tidak memiliki invers CDF tertutup, gunakan transformasi Box-Muller sebagai alternatif metode inversi:
di mana independen. Hasilnya adalah dua nilai Normal standar independen. Untuk Normal dengan mean dan standar deviasi : .
Section 6 — Visualisasi Mental
Visualisasi Metode Inversi — Distribusi Kontinu:
CDF F(x)
1.0 ─────────────────────────────────── ← u₃ = 0.92 ─── x₃ = F⁻¹(0.92)
│ ╱
│ ╱╱╱
0.75 ──────────────────── u₂ = 0.75 ──── x₂ = F⁻¹(0.75)
│ ╱╱╱╱
│ ╱╱╱╱
0.30 ──── u₁=0.30 ─────────────────────── x₁ = F⁻¹(0.30)
│ ╱╱╱╱╱╱╱╱╱╱╱
│╱╱╱
0.0 └────────────────────────────────→ x
x₁ x₂ x₃
← Bilangan seragam u (sumbu-y) diproyeksikan ke kiri
lalu ke bawah mengikuti kurva CDF untuk mendapat x
Visualisasi Metode Inversi — Distribusi Diskrit:
CDF F(x) (step function)
1.00 ──────────────────────────────── ───●
│ u₃=0.91 ↓ (jatuh di (0.90, 1.00] → X=5)
0.90 ──────────────────────────── ───●
│ u₂=0.43 ↓ (jatuh di (0.35, 0.70] → X=3)
0.70 ──────────────────── ───────●
│
0.35 ─────────── ────────●
│ u₁=0.08 ↓ (jatuh di (0.00, 0.10] → X=1)
0.10 ──── ────●
0.00 └──────────────────────────────→ x
1 2 3 4 5
Hubungan Visual ↔ Rumus
| Elemen Visual | Komponen Rumus |
|---|---|
| Garis horizontal dari ke kurva CDF | Operasi : temukan sehingga |
| Garis vertikal dari kurva CDF ke sumbu- | Nilai yang disimulasikan |
| “Lompatan” tangga pada distribusi diskrit | Probabilitas titik |
| Panjang interval | Proporsi bilangan yang menghasilkan nilai |
| Titik pada kurva CDF | — hubungan langsung antara nilai dan probabilitas kumulatifnya |
Section 7 — Jebakan Umum
Kesalahan Parametrisasi — Dua Bentuk Formula Eksponensial›
Formula invers CDF Eksponensial memiliki dua bentuk ekuivalen secara distribusional tetapi tidak ekuivalen numerik untuk nilai spesifik:
- : gunakan ini jika soal menyatakan adalah CDF value
- : gunakan ini jika soal menggunakan notasi “survival” atau
Salah: Menggabungkan keduanya — misalnya menghitung ketika soal memberikan dan meminta formula . Benar: Identifikasi terlebih dahulu formula mana yang diminta soal, lalu gunakan konsisten untuk semua .
Kesalahan Konseptual — 4 Miskonsepsi Umum›
- “Metode inversi hanya untuk distribusi kontinu” — Salah. Metode inversi (menggunakan generalized inverse) berlaku juga untuk distribusi diskrit, dengan prosedur berbeda: cari terkecil sehingga .
- “Satu bilangan seragam cukup untuk simulasi distribusi campuran” — Salah. Distribusi campuran -komponen membutuhkan dua bilangan seragam independen: satu untuk memilih komponen, satu untuk mensimulasikan dari komponen tersebut.
- ” dan menghasilkan dua simulasi independen” — Salah. dan adalah fungsi satu sama lain — tidak independen. Untuk dua simulasi independen, butuh dua yang di-generate terpisah.
- “Metode inversi selalu lebih baik dari metode lain” — Tidak selalu. Untuk distribusi Normal dan Gamma, tidak ada invers CDF tertutup; metode lain (Box-Muller, acceptance-rejection) lebih efisien.
Kesalahan Interpretasi Soal›
- “Simulate from Exponential with mean 200” → (mean = untuk Eksponensial) → .
- “Simulate from Pareto with , ” → gunakan ; perhatikan eksponen .
- “Use the following uniform random numbers in order” → bilangan seragam pertama selalu untuk langkah pertama (pemilihan komponen jika campuran, atau simulasi jika tunggal). Jangan menukar urutan.
- “Simulate three values” → butuh tiga bilangan seragam berbeda; jangan menggunakan ulang yang sama.
Red Flags — Keyword Pemicu Prosedur Khusus›
- “Mixture distribution” atau “dengan probabilitas , berasal dari…” → prosedur dua-tahap; butuh dua bilangan seragam independen.
- “Discrete distribution” dengan tabel probabilitas → bangun tabel CDF kumulatif; gunakan aturan .
- “Pareto with parameters and ” → eksponen dalam formula invers; jangan lupa tanda minus.
- “Weibull with shape and scale ” → eksponen (positif, bukan negatif) dalam formula invers.
- “Use directly” vs “use ” → baca soal secara cermat; kedua konvensi digunakan dalam literatur dan keduanya valid asal konsisten.
Section 8 — Ringkasan Eksekutif
Must-Remember›
1. Teorema dasar (Probability Integral Transform):
2. Invers CDF Eksponensial():
3. Invers CDF Pareto():
4. Distribusi Diskrit — aturan pemilihan nilai:
5. Distribusi Campuran — prosedur dua-tahap:
Kapan Digunakan
- Mensimulasikan nilai dari distribusi dengan invers CDF tertutup (Eksponensial, Pareto, Weibull, Uniform, dll.).
- Mensimulasikan nilai dari distribusi diskrit dengan tabel probabilitas yang diberikan.
- Mensimulasikan dari distribusi campuran (mixture) dengan dua bilangan seragam independen.
- Trigger keywords: “simulate using inversion method”, “use the following uniform random numbers”, “inversion method for continuous/discrete distribution”.
Kapan TIDAK Boleh Digunakan
- Distribusi Normal, Gamma, Beta — tidak memiliki invers CDF tertutup; gunakan metode numerik, Box-Muller (Normal), atau acceptance-rejection.
- Ketika soal secara eksplisit meminta metode lain (acceptance-rejection, composition method).
- Untuk distribusi yang sangat kompleks di mana evaluasi numerik lebih mahal dari metode alternatif.
Quick Decision Tree
graph TD
A["Simulasikan nilai dari distribusi F"] --> B{"Jenis distribusi?"}
B -- "Kontinu,<br>invers CDF tertutup" --> C{"Distribusi apa?"}
B -- "Diskrit" --> D["Bangun tabel CDF kumulatif<br>F_0=0, F_k = sum p_j<br>X = x_k jika F_(k-1) < U <= F_k"]
B -- "Campuran" --> E["Dua tahap:<br>U1 pilih komponen j<br>U2 simulasikan dari F_j"]
C -- "Eksponensial(theta)" --> F["x = -theta * ln(1-u)<br>atau x = -theta * ln(u)"]
C -- "Pareto(alpha, theta)" --> G["x = theta * [(1-u)^(-1/alpha) - 1]"]
C -- "Weibull(tau, theta)" --> H["x = theta * [-ln(1-u)]^(1/tau)"]
C -- "Normal / Gamma" --> I["Tidak ada invers tertutup<br>Gunakan Box-Muller / numerik"]
F --> J["Verifikasi: x dalam support<br>order-preserving check"]
G --> J
H --> J
D --> J
E --> J
I --> J
Follow-up Options›
- “Berikan contoh soal variasi simulasi distribusi Weibull dan Lognormal menggunakan metode inversi”
- “Jelaskan hubungan 8.2 Inversion Method for Random Variables dengan 8.3 Permutation Test and Bootstrap”
- “Buat flashcard 1-halaman untuk semua rumus invers CDF yang diuji di TA2”
📖 Ref: Klugman, Panjer & Willmot (2019), Loss Models 5th ed., Bab 19.3; Tse (2009), Bab 14 | 🗓️ 2026-04-19 | #TA2 #InversionMethod #Simulation