AktuNotes
← Kembali
TA2 · Materi 8.2

Inversion Method for Random Variables

Hard Bobot: 5–10% Klugman, Panjer & Willmot (2019), Loss Models 5th ed., Bab 19.3; Tse (2009), Bab 14
TA2InversionMethodSimulationMonteCarloRandomVariablesTeoriRisiko

📊 8.2 — Inversion Method for Random Variables

Ringkasan Cepat

Topik: Inversion Method for Random Variables | Bobot: ~5–10% | Difficulty: Hard Ref: Klugman et al. (2019), Loss Models 5th ed., Bab 19.3; Tse (2009), Bab 14 | Prereq: 8.1 Monte Carlo Simulation Concepts, 1.2 Distribution Classes and Extreme Value

Section 0 — Pemetaan Topik

Topik TA2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Simulasi8.2Mensimulasikan nilai dari distribusi diskrit dan kontinu menggunakan metode inversi; menurunkan fungsi invers CDF secara analitik; mengaplikasikan metode inversi pada distribusi campuran dan mixed5–10%Hard8.1 Monte Carlo Simulation Concepts, 1.2 Distribution Classes and Extreme Value8.1 Monte Carlo Simulation Concepts, 8.3 Permutation Test and Bootstrap, 4.2 Compound DistributionsKlugman et al. (2019), Bab 19.3; Tse (2009), Bab 14

Section 1 — Intuisi

Bayangkan seorang aktuaris yang ingin mensimulasikan 10.000 skenario klaim asuransi properti untuk keperluan stress-testing portofolio. Ia mengetahui bahwa besar klaim mengikuti distribusi Lognormal dengan parameter tertentu — tetapi bagaimana ia bisa “menghasilkan” ribuan angka acak yang mengikuti distribusi itu dari komputer, yang hanya mampu menghasilkan angka acak seragam antara 0 dan 1?

Di sinilah metode inversi hadir sebagai jembatan yang elegan. Kunci utamanya adalah teorema probabilitas yang sederhana namun kuat: jika UU adalah bilangan acak seragam pada [0,1][0,1], maka X=F1(U)X = F^{-1}(U) — di mana F1F^{-1} adalah fungsi invers dari CDF distribusi target — akan mengikuti distribusi FF yang diinginkan. Dengan kata lain, kita tinggal “membalik” CDF: ambil bilangan acak seragam sebagai probabilitas, cari nilai xx yang menghasilkan probabilitas tersebut, dan itulah simulasi kita.

Tantangannya terletak pada dua hal. Pertama, untuk distribusi kontinu, kita perlu menemukan F1F^{-1} secara analitik — yang tidak selalu mudah (distribusi Normal misalnya tidak memiliki bentuk tertutup). Kedua, untuk distribusi diskrit, metode inversi bekerja secara berbeda: kita mencari nilai diskrit yang CDF-nya pertama kali melampaui bilangan seragam UU yang dihasilkan. Memahami kedua kasus ini dengan tepat — beserta kasus khusus seperti distribusi campuran (mixture) — adalah inti dari topik ini.

Section 2 — Definisi Formal

Definisi Matematis — Probability Integral Transform

Jika XX adalah variabel acak dengan CDF FX(x)F_X(x) yang kontinu dan strictly increasing, dan UUniform(0,1)U \sim \text{Uniform}(0,1), maka:

X=FX1(U)FXX = F_X^{-1}(U) \sim F_X

Sebaliknya (inverse direction): jika XFXX \sim F_X kontinu, maka U=FX(X)Uniform(0,1)U = F_X(X) \sim \text{Uniform}(0,1).

SimbolMaknaCatatan
UUBilangan acak seragamUUniform(0,1)U \sim \text{Uniform}(0,1); dihasilkan komputer
FX(x)F_X(x)CDF dari distribusi targetFungsi yang ingin disimulasikan
FX1(u)F_X^{-1}(u)Fungsi invers CDF (quantile function)FX1(u)=inf{x:FX(x)u}F_X^{-1}(u) = \inf\{x : F_X(x) \geq u\}
x(i)x_{(i)}Nilai simulasi ke-iix(i)=FX1(u(i))x_{(i)} = F_X^{-1}(u_{(i)}) untuk bilangan seragam u(i)u_{(i)}
pk=P(X=xk)p_k = P(X = x_k)Probabilitas titik untuk distribusi diskritpk0p_k \geq 0, kpk=1\sum_k p_k = 1
Fk=jkpjF_k = \sum_{j \leq k} p_jCDF kumulatif diskritF0=0F_0 = 0 secara konvensi
αj\alpha_jBobot komponen ke-jj dalam distribusi campuranαj>0\alpha_j > 0, jαj=1\sum_j \alpha_j = 1
Fj(x)F_j(x)CDF komponen ke-jj dalam distribusi campuranMasing-masing adalah distribusi valid

Rumus Utama

[Inversion — Kontinu] Simulasi dari distribusi kontinu:

x=FX1(u),uUniform(0,1)x = F_X^{-1}(u), \quad u \sim \text{Uniform}(0,1)

Label: Selesaikan FX(x)=uF_X(x) = u terhadap xx secara analitik untuk mendapatkan FX1F_X^{-1}, lalu substitusikan uu yang dihasilkan.

[Inversion — Eksponensial] Invers CDF distribusi Eksponensial(θ\theta):

FX(x)=1ex/θ=u    x=θln(1u)F_X(x) = 1 - e^{-x/\theta} = u \implies x = -\theta \ln(1 - u)

Label: Karena 1UUniform(0,1)1-U \sim \text{Uniform}(0,1) juga, bisa disederhanakan: x=θln(U)x = -\theta\ln(U). Kedua bentuk ekuivalen.

[Inversion — Pareto] Invers CDF distribusi Pareto dua-parameter (α,θ\alpha, \theta):

FX(x)=1(θx+θ)α=u    x=θ[(1u)1/α1]F_X(x) = 1 - \left(\frac{\theta}{x+\theta}\right)^\alpha = u \implies x = \theta\left[(1-u)^{-1/\alpha} - 1\right]

Label: Ekuivalen dengan x=θ[u1/α1]x = \theta\left[u^{-1/\alpha} - 1\right] karena 1U=dU1-U \overset{d}{=} U.

[Inversion — Weibull] Invers CDF distribusi Weibull(τ,θ\tau, \theta) dengan F(x)=1e(x/θ)τF(x) = 1 - e^{-(x/\theta)^\tau}:

FX(x)=1e(x/θ)τ=u    x=θ[ln(1u)]1/τF_X(x) = 1 - e^{-(x/\theta)^\tau} = u \implies x = \theta\left[-\ln(1-u)\right]^{1/\tau}

Label: Generalisasi Eksponensial; ketika τ=1\tau = 1 reduksi ke x=θln(1u)x = -\theta\ln(1-u).

[Inversion — Diskrit] Algoritma simulasi distribusi diskrit:

X=xkjikaFk1<UFk,k=1,2,X = x_k \quad \text{jika} \quad F_{k-1} < U \leq F_k, \quad k = 1, 2, \ldots

Label: Temukan indeks kk terkecil sehingga FkUF_k \geq U. Ekuivalen: X=xkX = x_k jika UU jatuh di interval (Fk1,Fk](F_{k-1}, F_k].

[Inversion — Campuran] Simulasi dari distribusi campuran F(x)=j=1mαjFj(x)F(x) = \sum_{j=1}^m \alpha_j F_j(x):

Langkah 1: Pilih komponen j dengan probabilitas αj\text{Langkah 1: Pilih komponen } j \text{ dengan probabilitas } \alpha_j Langkah 2: Simulasikan XFj menggunakan metode inversi pada komponen j\text{Langkah 2: Simulasikan } X \sim F_j \text{ menggunakan metode inversi pada komponen } j

Label: Dua bilangan seragam independen dibutuhkan: U1U_1 untuk memilih komponen, U2U_2 untuk simulasi dari komponen tersebut.

Asumsi Eksplisit

  1. Ketersediaan FX1F_X^{-1} analitik (kontinu): Metode inversi paling efisien ketika invers CDF memiliki bentuk tertutup. Jika tidak (misalnya Normal, Gamma), diperlukan pendekatan numerik.
  2. Generator bilangan seragam berkualitas: Kualitas simulasi bergantung pada generator pseudorandom yang memberikan UiU_i i.i.d. Uniform(0,1)\sim \text{Uniform}(0,1).
  3. Distribusi diskrit — nilai xkx_k terurut: Nilai x1<x2<x_1 < x_2 < \ldots harus tersusun naik agar algoritma pencarian interval bekerja.
  4. Distribusi campuran — bobot αj\alpha_j diketahui: Bobot komponen harus berjumlah 1 dan masing-masing non-negatif.
  5. Independensi bilangan seragam: Untuk distribusi campuran, U1U_1 (pemilih komponen) dan U2U_2 (simulasi dalam komponen) harus independen.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus — Mengapa FX1(U)F_X^{-1}(U) Mengikuti Distribusi FXF_X? Bukti probability integral transform bersifat elegan. Kita ingin menunjukkan P(FX1(U)x)=FX(x)P(F_X^{-1}(U) \leq x) = F_X(x). Karena FXF_X adalah fungsi yang monoton tidak-turun dan kontinu, operasi inversi bersifat order-preserving: FX1(U)xF_X^{-1}(U) \leq x jika dan hanya jika UFX(x)U \leq F_X(x). Sehingga P(FX1(U)x)=P(UFX(x))=FX(x)P(F_X^{-1}(U) \leq x) = P(U \leq F_X(x)) = F_X(x), karena UUniform(0,1)U \sim \text{Uniform}(0,1) dan FX(x)[0,1]F_X(x) \in [0,1]. Ini adalah bukti satu baris yang kuat — dan menjelaskan mengapa syarat “kontinu dan strictly increasing” diperlukan agar invers terdefinisi dengan baik.
Distribusi Diskrit — Mengapa Menggunakan Fk1<UFkF_{k-1} < U \leq F_k? Untuk distribusi diskrit, CDF berbentuk tangga (step function) dan tidak invertible dalam arti biasa. Solusinya adalah menggunakan generalized inverse: F1(u)=inf{x:F(x)u}F^{-1}(u) = \inf\{x : F(x) \geq u\}. Dalam praktik, artinya: temukan nilai xkx_k terkecil sehingga Fk=P(Xxk)uF_k = P(X \leq x_k) \geq u. Konvensi Fk1<UFkF_{k-1} < U \leq F_k (bukan Fk1U<FkF_{k-1} \leq U < F_k) memastikan P(X=xk)=P(Fk1<UFk)=FkFk1=pkP(X = x_k) = P(F_{k-1} < U \leq F_k) = F_k - F_{k-1} = p_k — tepat sesuai probabilitas yang diinginkan.

Derivasi Invers CDF Eksponensial — step-by-step:

Langkah 1: Mulai dari CDF Eksponensial:

FX(x)=1ex/θ,x>0F_X(x) = 1 - e^{-x/\theta}, \quad x > 0

Langkah 2: Set FX(x)=uF_X(x) = u dan selesaikan untuk xx:

1ex/θ=u    ex/θ=1u1 - e^{-x/\theta} = u \implies e^{-x/\theta} = 1 - u

Langkah 3: Ambil logaritma natural:

xθ=ln(1u)    x=θln(1u)-\frac{x}{\theta} = \ln(1-u) \implies x = -\theta \ln(1-u)

Langkah 4: Sederhanakan menggunakan sifat simetri Uniform:

Karena 1U=dU (jika UUniform(0,1)), maka ekuivalen: x=θln(U)\text{Karena } 1-U \overset{d}{=} U \text{ (jika } U \sim \text{Uniform}(0,1)), \text{ maka ekuivalen: } x = -\theta \ln(U)

Langkah 5: Verifikasi: ketika u0+u \to 0^+, x0+x \to 0^+; ketika u1u \to 1^-, x+x \to +\infty. Range x(0,+)x \in (0, +\infty) konsisten dengan support Eksponensial. ✓

Derivasi Invers CDF Pareto — step-by-step:

Langkah 1: CDF Pareto dua-parameter:

FX(x)=1(θx+θ)α,x>0F_X(x) = 1 - \left(\frac{\theta}{x+\theta}\right)^\alpha, \quad x > 0

Langkah 2: Set FX(x)=uF_X(x) = u:

(θx+θ)α=1u\left(\frac{\theta}{x+\theta}\right)^\alpha = 1-u

Langkah 3: Pangkatkan dengan 1/α-1/\alpha pada kedua ruas:

x+θθ=(1u)1/α\frac{x+\theta}{\theta} = (1-u)^{-1/\alpha}

Langkah 4: Selesaikan untuk xx:

x=θ[(1u)1/α1]x = \theta\left[(1-u)^{-1/\alpha} - 1\right]

Langkah 5: Karena 1U=dU1-U \overset{d}{=} U, bentuk alternatif: x=θ(u1/α1)x = \theta(u^{-1/\alpha} - 1). Verifikasi: saat u0+u \to 0^+, x0+x \to 0^+; saat u1u \to 1^-, x+x \to +\infty. ✓

Dilarang
  1. Jangan menggunakan x=θln(U)x = -\theta\ln(U) dan x=θln(1U)x = -\theta\ln(1-U) sekaligus dalam simulasi yang sama untuk menghasilkan dua nilai berbeda — keduanya ekuivalen secara distribusional, bukan dua nilai independen. Untuk dua simulasi independen, gunakan dua bilangan seragam independen U1U_1 dan U2U_2.
  2. Jangan menggunakan UFk1U \leq F_{k-1} atau U<FkU < F_k (bukan Fk1<UFkF_{k-1} < U \leq F_k) pada distribusi diskrit — konvensi ketidaksamaan yang keliru mengubah probabilitas titik yang dihasilkan.
  3. Jangan menerapkan rumus invers distribusi kontinu untuk bilangan seragam u=0u = 0 atau u=1u = 1 — nilainya tidak terdefinisi (menghasilkan -\infty atau ++\infty); dalam praktik bilangan seragam dihasilkan pada (0,1)(0,1) terbuka.

Section 4 — Contoh Soal

Soal A — Fundamental

Bilangan acak seragam berikut dihasilkan: u1=0.30u_1 = 0.30, u2=0.75u_2 = 0.75, u3=0.92u_3 = 0.92. Simulasikan tiga nilai dari distribusi Eksponensial dengan mean θ=500\theta = 500. Gunakan formula x=θln(1u)x = -\theta\ln(1-u).

Solusi Soal A

Pendekatan: Substitusikan langsung setiap uiu_i ke formula invers CDF Eksponensial x=θln(1u)x = -\theta\ln(1-u).

1. Identifikasi Variabel

  • Distribusi: Eksponensial(θ=500\theta = 500), F(x)=1ex/500F(x) = 1 - e^{-x/500}
  • Bilangan seragam: u1=0.30u_1 = 0.30, u2=0.75u_2 = 0.75, u3=0.92u_3 = 0.92
  • Formula invers: x=500ln(1u)x = -500\ln(1-u)

2. Identifikasi Distribusi / Model Eksponensial kontinu dengan invers CDF tertutup. Metode inversi langsung tanpa aproksimasi.

3. Setup Persamaan

xi=500ln(1ui),i=1,2,3x_i = -500 \cdot \ln(1 - u_i), \quad i = 1, 2, 3

4. Eksekusi Aljabar

x1=500ln(10.30)=500ln(0.70)=500×(0.35667)=178.3x_1 = -500\ln(1 - 0.30) = -500\ln(0.70) = -500 \times (-0.35667) = 178.3 x2=500ln(10.75)=500ln(0.25)=500×(1.38629)=693.1x_2 = -500\ln(1 - 0.75) = -500\ln(0.25) = -500 \times (-1.38629) = 693.1 x3=500ln(10.92)=500ln(0.08)=500×(2.52573)=1262.9x_3 = -500\ln(1 - 0.92) = -500\ln(0.08) = -500 \times (-2.52573) = 1262.9

5. Verification Semua nilai positif ✓ (support Eksponensial: x>0x > 0). x1<x2<x3x_1 < x_2 < x_3 konsisten dengan u1<u2<u3u_1 < u_2 < u_3 — metode inversi bersifat order-preserving ✓. Nilai x2=693.1θln4693x_2 = 693.1 \approx \theta \ln 4 \approx 693 (karena ln(1/0.25)=ln4\ln(1/0.25) = \ln 4) — masuk akal sebagai konfirmasi.

Hasil: x1178.3x_1 \approx 178.3, x2693.1x_2 \approx 693.1, x31262.9x_3 \approx 1262.9.

Exam Tips — Soal A

Target waktu: 2 menit. Common trap: Menggunakan x=θln(u)x = -\theta \ln(u) alih-alih x=θln(1u)x = -\theta\ln(1-u) — keduanya ekuivalen secara distribusional tetapi menghasilkan nilai numerik berbeda untuk uiu_i spesifik yang diberikan. Soal biasanya menetapkan salah satu formula; ikuti formula yang diminta soal. Shortcut: ln(0.25)=ln(1/4)=ln41.3863\ln(0.25) = \ln(1/4) = -\ln 4 \approx -1.3863; ln(0.08)2.526\ln(0.08) \approx -2.526.


Soal B — Exam-Typical

Variabel acak diskrit XX memiliki distribusi:

xx12345
P(X=x)P(X=x)0.100.250.350.200.10

Bilangan acak seragam yang dihasilkan adalah u1=0.08u_1 = 0.08, u2=0.43u_2 = 0.43, u3=0.91u_3 = 0.91. Simulasikan tiga nilai dari distribusi ini menggunakan metode inversi.

Solusi Soal B

Pendekatan: Bangun tabel CDF kumulatif, lalu tentukan nilai XX untuk setiap uiu_i dengan mencari interval (Fk1,Fk](F_{k-1}, F_k] yang memuat uiu_i.

1. Identifikasi Variabel

  • Distribusi diskrit dengan 5 nilai: x{1,2,3,4,5}x \in \{1, 2, 3, 4, 5\}
  • Probabilitas: p1=0.10,p2=0.25,p3=0.35,p4=0.20,p5=0.10p_1=0.10, p_2=0.25, p_3=0.35, p_4=0.20, p_5=0.10
  • Bilangan seragam: u1=0.08u_1=0.08, u2=0.43u_2=0.43, u3=0.91u_3=0.91

2. Identifikasi Distribusi / Model Distribusi diskrit — gunakan aturan X=xkX = x_k jika Fk1<uFkF_{k-1} < u \leq F_k.

3. Setup Persamaan

Bangun tabel CDF kumulatif:

kkxkx_kpkp_kFk=jkpjF_k = \sum_{j \leq k} p_jInterval (Fk1,Fk](F_{k-1}, F_k]
110.100.10(0.00,  0.10](0.00,\; 0.10]
220.250.35(0.10,  0.35](0.10,\; 0.35]
330.350.70(0.35,  0.70](0.35,\; 0.70]
440.200.90(0.70,  0.90](0.70,\; 0.90]
550.101.00(0.90,  1.00](0.90,\; 1.00]

4. Eksekusi Aljabar

Untuk u1=0.08u_1 = 0.08: Cari interval yang memuat 0.080.08.

0.00<0.080.10    X1=10.00 < 0.08 \leq 0.10 \implies X_1 = 1

Untuk u2=0.43u_2 = 0.43: Cari interval yang memuat 0.430.43.

0.35<0.430.70    X2=30.35 < 0.43 \leq 0.70 \implies X_2 = 3

Untuk u3=0.91u_3 = 0.91: Cari interval yang memuat 0.910.91.

0.90<0.911.00    X3=50.90 < 0.91 \leq 1.00 \implies X_3 = 5

5. Verification Cek: setiap uiu_i jatuh tepat di satu interval ✓ (interval-interval partisi (0,1](0,1] secara exhaustive). Proporsi hasil: dari 3 simulasi, nilai yang dihasilkan adalah 1, 3, 5 — tidak ada kesimpulan statistik dari 3 observasi, tetapi nilai mungkin ✓.

Hasil: X1=1X_1 = 1, X2=3X_2 = 3, X3=5X_3 = 5.

Exam Tips — Soal B

Target waktu: 3 menit. Common trap: Menggunakan Fk1u<FkF_{k-1} \leq u < F_k (pertidaksamaan terbalik) — ini mengubah nilai yang dihasilkan di batas interval. Konvensi standar adalah (Fk1,Fk](F_{k-1}, F_k]: batas kiri terbuka, batas kanan tertutup. Common trap kedua: Tidak membangun tabel CDF kumulatif terlebih dahulu dan mencoba “mengira” interval — selalu bangun tabel eksplisit. Shortcut: Mulai dari ujung kiri tabel dan gerakkan ke kanan sampai FkuF_k \geq u pertama kali — ini adalah prosedur “first kk such that FkuF_k \geq u.”


Soal C — Challenging

Besar klaim XX mengikuti distribusi campuran (mixture): dengan probabilitas 0.600.60, klaim berasal dari distribusi Eksponensial dengan mean 200200; dengan probabilitas 0.400.40, klaim berasal dari distribusi Pareto dengan α=3\alpha = 3 dan θ=1000\theta = 1000.

Bilangan acak seragam yang tersedia (gunakan secara berurutan): u1=0.55u_1 = 0.55 (untuk memilih komponen), u2=0.80u_2 = 0.80 (untuk simulasi dalam komponen).

Simulasikan satu nilai klaim menggunakan metode inversi dua-tahap.

Solusi Soal C

Pendekatan: Langkah 1 — gunakan u1u_1 untuk memilih komponen distribusi. Langkah 2 — gunakan u2u_2 untuk mensimulasikan nilai dari komponen terpilih menggunakan formula invers CDF masing-masing.

1. Identifikasi Variabel

  • Distribusi campuran: α1=0.60\alpha_1 = 0.60 (Eksponensial, θE=200\theta_E = 200), α2=0.40\alpha_2 = 0.40 (Pareto, αP=3\alpha_P = 3, θP=1000\theta_P = 1000)
  • u1=0.55u_1 = 0.55 untuk pemilihan komponen; u2=0.80u_2 = 0.80 untuk simulasi dalam komponen
  • Invers CDF Eksponensial: x=200ln(1u)x = -200\ln(1-u)
  • Invers CDF Pareto: x=1000[(1u)1/31]x = 1000\left[(1-u)^{-1/3} - 1\right]

2. Identifikasi Distribusi / Model Distribusi campuran dua komponen. Prosedur dua-tahap: pemilihan komponen (diskrit, berdasarkan αj\alpha_j) lalu simulasi dari komponen (kontinu, invers CDF).

3. Setup Persamaan

Tahap 1 — Pemilihan komponen:

Komponen 1 (Eksponensial) jika u1α1=0.60\text{Komponen 1 (Eksponensial) jika } u_1 \leq \alpha_1 = 0.60 Komponen 2 (Pareto) jika u1>α1=0.60\text{Komponen 2 (Pareto) jika } u_1 > \alpha_1 = 0.60

Tahap 2 — Simulasi dari komponen terpilih:

x=Fj1(u2),di mana j adalah komponen yang dipilihx = F_j^{-1}(u_2), \quad \text{di mana } j \text{ adalah komponen yang dipilih}

4. Eksekusi Aljabar

Tahap 1: Cek u1=0.55u_1 = 0.55 vs α1=0.60\alpha_1 = 0.60:

0.550.60    Pilih Komponen 1: Eksponensial(θ=200)0.55 \leq 0.60 \implies \text{Pilih Komponen 1: Eksponensial}(\theta = 200)

Tahap 2: Simulasikan dari Eksponensial menggunakan u2=0.80u_2 = 0.80:

x=200ln(10.80)=200ln(0.20)x = -200 \cdot \ln(1 - 0.80) = -200 \cdot \ln(0.20) ln(0.20)=ln ⁣(15)=ln51.60944\ln(0.20) = \ln\!\left(\frac{1}{5}\right) = -\ln 5 \approx -1.60944 x=200×(1.60944)=321.9x = -200 \times (-1.60944) = 321.9

5. Verification Komponen Eksponensial terpilih dengan peluang 60%60\% — benar bahwa u1=0.55<0.60u_1 = 0.55 < 0.60 memilih komponen ini ✓. Nilai x=321.9>0x = 321.9 > 0 sesuai support Eksponensial ✓. Sebagai perbandingan: jika u1=0.70>0.60u_1 = 0.70 > 0.60, komponen Pareto akan dipilih dan nilai klaim cenderung jauh lebih besar (distribusi Pareto ekor-berat) — ini konsisten dengan sifat campuran.

Hasil: Klaim disimulasikan dari komponen Eksponensial; x321.9x \approx 321.9.

Exam Tips — Soal C

Target waktu: 5 menit. Common trap terbesar: Menggunakan hanya satu bilangan seragam untuk kedua tahap — pemilihan komponen dan simulasi dalam komponen membutuhkan dua bilangan seragam independen. Soal biasanya menyediakan bilangan seragam secara berurutan; identifikasi mana untuk tahap 1 dan mana untuk tahap 2. Common trap kedua: Menggunakan u1>α1u_1 > \alpha_1 sebagai kondisi memilih Komponen 1 (terbalik) — konvensi: Komponen 1 dipilih jika u1α1u_1 \leq \alpha_1. Shortcut: Tulis tabel partisi kumulatif untuk komponen: Komponen 1 jika u(0,0.60]u \in (0, 0.60]; Komponen 2 jika u(0.60,1.00]u \in (0.60, 1.00].

Section 5 — Verifikasi & Sanity Check

Cek Konsistensi Range Nilai yang Disimulasikan

Nilai yang disimulasikan x=F1(u)x = F^{-1}(u) harus selalu berada dalam support distribusi target:

  • Eksponensial: x>0x > 0 untuk semua u(0,1)u \in (0,1) ✓ (karena θln(1u)>0-\theta\ln(1-u) > 0 untuk u>0u > 0)
  • Pareto: x>0x > 0 untuk semua u(0,1)u \in (0,1) ✓ (karena (1u)1/α>1(1-u)^{-1/\alpha} > 1 untuk u>0u > 0)
  • Diskrit: x{x1,x2,}x \in \{x_1, x_2, \ldots\} — hasil harus selalu berupa salah satu nilai yang mungkin ✓

Jika hasil simulasi di luar support, ada kesalahan dalam formula invers atau substitusi.

Cek Order-Preserving Property

Metode inversi bersifat order-preserving: jika u1<u2u_1 < u_2, maka F1(u1)F1(u2)F^{-1}(u_1) \leq F^{-1}(u_2). Gunakan ini untuk verifikasi cepat: ketika beberapa uiu_i diberikan dalam urutan menaik, nilai xix_i yang dihasilkan harus juga urut menaik (untuk distribusi kontinu). Jika tidak, ada kesalahan kalkulasi.

Metode Alternatif — Simulasi Normal via Box-Muller

Untuk distribusi Normal standar ZN(0,1)Z \sim N(0,1) yang tidak memiliki invers CDF tertutup, gunakan transformasi Box-Muller sebagai alternatif metode inversi:

Z1=2lnU1cos(2πU2),Z2=2lnU1sin(2πU2)Z_1 = \sqrt{-2\ln U_1} \cos(2\pi U_2), \quad Z_2 = \sqrt{-2\ln U_1} \sin(2\pi U_2)

di mana U1,U2Uniform(0,1)U_1, U_2 \sim \text{Uniform}(0,1) independen. Hasilnya Z1,Z2Z_1, Z_2 adalah dua nilai Normal standar independen. Untuk Normal dengan mean μ\mu dan standar deviasi σ\sigma: X=μ+σZX = \mu + \sigma Z.

Section 6 — Visualisasi Mental

Visualisasi Metode Inversi — Distribusi Kontinu:

CDF F(x)
  1.0 ─────────────────────────────────── ←  u₃ = 0.92 ─── x₃ = F⁻¹(0.92)
      │                             ╱
      │                        ╱╱╱
  0.75 ──────────────────── u₂ = 0.75 ──── x₂ = F⁻¹(0.75)
      │                 ╱╱╱╱
      │            ╱╱╱╱
  0.30 ──── u₁=0.30 ─────────────────────── x₁ = F⁻¹(0.30)
      │  ╱╱╱╱╱╱╱╱╱╱╱
      │╱╱╱
  0.0 └────────────────────────────────→ x
       x₁        x₂              x₃

 ← Bilangan seragam u (sumbu-y) diproyeksikan ke kiri
    lalu ke bawah mengikuti kurva CDF untuk mendapat x

Visualisasi Metode Inversi — Distribusi Diskrit:

CDF F(x) (step function)
  1.00 ──────────────────────────────── ───●
       │                         u₃=0.91 ↓ (jatuh di (0.90, 1.00] → X=5)
  0.90 ──────────────────────────── ───●
       │                u₂=0.43 ↓ (jatuh di (0.35, 0.70] → X=3)
  0.70 ──────────────────── ───────●

  0.35 ─────────── ────────●
       │ u₁=0.08 ↓ (jatuh di (0.00, 0.10] → X=1)
  0.10 ──── ────●
  0.00 └──────────────────────────────→ x
              1    2    3    4    5

Hubungan Visual ↔ Rumus

Elemen VisualKomponen Rumus
Garis horizontal dari uu ke kurva CDFOperasi FX1(u)F_X^{-1}(u): temukan xx sehingga FX(x)=uF_X(x) = u
Garis vertikal dari kurva CDF ke sumbu-xxNilai yang disimulasikan x=F1(u)x = F^{-1}(u)
“Lompatan” tangga pada distribusi diskritProbabilitas titik pk=FkFk1p_k = F_k - F_{k-1}
Panjang interval (Fk1,Fk](F_{k-1}, F_k]Proporsi bilangan uu yang menghasilkan nilai xkx_k
Titik pada kurva CDF(x,F(x))(x, F(x)) — hubungan langsung antara nilai dan probabilitas kumulatifnya

Section 7 — Jebakan Umum

Kesalahan Parametrisasi — Dua Bentuk Formula Eksponensial

Formula invers CDF Eksponensial memiliki dua bentuk ekuivalen secara distribusional tetapi tidak ekuivalen numerik untuk nilai uu spesifik:

  • x=θln(1u)x = -\theta\ln(1-u): gunakan ini jika soal menyatakan uu adalah CDF value
  • x=θln(u)x = -\theta\ln(u): gunakan ini jika soal menggunakan notasi “survival” atau 1u1-u

Salah: Menggabungkan keduanya — misalnya menghitung θln(u)-\theta\ln(u) ketika soal memberikan uu dan meminta formula θln(1u)-\theta\ln(1-u). Benar: Identifikasi terlebih dahulu formula mana yang diminta soal, lalu gunakan konsisten untuk semua uiu_i.

Kesalahan Konseptual — 4 Miskonsepsi Umum
  1. “Metode inversi hanya untuk distribusi kontinu” — Salah. Metode inversi (menggunakan generalized inverse) berlaku juga untuk distribusi diskrit, dengan prosedur berbeda: cari kk terkecil sehingga FkuF_k \geq u.
  2. “Satu bilangan seragam cukup untuk simulasi distribusi campuran” — Salah. Distribusi campuran mm-komponen membutuhkan dua bilangan seragam independen: satu untuk memilih komponen, satu untuk mensimulasikan dari komponen tersebut.
  3. UU dan 1U1-U menghasilkan dua simulasi independen” — Salah. UU dan 1U1-U adalah fungsi satu sama lain — tidak independen. Untuk dua simulasi independen, butuh dua UU yang di-generate terpisah.
  4. “Metode inversi selalu lebih baik dari metode lain” — Tidak selalu. Untuk distribusi Normal dan Gamma, tidak ada invers CDF tertutup; metode lain (Box-Muller, acceptance-rejection) lebih efisien.
Kesalahan Interpretasi Soal
  • “Simulate from Exponential with mean 200”θ=200\theta = 200 (mean = θ\theta untuk Eksponensial) → x=200ln(1u)x = -200\ln(1-u).
  • “Simulate from Pareto with α=3\alpha=3, θ=1000\theta=1000 → gunakan x=1000[(1u)1/31]x = 1000[(1-u)^{-1/3} - 1]; perhatikan eksponen 1/α=1/3-1/\alpha = -1/3.
  • “Use the following uniform random numbers in order” → bilangan seragam pertama selalu untuk langkah pertama (pemilihan komponen jika campuran, atau simulasi jika tunggal). Jangan menukar urutan.
  • “Simulate three values” → butuh tiga bilangan seragam berbeda; jangan menggunakan ulang uiu_i yang sama.
Red Flags — Keyword Pemicu Prosedur Khusus
  • “Mixture distribution” atau “dengan probabilitas pp, berasal dari…” → prosedur dua-tahap; butuh dua bilangan seragam independen.
  • “Discrete distribution” dengan tabel probabilitas → bangun tabel CDF kumulatif; gunakan aturan (Fk1,Fk](F_{k-1}, F_k].
  • “Pareto with parameters α\alpha and θ\theta → eksponen 1/α-1/\alpha dalam formula invers; jangan lupa tanda minus.
  • “Weibull with shape τ\tau and scale θ\theta → eksponen 1/τ1/\tau (positif, bukan negatif) dalam formula invers.
  • “Use uu directly” vs “use 1u1-u → baca soal secara cermat; kedua konvensi digunakan dalam literatur dan keduanya valid asal konsisten.

Section 8 — Ringkasan Eksekutif

Must-Remember

1. Teorema dasar (Probability Integral Transform):

X=FX1(U)FXjika UUniform(0,1)X = F_X^{-1}(U) \sim F_X \quad \text{jika } U \sim \text{Uniform}(0,1)

2. Invers CDF Eksponensial(θ\theta):

x=θln(1u)(ekuivalen: x=θlnu)x = -\theta\ln(1-u) \quad \text{(ekuivalen: } x = -\theta\ln u\text{)}

3. Invers CDF Pareto(α,θ\alpha, \theta):

x=θ[(1u)1/α1]x = \theta\left[(1-u)^{-1/\alpha} - 1\right]

4. Distribusi Diskrit — aturan pemilihan nilai:

X=xkjika Fk1<UFkX = x_k \quad \text{jika } F_{k-1} < U \leq F_k

5. Distribusi Campuran — prosedur dua-tahap:

Tahap 1: pilih komponen j dengan U1;Tahap 2: simulasikan XFj dengan U2\text{Tahap 1: pilih komponen } j \text{ dengan } U_1; \quad \text{Tahap 2: simulasikan } X \sim F_j \text{ dengan } U_2

Kapan Digunakan

  • Mensimulasikan nilai dari distribusi dengan invers CDF tertutup (Eksponensial, Pareto, Weibull, Uniform, dll.).
  • Mensimulasikan nilai dari distribusi diskrit dengan tabel probabilitas yang diberikan.
  • Mensimulasikan dari distribusi campuran (mixture) dengan dua bilangan seragam independen.
  • Trigger keywords: “simulate using inversion method”, “use the following uniform random numbers”, “inversion method for continuous/discrete distribution”.

Kapan TIDAK Boleh Digunakan

  • Distribusi Normal, Gamma, Beta — tidak memiliki invers CDF tertutup; gunakan metode numerik, Box-Muller (Normal), atau acceptance-rejection.
  • Ketika soal secara eksplisit meminta metode lain (acceptance-rejection, composition method).
  • Untuk distribusi yang sangat kompleks di mana evaluasi F1F^{-1} numerik lebih mahal dari metode alternatif.

Quick Decision Tree

graph TD
    A["Simulasikan nilai dari distribusi F"] --> B{"Jenis distribusi?"}
    B -- "Kontinu,<br>invers CDF tertutup" --> C{"Distribusi apa?"}
    B -- "Diskrit" --> D["Bangun tabel CDF kumulatif<br>F_0=0, F_k = sum p_j<br>X = x_k jika F_(k-1) < U <= F_k"]
    B -- "Campuran" --> E["Dua tahap:<br>U1 pilih komponen j<br>U2 simulasikan dari F_j"]
    C -- "Eksponensial(theta)" --> F["x = -theta * ln(1-u)<br>atau x = -theta * ln(u)"]
    C -- "Pareto(alpha, theta)" --> G["x = theta * [(1-u)^(-1/alpha) - 1]"]
    C -- "Weibull(tau, theta)" --> H["x = theta * [-ln(1-u)]^(1/tau)"]
    C -- "Normal / Gamma" --> I["Tidak ada invers tertutup<br>Gunakan Box-Muller / numerik"]
    F --> J["Verifikasi: x dalam support<br>order-preserving check"]
    G --> J
    H --> J
    D --> J
    E --> J
    I --> J

Follow-up Options
  1. “Berikan contoh soal variasi simulasi distribusi Weibull dan Lognormal menggunakan metode inversi”
  2. “Jelaskan hubungan 8.2 Inversion Method for Random Variables dengan 8.3 Permutation Test and Bootstrap
  3. “Buat flashcard 1-halaman untuk semua rumus invers CDF yang diuji di TA2”

📖 Ref: Klugman, Panjer & Willmot (2019), Loss Models 5th ed., Bab 19.3; Tse (2009), Bab 14 | 🗓️ 2026-04-19 | #TA2 #InversionMethod #Simulation