AktuNotes
← Kembali
TA2 · Materi 8.1

Monte Carlo Simulation Concepts

Medium Bobot: 5–10% (bersama Topik 8) Klugman, Panjer & Willmot (2019), Loss Models 5th ed., Bab 19.3; Tse (2009), Bab 14 & 15
TA2SimulasiMonteCarloTeoriRisiko

📊 8.1 — Monte Carlo Simulation Concepts

Ringkasan Cepat

Topik: Konsep Simulasi Monte Carlo | Bobot: ~5–10% (Topik 8) | Difficulty: Medium Ref: Klugman et al. (2019), Bab 19.3; Tse (2009), Bab 14 & 15 | Prereq: 4.4 Aggregate Distribution Approximation, 6.1 Parameter Estimation Methods


Section 0 — Pemetaan Topik

Topik TA2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Simulasi8.1Menjelaskan konsep simulasi Monte Carlo; mengestimasi jumlah simulasi nn yang diperlukan untuk mencapai tingkat kesalahan ε\varepsilon dan derajat kepercayaan 1α1-\alpha tertentu5–10% (bersama Topik 8)Medium4.4 Aggregate Distribution Approximation, 6.1 Parameter Estimation Methods8.2 Inversion Method for Random Variables, 8.3 Permutation Test and BootstrapKlugman et al. (2019), Bab 19.3; Tse (2009), Bab 14 & 15

Section 1 — Intuisi

Bayangkan seorang aktuaris diminta menghitung probabilitas bahwa total klaim sebuah portofolio asuransi dalam satu tahun melebihi Rp 10 miliar. Model distribusinya kompleks — campuran berbagai jenis polis dengan distribusi klaim yang berbeda — sehingga tidak ada formula analitik tertutup yang bisa digunakan. Apa yang dilakukan aktuaris tersebut? Ia “memainkan” skenario ini ribuan kali di komputer: setiap putaran, ia mensimulasikan frekuensi klaim acak, lalu mensimulasikan besar masing-masing klaim, menjumlahkan semuanya, dan mencatat apakah total melebihi Rp 10 miliar. Setelah sepuluh ribu putaran, ia menghitung berapa persen simulasi yang melampaui ambang batas tersebut — itulah estimasi probabilitasnya. Inilah inti simulasi Monte Carlo.

Nama “Monte Carlo” diambil dari kasino terkenal di Monaco, tempat keberuntungan dan angka acak mendominasi. Metode ini dikembangkan pada era perang dingin untuk masalah fisika nuklir yang terlalu kompleks untuk diselesaikan secara analitik, lalu menyebar ke hampir semua bidang sains kuantitatif — termasuk aktuaria. Kekuatan utamanya adalah universalitas: selama kita bisa mensimulasikan satu skenario acak, kita bisa memperkirakan hampir semua kuantitas probabilistik yang diinginkan, seberapa kompleks pun modelnya.

Yang membuat konsep ini penting dalam ujian TA2 bukan sekadar “jalankan simulasi sebanyak-banyaknya” — tapi pertanyaan yang jauh lebih bernilai: berapa banyak simulasi yang cukup? Menjalankan satu juta iterasi membutuhkan sumber daya komputasi besar; terlalu sedikit iterasi menghasilkan estimasi yang tidak akurat. Ada formula eksak yang menghubungkan jumlah simulasi nn, tingkat kesalahan yang dapat ditoleransi ε\varepsilon, dan derajat kepercayaan 1α1-\alpha — dan itulah yang paling sering diujikan dalam soal TA2.


Section 2 — Definisi Formal

Definisi Matematis — Estimator Monte Carlo dan Kesalahannya

Misalkan θ=E[g(X)]\theta = E[g(X)] adalah kuantitas yang ingin diestimasi, dan g(X1),g(X2),,g(Xn)g(X_1), g(X_2), \ldots, g(X_n) adalah nn hasil simulasi independen. Estimator Monte Carlo adalah:

θ^n=1nk=1ng(Xk)\hat{\theta}_n = \frac{1}{n} \sum_{k=1}^{n} g(X_k)

Jumlah simulasi minimum yang diperlukan agar θ^nθε|\hat{\theta}_n - \theta| \leq \varepsilon dengan probabilitas 1α\geq 1 - \alpha adalah:

n(zα/2σε)2n \geq \left( \frac{z_{\alpha/2} \cdot \sigma}{\varepsilon} \right)^2

di mana σ2=Var(g(X))\sigma^2 = \text{Var}(g(X)) dan zα/2z_{\alpha/2} adalah nilai kritis distribusi Normal standar.

Tabel Variabel & Parameter

SimbolMaknaCatatan
θ\thetaKuantitas yang diestimasiBisa berupa E[X]E[X], P(X>d)P(X > d), VaR, TVaR, atau fungsi lain
g(X)g(X)Fungsi dari variabel acak yang disimulasikanMisalnya g(X)=Xg(X) = X untuk mean, g(X)=1X>dg(X) = \mathbf{1}_{X > d} untuk probabilitas
nnJumlah simulasi (iterasi)Harus cukup besar agar estimasi akurat
θ^n\hat{\theta}_nEstimator Monte CarloRata-rata aritmetika dari nn replikasi
ε\varepsilonTingkat kesalahan yang ditoleransi (half-width)ε>0\varepsilon > 0; semakin kecil, semakin banyak simulasi diperlukan
1α1 - \alphaDerajat kepercayaanNilai umum: 90% (α=0.10\alpha=0.10), 95% (α=0.05\alpha=0.05), 99% (α=0.01\alpha=0.01)
α\alphaTingkat signifikansiα=1(1α)\alpha = 1 - (1-\alpha)
zα/2z_{\alpha/2}Nilai kritis Normal standar (dua sisi)z0.05=1.645z_{0.05} = 1.645 (90%), z0.025=1.960z_{0.025} = 1.960 (95%), z0.005=2.576z_{0.005} = 2.576 (99%)
σ2\sigma^2Variansi dari g(X)g(X)Sering tidak diketahui — diestimasi dari simulasi awal atau diturunkan secara analitik
σθ^2\sigma^2_{\hat{\theta}}Variansi estimator θ^n\hat{\theta}_nσθ^2=σ2/n\sigma^2_{\hat{\theta}} = \sigma^2 / n; menurun ketika nn membesar

Rumus Utama

1. Estimator Monte Carlo — Rata-rata Replikasi:

θ^n=1nk=1ng(Xk)\hat{\theta}_n = \frac{1}{n} \sum_{k=1}^{n} g(X_k)

Label: Berdasarkan Hukum Bilangan Besar, θ^nθ\hat{\theta}_n \to \theta ketika nn \to \infty. Ini justifikasi teoritis utama simulasi Monte Carlo.

2. Variansi Estimator Monte Carlo:

Var(θ^n)=σ2n=Var(g(X))n\text{Var}(\hat{\theta}_n) = \frac{\sigma^2}{n} = \frac{\text{Var}(g(X))}{n}

Label: Standar error turun proporsional dengan 1/n1/\sqrt{n} — menggandakan akurasi membutuhkan 4× lebih banyak simulasi.

3. Jumlah Simulasi Minimum — Formula Utama TA2:

n(zα/2σε)2n \geq \left( \frac{z_{\alpha/2} \cdot \sigma}{\varepsilon} \right)^2

Label: Ini adalah formula terpenting di Topik 8.1. Diturunkan dari interval kepercayaan: P(θ^nθε)1αP(|\hat{\theta}_n - \theta| \leq \varepsilon) \geq 1-\alpha menggunakan CLT.

4. Kasus Khusus — Estimasi Probabilitas p=P(A)p = P(A):

Ketika g(X)=1Ag(X) = \mathbf{1}_A (indikator kejadian AA), maka σ2=p(1p)\sigma^2 = p(1-p) dan:

nzα/22p(1p)ε2n \geq \frac{z_{\alpha/2}^2 \cdot p(1-p)}{\varepsilon^2}

Karena pp tidak diketahui, gunakan batas konservatif p(1p)1/4p(1-p) \leq 1/4:

nzα/224ε2n \geq \frac{z_{\alpha/2}^2}{4\varepsilon^2}

Label: Batas konservatif ini memaksimalkan p(1p)p(1-p) pada p=0.5p = 0.5. Selalu gunakan ini jika pp tidak diketahui sama sekali.

5. Interval Kepercayaan Monte Carlo:

θ^n±zα/2σ^n\hat{\theta}_n \pm z_{\alpha/2} \cdot \frac{\hat{\sigma}}{\sqrt{n}}

Label: Interval kepercayaan untuk θ\theta berdasarkan nn simulasi. σ^\hat{\sigma} adalah standar deviasi sampel dari {g(Xk)}\{g(X_k)\}.

6. Lebar Interval Kepercayaan (Half-Width):

ε=zα/2σnn=(zα/2σε)2\varepsilon = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \quad \Longleftrightarrow \quad n = \left(\frac{z_{\alpha/2} \cdot \sigma}{\varepsilon}\right)^2

Label: Hubungan antara nn, ε\varepsilon, dan zα/2z_{\alpha/2} — tiga besaran yang selalu muncul bersama dalam soal.

Asumsi Eksplisit

  1. Independensi replikasi: Setiap simulasi X1,X2,,XnX_1, X_2, \ldots, X_n harus independen dan identik terdistribusi (i.i.d.) — dipastikan dengan generator bilangan acak yang tepat.
  2. Hukum Bilangan Besar berlaku: E[g(X)]<E[\lvert g(X) \rvert] < \infty sehingga θ^nθ\hat{\theta}_n \to \theta hampir pasti.
  3. CLT berlaku: Var(g(X))=σ2<\text{Var}(g(X)) = \sigma^2 < \infty, sehingga distribusi θ^n\hat{\theta}_n mendekati Normal untuk nn cukup besar — ini yang membenarkan penggunaan zα/2z_{\alpha/2}.
  4. σ2\sigma^2 diketahui atau dapat diestimasi: Dalam praktik, σ2\sigma^2 diestimasi dari batch simulasi awal (pilot run), atau dihitung secara analitik untuk kasus sederhana.
  5. Generator bilangan acak berkualitas: Bilangan acak seragam U(0,1)U(0,1) yang digunakan harus memiliki periode yang sangat panjang dan distribusi yang benar-benar seragam — implementasi bergantung pada perangkat lunak.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus — Mengapa Formula n(zα/2σ/ε)2n \geq (z_{\alpha/2}\sigma/\varepsilon)^2 Muncul Estimator Monte Carlo θ^n\hat{\theta}_n adalah rata-rata dari nn variabel acak i.i.d. Berdasarkan Central Limit Theorem (CLT), untuk nn cukup besar:
θ^nθσ/nN(0,1)\frac{\hat{\theta}_n - \theta}{\sigma/\sqrt{n}} \approx N(0,1)

Syarat akurasi P(θ^nθε)1αP(|\hat{\theta}_n - \theta| \leq \varepsilon) \geq 1 - \alpha ekuivalen dengan meminta lebar half-width interval kepercayaan tidak melebihi ε\varepsilon. Karena half-width = zα/2σ/nz_{\alpha/2} \cdot \sigma/\sqrt{n}, maka zα/2σ/nεz_{\alpha/2} \cdot \sigma/\sqrt{n} \leq \varepsilon, dan mengalikan kedua sisi dengan n/ε\sqrt{n}/\varepsilon lalu dikuadratkan langsung menghasilkan formula n(zα/2σ/ε)2n \geq (z_{\alpha/2}\sigma/\varepsilon)^2.

Hubungan Kritis Antar Tiga Besaran

Formula n=(zα/2σ/ε)2n = (z_{\alpha/2}\sigma/\varepsilon)^2 menghubungkan tiga besaran secara fundamental:

  • Naikkan derajat kepercayaan (1α1-\alpha naik → zα/2z_{\alpha/2} naik) → nn harus lebih besar secara kuadratik.
  • Perketat toleransi kesalahan (ε\varepsilon turun setengah) → nn harus naik empat kali lipat (karena ε\varepsilon dikuadratkan di penyebut).
  • Variansi lebih besar (σ2\sigma^2 naik) → nn harus lebih besar — model yang lebih “berisik” memerlukan lebih banyak simulasi.

Implikasi praktis: mengurangi ε\varepsilon dari 0.01 ke 0.001 (10× lebih ketat) membutuhkan 100× lebih banyak simulasi. Ini menjelaskan mengapa simulasi sangat mahal secara komputasi untuk presisi tinggi.

Derivasi Step-by-Step: Formula Jumlah Simulasi Minimum

Langkah 1 — Mulai dari definisi interval kepercayaan:

Kita ingin:

P ⁣(θ^nθε)1αP\!\left(|\hat{\theta}_n - \theta| \leq \varepsilon\right) \geq 1 - \alpha

Langkah 2 — Standarisasi menggunakan CLT:

P ⁣(θ^nθσ/nεσ/n)1αP\!\left(\left|\frac{\hat{\theta}_n - \theta}{\sigma/\sqrt{n}}\right| \leq \frac{\varepsilon}{\sigma/\sqrt{n}}\right) \geq 1 - \alpha

Karena bagian kiri mendekati N(0,1)N(0,1):

P ⁣(Zεnσ)1αP\!\left(|Z| \leq \frac{\varepsilon\sqrt{n}}{\sigma}\right) \geq 1 - \alpha

Langkah 3 — Terapkan definisi zα/2z_{\alpha/2}:

P(Zzα/2)=1αP(|Z| \leq z_{\alpha/2}) = 1 - \alpha berdasarkan definisi nilai kritis. Syarat terpenuhi jika:

εnσzα/2\frac{\varepsilon\sqrt{n}}{\sigma} \geq z_{\alpha/2}

Langkah 4 — Isolasi nn:

nzα/2σε\sqrt{n} \geq \frac{z_{\alpha/2} \cdot \sigma}{\varepsilon} n(zα/2σε)2n \geq \left(\frac{z_{\alpha/2} \cdot \sigma}{\varepsilon}\right)^2

Langkah 5 — Terapkan ke estimasi probabilitas:

Jika g(X)=1Ag(X) = \mathbf{1}_A (indikator), maka Var(g(X))=p(1p)\text{Var}(g(X)) = p(1-p) karena g(X)Bernoulli(p)g(X) \sim \text{Bernoulli}(p). Substitusi:

nzα/22p(1p)ε2n \geq \frac{z_{\alpha/2}^2 \cdot p(1-p)}{\varepsilon^2}

Karena p(1p)14p(1-p) \leq \frac{1}{4} untuk semua p[0,1]p \in [0,1] (maksimum di p=0.5p=0.5):

nzα/224ε2(batas konservatif)n \geq \frac{z_{\alpha/2}^2}{4\varepsilon^2} \quad \text{(batas konservatif)}
Tiga Larangan Fatal dalam Soal Simulasi Monte Carlo
  1. JANGAN lupa mengkuadratkan seluruh ekspresi: n=(zα/2σ/ε)2n = (z_{\alpha/2}\sigma/\varepsilon)^2, bukan n=zα/2σ/εn = z_{\alpha/2}\sigma/\varepsilon. Kesalahan ini menghasilkan nn yang jauh terlalu kecil.
  2. JANGAN asumsikan ε\varepsilon adalah lebar penuh interval kepercayaan — ε\varepsilon adalah half-width (setengah lebar). Jika soal menyebut “lebar interval adalah 2ε2\varepsilon”, gunakan ε\varepsilon (setengahnya) dalam formula.
  3. JANGAN gunakan zαz_\alpha (satu sisi) saat soal menyebut derajat kepercayaan dua sisi. Untuk kepercayaan 95%95\% gunakan z0.025=1.96z_{0.025} = 1.96, bukan z0.05=1.645z_{0.05} = 1.645.

Section 4 — Contoh Soal

Soal A — Fundamental

Soal: Seorang aktuaris ingin mengestimasi probabilitas bahwa klaim agregat melebihi suatu batas tertentu menggunakan simulasi Monte Carlo. Ia ingin kesalahannya tidak melebihi ε=0.02\varepsilon = 0.02 dengan derajat kepercayaan 95%95\%. Berapa jumlah simulasi minimum yang diperlukan? Gunakan batas konservatif karena probabilitas yang sesungguhnya tidak diketahui.

Solusi Soal A

Pendekatan: Gunakan formula jumlah simulasi minimum untuk estimasi probabilitas dengan batas konservatif p(1p)1/4p(1-p) \leq 1/4.

1. Identifikasi Variabel

  • ε=0.02\varepsilon = 0.02 (half-width toleransi kesalahan)
  • Derajat kepercayaan =95%= 95\%, sehingga α=0.05\alpha = 0.05, zα/2=z0.025=1.96z_{\alpha/2} = z_{0.025} = 1.96
  • pp tidak diketahui → gunakan batas konservatif p(1p)1/4p(1-p) \leq 1/4, yaitu σ21/4\sigma^2 \leq 1/4

2. Identifikasi Distribusi / Model Estimasi probabilitas p=P(A)p = P(A) menggunakan indikator g(X)=1ABernoulli(p)g(X) = \mathbf{1}_A \sim \text{Bernoulli}(p). Variansi: σ2=p(1p)\sigma^2 = p(1-p).

3. Setup Persamaan

nzα/22p(1p)ε2zα/224ε2n \geq \frac{z_{\alpha/2}^2 \cdot p(1-p)}{\varepsilon^2} \leq \frac{z_{\alpha/2}^2}{4\varepsilon^2}

4. Eksekusi Aljabar

n(1.96)24×(0.02)2=3.84164×0.0004=3.84160.0016=2,401n \geq \frac{(1.96)^2}{4 \times (0.02)^2} = \frac{3.8416}{4 \times 0.0004} = \frac{3.8416}{0.0016} = 2{,}401

5. Verification Cross-check dengan pendekatan alternatif: n=(zα/2/2ε)2=(1.96/(2×0.02))2=(1.96/0.04)2=492=2,401n = (z_{\alpha/2}/2\varepsilon)^2 = (1.96/(2 \times 0.02))^2 = (1.96/0.04)^2 = 49^2 = 2{,}401. Konsisten.

Verifikasi arah: memperkecil ε\varepsilon (lebih akurat) → nn lebih besar. Memperbesar 1α1-\alpha (lebih yakin) → nn lebih besar. Masuk akal.

Hasil: Diperlukan minimal n=2,401n = 2{,}401 simulasi untuk memperoleh estimasi probabilitas dengan kesalahan 0.02\leq 0.02 dan derajat kepercayaan 95%95\%.

Exam Tips — Soal A

Target waktu: 2–3 menit. Common trap: Menggunakan z0.05=1.645z_{0.05} = 1.645 (nilai satu sisi) untuk kepercayaan 95%95\% alih-alih z0.025=1.96z_{0.025} = 1.96 (dua sisi). Shortcut: Untuk kasus probabilitas tanpa informasi tambahan, formula ringkasnya adalah n=(zα/2)2/(4ε2)n = (z_{\alpha/2})^2 / (4\varepsilon^2) — hafal ini.


Soal B — Exam-Typical

Soal: Klaim individual berdistribusi Eksponensial dengan mean μ=1,000\mu = 1{,}000. Seorang aktuaris ingin mengestimasi E[X]E[X] menggunakan simulasi Monte Carlo dengan kesalahan tidak melebihi ε=50\varepsilon = 50 (dalam satuan yang sama dengan klaim) dan derajat kepercayaan 90%90\%.

(a) Hitung jumlah simulasi minimum yang diperlukan. (b) Jika aktuaris ingin memperketat toleransi menjadi ε=25\varepsilon = 25, berapa simulasi yang kini dibutuhkan? (c) Bandingkan hasilnya dan jelaskan pola yang terlihat.

Solusi Soal B

Pendekatan: Gunakan σ2=μ2\sigma^2 = \mu^2 untuk distribusi Eksponensial (variansi = mean kuadrat), lalu terapkan formula jumlah simulasi minimum.

1. Identifikasi Variabel

  • Distribusi: Eksponensial(μ=1,000\mu = 1{,}000) → σ2=μ2=1,0002=1,000,000\sigma^2 = \mu^2 = 1{,}000^2 = 1{,}000{,}000, σ=1,000\sigma = 1{,}000
  • Derajat kepercayaan =90%= 90\%α=0.10\alpha = 0.10, zα/2=z0.05=1.645z_{\alpha/2} = z_{0.05} = 1.645
  • (a) ε=50\varepsilon = 50; (b) ε=25\varepsilon = 25

2. Identifikasi Distribusi / Model g(X)=Xg(X) = X, sehingga θ=E[X]=μ=1,000\theta = E[X] = \mu = 1{,}000 dan σ2=Var(X)=μ2=1,000,000\sigma^2 = \text{Var}(X) = \mu^2 = 1{,}000{,}000 untuk Eksponensial.

3. Setup Persamaan

n(zα/2σε)2=(1.645×1,000ε)2n \geq \left(\frac{z_{\alpha/2} \cdot \sigma}{\varepsilon}\right)^2 = \left(\frac{1.645 \times 1{,}000}{\varepsilon}\right)^2

4. Eksekusi Aljabar

(a) ε=50\varepsilon = 50:

n(1.645×1,00050)2=(1,64550)2=(32.9)2=1,082.41n \geq \left(\frac{1.645 \times 1{,}000}{50}\right)^2 = \left(\frac{1{,}645}{50}\right)^2 = (32.9)^2 = 1{,}082.41

Karena nn harus bilangan bulat: nmin=1,083n_{\min} = 1{,}083.

(b) ε=25\varepsilon = 25 (diperketat 2×):

n(1.645×1,00025)2=(1,64525)2=(65.8)2=4,329.64n \geq \left(\frac{1.645 \times 1{,}000}{25}\right)^2 = \left(\frac{1{,}645}{25}\right)^2 = (65.8)^2 = 4{,}329.64

nmin=4,330n_{\min} = 4{,}330.

(c) Perbandingan dan pola:

nbna=4,3301,0834=(5025)2\frac{n_b}{n_a} = \frac{4{,}330}{1{,}083} \approx 4 = \left(\frac{50}{25}\right)^2

Ketika ε\varepsilon dikurangi setengah, nn harus naik empat kali lipat — karena n1/ε2n \propto 1/\varepsilon^2.

5. Verification Cek arah: ε\varepsilon lebih kecil → nn lebih besar. Rasio nb/na=4=(50/25)2n_b/n_a = 4 = (50/25)^2 — konsisten dengan nε2n \propto \varepsilon^{-2}.

Hasil: (a) nmin=1,083n_{\min} = 1{,}083; (b) nmin=4,330n_{\min} = 4{,}330; (c) memperketat ε\varepsilon 2× membutuhkan 4× lebih banyak simulasi.

Exam Tips — Soal B

Target waktu: 3–4 menit. Common trap: (1) Menggunakan σ2=μ\sigma^2 = \mu untuk Eksponensial — ini keliru; variansi Eksponensial adalah μ2\mu^2 bukan μ\mu. (2) Lupa membulatkan nn ke atas (ceiling) — nn selalu bilangan bulat dan harus memenuhi \geq, jadi selalu bulatkan ke atas. Shortcut: Untuk Eksponensial, σ=μ\sigma = \mu, sehingga n=(zα/2μ/ε)2n = (z_{\alpha/2} \mu / \varepsilon)^2 — substitusi langsung.


Soal C — Challenging

Soal: Seorang aktuaris melakukan simulasi Monte Carlo untuk mengestimasi P(S>5,000)P(S > 5{,}000) di mana SS adalah klaim agregat tahunan. Dari pilot run 500 simulasi, diperoleh 85 replikasi di mana S>5,000S > 5{,}000.

(a) Hitung estimasi Monte Carlo untuk P(S>5,000)P(S > 5{,}000) dan buat interval kepercayaan 99%99\%. (b) Berdasarkan estimasi pp dari pilot run, hitung jumlah total simulasi yang diperlukan agar half-width interval kepercayaan 99%99\% tidak melebihi 0.010.01. (c) Bandingkan dengan batas konservatif (tanpa estimasi pp). Jelaskan implikasi praktisnya.

Solusi Soal C

Pendekatan: Gunakan hasil pilot run untuk mengestimasi pp dan σ2=p(1p)\sigma^2 = p(1-p), lalu terapkan formula interval kepercayaan dan jumlah simulasi.

1. Identifikasi Variabel

  • Pilot run: n0=500n_0 = 500, jumlah sukses = 85
  • p^=85/500=0.17\hat{p} = 85/500 = 0.17
  • Derajat kepercayaan 99%99\%α=0.01\alpha = 0.01, zα/2=z0.005=2.576z_{\alpha/2} = z_{0.005} = 2.576
  • Target: ε=0.01\varepsilon = 0.01 (half-width)

2. Identifikasi Distribusi / Model g(Xk)=1Sk>5000Bernoulli(p)g(X_k) = \mathbf{1}_{S_k > 5000} \sim \text{Bernoulli}(p). Estimasi pp dari pilot run: p^=0.17\hat{p} = 0.17. Estimasi variansi: σ^2=p^(1p^)=0.17×0.83=0.1411\hat{\sigma}^2 = \hat{p}(1-\hat{p}) = 0.17 \times 0.83 = 0.1411.

3. Setup Persamaan

(a) Interval kepercayaan dari pilot run:

p^±zα/2p^(1p^)n0\hat{p} \pm z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n_0}}

(b) Jumlah simulasi menggunakan p^\hat{p}:

nzα/22p^(1p^)ε2n \geq \frac{z_{\alpha/2}^2 \cdot \hat{p}(1-\hat{p})}{\varepsilon^2}

(c) Batas konservatif (pp tidak diketahui):

nzα/224ε2n \geq \frac{z_{\alpha/2}^2}{4\varepsilon^2}

4. Eksekusi Aljabar

(a) Interval kepercayaan 99%99\% dari pilot run:

SE=0.1411500=0.0002822=0.01680\text{SE} = \sqrt{\frac{0.1411}{500}} = \sqrt{0.0002822} = 0.01680 IC99%:0.17±2.576×0.01680=0.17±0.04328\text{IC}_{99\%}: \quad 0.17 \pm 2.576 \times 0.01680 = 0.17 \pm 0.04328 (0.1267,  0.2133)\Rightarrow (0.1267,\; 0.2133)

(b) nn menggunakan p^=0.17\hat{p} = 0.17, ε=0.01\varepsilon = 0.01, z0.005=2.576z_{0.005} = 2.576:

n(2.576)2×0.1411(0.01)2=6.635×0.14110.0001=0.93620.0001=9,362n \geq \frac{(2.576)^2 \times 0.1411}{(0.01)^2} = \frac{6.635 \times 0.1411}{0.0001} = \frac{0.9362}{0.0001} = 9{,}362

nmin=9,362n_{\min} = 9{,}362.

(c) Batas konservatif:

n(2.576)24×(0.01)2=6.6350.0004=16,588n \geq \frac{(2.576)^2}{4 \times (0.01)^2} = \frac{6.635}{0.0004} = 16{,}588

nmin,konservatif=16,588n_{\min, \text{konservatif}} = 16{,}588.

Perbandingan:

nkonservatifnp^=16,5889,3621.77\frac{n_{\text{konservatif}}}{n_{\hat{p}}} = \frac{16{,}588}{9{,}362} \approx 1.77

Dengan pilot run, kita menghemat 44%\approx 44\% simulasi. Implikasi: ketika probabilitas yang ditargetkan jauh dari 0.50.5 (di sini p=0.17p = 0.17), pilot run sangat berharga — batas konservatif terlalu pemborosan.

5. Verification p^(1p^)=0.17×0.83=0.1411<0.25\hat{p}(1-\hat{p}) = 0.17 \times 0.83 = 0.1411 < 0.25 — karena p=0.170.5p = 0.17 \neq 0.5, variansi aktual lebih kecil dari batas konservatif. Konsisten dengan np^<nkonservatifn_{\hat{p}} < n_{\text{konservatif}}.

Hasil: (a) p^=0.17\hat{p} = 0.17, IC99%=(0.127,0.213)_{99\%} = (0.127, 0.213); (b) n=9,362n = 9{,}362; (c) nkonservatif=16,588n_{\text{konservatif}} = 16{,}588; piloting menghemat ~44% komputasi.

Exam Tips — Soal C

Target waktu: 5–6 menit. Common trap: (1) Menggunakan n0=500n_0 = 500 (pilot run) sebagai jawaban — soal meminta total nn untuk presisi ε=0.01\varepsilon = 0.01, bukan sekadar pilot. (2) Menghitung z0.01z_{0.01} (satu sisi) untuk kepercayaan 99%99\% — harus z0.005=2.576z_{0.005} = 2.576 (dua sisi). Shortcut: Selalu hitung zα/22z_{\alpha/2}^2 terlebih dahulu (2.57626.6352.576^2 \approx 6.635), simpan nilai ini, lalu substitusi ke kedua formula sekaligus.


Section 5 — Verifikasi & Sanity Check

Cross-check Arah Perubahan nn — Tiga Hubungan Monoton Sebelum menghitung, verifikasi arah perubahan:
nzα/22(naik jika kepercayaan naik)n \propto z_{\alpha/2}^2 \quad \text{(naik jika kepercayaan naik)} nσ2(naik jika variansi naik)n \propto \sigma^2 \quad \text{(naik jika variansi naik)} n1ε2(naik jika toleransi diperketat)n \propto \frac{1}{\varepsilon^2} \quad \text{(naik jika toleransi diperketat)}

Jika dua soal berbeda hanya pada ε\varepsilon (misalnya ε1=2ε2\varepsilon_1 = 2\varepsilon_2), maka n2=4n1n_2 = 4n_1. Ini adalah sanity check yang dapat dilakukan tanpa kalkulator.

Cross-check Batas Konservatif vs Estimasi pp Selalu berlaku: np^nkonservatifn_{\hat{p}} \leq n_{\text{konservatif}}, karena p^(1p^)1/4\hat{p}(1-\hat{p}) \leq 1/4.

Persamaan terjadi hanya jika p^=0.5\hat{p} = 0.5. Jika hasil menunjukkan np^>nkonservatifn_{\hat{p}} > n_{\text{konservatif}}, ada kesalahan hitung — pastikan p^(1p^)\hat{p}(1-\hat{p}) dihitung dengan benar.

Metode Alternatif

Dalam beberapa konteks, σ2\sigma^2 dapat dihitung secara analitik alih-alih diestimasi dari simulasi. Contoh:

  • Eksponensial(μ\mu): σ2=μ2\sigma^2 = \mu^2
  • Poisson(λ\lambda): σ2=λ\sigma^2 = \lambda
  • Uniform(a,ba,b): σ2=(ba)2/12\sigma^2 = (b-a)^2/12
  • Estimasi probabilitas: σ2=p(1p)1/4\sigma^2 = p(1-p) \leq 1/4

Jika σ2\sigma^2 tersedia secara analitik, gunakan langsung — tidak perlu pilot run.


Section 6 — Visualisasi Mental

Visualisasi — Trade-off antara nn, ε\varepsilon, dan 1α1-\alpha:

AKURASI (ε kecil)

     │  ████████████  ← Zona "cukup": n besar, ε kecil, kepercayaan tinggi
     │  ████████████     (komputasi mahal)

     │  ████████        ← Zona "praktis": keseimbangan n dan akurasi
     │  ████████

     │  ████            ← Zona "kasar": n kecil, ε besar
     │  ████              (cepat tapi tidak akurat)
     └──────────────────→
              n (jumlah simulasi)

     Kepercayaan naik (1-α ↑) → kurva bergeser ke kanan (butuh n lebih besar)
     Variansi naik (σ² ↑)     → kurva bergeser ke kanan

Visualisasi Verbal — Distribusi Sampling θ^n\hat{\theta}_n:

  • Sumbu X: nilai θ^n\hat{\theta}_n (estimator Monte Carlo)
  • Bentuk kurva: Normal (bell curve) berdasarkan CLT, simetris di sekitar θ\theta (nilai sejati)
  • Lebar kurva: σ/n\sigma/\sqrt{n} — semakin besar nn, kurva semakin sempit (estimasi lebih presisi)
  • Titik kritis: θ±zα/2σ/n\theta \pm z_{\alpha/2} \cdot \sigma/\sqrt{n} mendefinisikan interval kepercayaan
  • Ekor: area di luar interval = probabilitas estimasi salah melebihi ε\varepsilon = α\alpha

Hubungan Visual ↔ Rumus

Elemen VisualKomponen Formula
Lebar bell curveσ/n\sigma/\sqrt{n} — standar error estimator
Jarak dari puncak ke batas intervalε=zα/2σ/n\varepsilon = z_{\alpha/2} \cdot \sigma/\sqrt{n}
Area di dalam interval1α1 - \alpha (derajat kepercayaan)
Efek memperbesar nnKurva menyempit → ε\varepsilon mengecil → estimasi lebih akurat

Section 7 — Jebakan Umum

Kesalahan Parametrisasi — zz Satu Sisi vs Dua Sisi Salah: Menggunakan z0.05=1.645z_{0.05} = 1.645 untuk kepercayaan 95%95\%. Benar: Untuk interval kepercayaan dua sisi (yang standar dalam Monte Carlo), kepercayaan 95%95\%α=0.05\alpha = 0.05zα/2=z0.025=1.960z_{\alpha/2} = z_{0.025} = 1.960.

Tabel nilai zz kritis yang wajib dihafal:

Kepercayaan 1α1-\alphaα\alphazα/2z_{\alpha/2}zα/22z_{\alpha/2}^2
90%0.101.6452.706
95%0.051.9603.842
99%0.012.5766.635
Kesalahan Konseptual — Empat Miskonsepsi Kritis
  1. “Semakin banyak simulasi, semakin kecil ε\varepsilon secara linear.” — Salah. ε1/n\varepsilon \propto 1/\sqrt{n}, bukan 1/n1/n. Akurasi meningkat dengan akar kuadrat nn.
  2. “Monte Carlo memberikan jawaban eksak setelah cukup simulasi.” — Salah. Monte Carlo selalu menghasilkan estimasi acak dengan variansi σ2/n>0\sigma^2/n > 0; tidak pernah eksak kecuali nn \to \infty.
  3. ε\varepsilon adalah lebar penuh interval kepercayaan.” — Salah. ε\varepsilon adalah half-width (setengah lebar). Lebar penuh = 2ε2\varepsilon. Jika soal menyebut “lebar interval 0.04\leq 0.04”, gunakan ε=0.02\varepsilon = 0.02.
  4. “Batas konservatif selalu lebih baik.” — Tidak selalu. Batas konservatif membuang sumber daya komputasi jika pp jauh dari 0.50.5. Pilot run memberikan estimasi lebih efisien.
Kesalahan Interpretasi Soal — Keyword yang Menjebak
  • “Tingkat kesalahan ε\varepsilon — Selalu asumsikan ini adalah half-width, kecuali soal secara eksplisit menyebut “lebar penuh” atau “total width”.
  • “Derajat kepercayaan” — Pastikan ini adalah 1α1-\alpha, bukan α\alpha. Kepercayaan 95%95\% berarti 1α=0.951-\alpha = 0.95, sehingga α=0.05\alpha = 0.05, bukan α=0.95\alpha = 0.95.
  • “Variansi tidak diketahui” dan tidak ada informasi tambahan → gunakan batas konservatif σ21/4\sigma^2 \leq 1/4 hanya jika g(X)g(X) adalah indikator Bernoulli (estimasi probabilitas).
  • “Estimasi mean” vs “estimasi probabilitas” → untuk estimasi mean E[X]E[X], variansi =Var(X)= \text{Var}(X) (bukan 1/41/4); batas konservatif 1/41/4 hanya berlaku untuk kasus Bernoulli.
Red Flags — Keyword yang Wajib Memicu Prosedur Khusus
  • “Jumlah simulasi yang diperlukan” → Formula n(zα/2σ/ε)2n \geq (z_{\alpha/2}\sigma/\varepsilon)^2; tentukan apakah σ2\sigma^2 diketahui atau perlu diestimasi/diberi batas konservatif.
  • “Pilot run menghasilkan kk sukses dari n0n_0 simulasi” → Estimasi p^=k/n0\hat{p} = k/n_0, gunakan p^(1p^)\hat{p}(1-\hat{p}) sebagai estimasi variansi.
  • “Lebar interval kepercayaan” (bukan half-width) → Bagi dengan 2 untuk mendapatkan ε\varepsilon.
  • “Distribusi Eksponensial mean μ\muσ2=μ2\sigma^2 = \mu^2; langsung substitusi.
  • nn diperketat 2×/kk× lebih akurat”nn naik 4×4\times/k2×k^2\times — hubungan kuadrat, bukan linear.

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Estimator Monte Carlo:
θ^n=1nk=1ng(Xk),Var(θ^n)=σ2n\hat{\theta}_n = \frac{1}{n}\sum_{k=1}^n g(X_k), \quad \text{Var}(\hat{\theta}_n) = \frac{\sigma^2}{n}
  1. Jumlah simulasi minimum — formula utama:
n(zα/2σε)2n \geq \left(\frac{z_{\alpha/2} \cdot \sigma}{\varepsilon}\right)^2
  1. Estimasi probabilitas — batas konservatif (hafal ini):
nzα/224ε2n \geq \frac{z_{\alpha/2}^2}{4\varepsilon^2}
  1. Nilai kritis wajib hafal:
z0.05=1.645  (90%),z0.025=1.960  (95%),z0.005=2.576  (99%)z_{0.05} = 1.645 \;(90\%), \quad z_{0.025} = 1.960 \;(95\%), \quad z_{0.005} = 2.576 \;(99\%)
  1. Hubungan kuadratik — aturan praktis:
ε turun k×    n naik k2×\varepsilon \text{ turun } k\times \;\Rightarrow\; n \text{ naik } k^2\times

Kapan Digunakan

  • Soal menyebut “simulasi Monte Carlo”, “jumlah simulasi”, atau “jumlah replikasi”
  • Soal memberikan ε\varepsilon, derajat kepercayaan, dan (mungkin) σ2\sigma^2 atau distribusi → hitung nn
  • Soal memberikan hasil pilot run → estimasi p^\hat{p} dan hitung nn lebih efisien
  • Soal menanyakan interval kepercayaan dari hasil simulasi
  • Soal menanyakan efek perubahan ε\varepsilon atau kepercayaan terhadap nn

Kapan TIDAK Boleh Digunakan

Quick Decision Tree

graph TD
    A["Soal terkait simulasi Monte Carlo?"] -->|"Ya"| B["Apa yang ditanyakan?"]
    A -->|"Tidak"| Z["Topik lain"]
    B -->|"Jumlah simulasi n"| C["sigma-kuadrat diketahui atau diberikan?"]
    B -->|"Interval kepercayaan dari hasil simulasi"| G["Hitung: theta-hat +/- z * sigma-hat / sqrt(n)"]
    B -->|"Efek perubahan epsilon"| H["Terapkan aturan kuadrat:<br>epsilon turun k kali -> n naik k-kuadrat kali"]
    C -->|"Ya — sigma diketahui"| D["n >= (z * sigma / epsilon)^2<br>Bulatkan ke atas"]
    C -->|"Tidak — estimasi probabilitas"| E["Ada pilot run?"]
    E -->|"Ya"| F["Hitung p-hat dari pilot<br>sigma-kuadrat = p-hat*(1-p-hat)<br>lalu n >= z^2 * p-hat*(1-p-hat) / epsilon^2"]
    E -->|"Tidak"| I["Gunakan batas konservatif:<br>n >= z^2 / (4 * epsilon^2)"]
    D --> J["Verifikasi: n proporsional 1/epsilon^2"]
    F --> J
    I --> J

Follow-up Options
  1. “Berikan contoh soal variasi dengan distribusi Poisson atau Lognormal sebagai model klaim”
  2. “Jelaskan hubungan 8.1 Monte Carlo Simulation Concepts dengan 8.2 Inversion Method for Random Variables
  3. “Buat flashcard 1-halaman: tabel nilai zz kritis dan formula nn untuk semua kasus”

📖 Ref: Klugman, Panjer & Willmot (2019), Loss Models 5th ed., Bab 19.3; Tse (2009), Bab 14 & 15 | 🗓️ 2026-04-19 | #TA2 #Simulasi #MonteCarlo