Bayangkan seorang aktuaris di perusahaan asuransi umum diminta mengestimasi rata-rata klaim kendaraan bermotor berdasarkan 200 data historis. Ia mendapatkan suatu angka — misalkan Rp 8,5 juta — tetapi pertanyaan pentingnya bukan hanya “berapa estimasinya?”, melainkan “seberapa jauh estimasi ini bisa meleset dari nilai sejati?” Inilah esensi dari Mean Squared Error (MSE): ukuran gabungan antara seberapa besar variasi estimator (variansi) dan seberapa sistematis ia meleset ke satu arah (bias kuadrat). Estimator yang baik bukan hanya yang kecil biasnya, tetapi yang keseluruhan MSE-nya rendah.
Satu langkah lebih lanjut: aktuaris tersebut tidak hanya ingin tahu satu angka, melainkan sebuah interval yang dengan tingkat keyakinan tertentu — misalkan 95% — berisi nilai parameter sejati. Di sinilah selang kepercayaan (confidence interval) berperan. Untuk MLE, distribusi asimtotik estimator sudah diketahui melalui teori Fisher Information, sehingga kita bisa membangun CI dengan presisi tinggi.
Namun tantangan muncul ketika yang ingin kita estimasi bukan parameter θ langsung, melainkan suatu fungsi dari parameter tersebut — misalnya probabilitas ruin, atau nilai rata-rata distribusi Pareto μ=θ/(α−1). Di sinilah Metode Delta menjadi penyelamat: ia menggunakan pendekatan linear (ekspansi Taylor orde pertama) untuk mentransfer informasi variansi dari θ^ ke variansi g(θ^), sehingga kita tetap bisa membangun CI untuk fungsi parameter yang kompleks sekalipun.
Section 2 — Definisi Formal
ℹDefinisi Matematis›
Untuk estimator θ^ dari parameter θ, Mean Squared Error didefinisikan sebagai:
MSE(θ^)=E[(θ^−θ)2]=Var(θ^)+[Bias(θ^)]2
dimana Bias(θ^)=E[θ^]−θ.
Simbol
Makna
Catatan
θ^
Estimator parameter θ
Fungsi dari sampel; bernilai acak
θ
Parameter sejati
Konstan, tidak diketahui
MSE(θ^)
Mean Squared Error estimator
Dekomposisi: Var + Bias²
Bias(θ^)
Bias estimator
=E[θ^]−θ; nol untuk estimator tak bias
I(θ)
Fisher Information (skalar)
=−E[∂θ2∂2lnL(θ)]
In(θ)
Fisher Information untuk n observasi
=n⋅I(θ) untuk i.i.d.
g(θ)
Fungsi diferensiabel dari parameter
Target estimasi dalam Delta Method
g′(θ)
Turunan pertama g terhadap θ
Dievaluasi di θ^ untuk estimasi variansi
zα/2
Kuantil distribusi Normal standar
z0.025=1.96 untuk CI 95%
Rumus Utama
1. Dekomposisi MSE:
MSE(θ^)=Var(θ^)+[E(θ^)−θ]2
Label: MSE = variance + squared bias. Untuk estimator tak bias, MSE = Var.
2. Cramér-Rao Lower Bound (CRLB):
Var(θ^)≥In(θ)1=nI(θ)1
Label: Variansi estimator tak bias tidak bisa lebih kecil dari inversi Fisher Information.
3. Variansi asimtotik MLE (satu parameter):
Var(θ^)=In(θ^)1=[−∂θ2∂2lnL(θ)θ=θ^]−1
Label: Estimasi variansi MLE diperoleh dari negatif invers Hessian log-likelihood, dievaluasi di θ^.
4. Selang Kepercayaan (1−α) untuk θ (asimtotik):
θ^±zα/2Var(θ^)
Label: CI asimtotik berbasis normalitas MLE. Valid untuk n besar.
Label: Transformasi variansi melalui linearisasi Taylor orde pertama.
6. Delta Method — Kasus multi-parameter θ=(θ1,θ2,…):
Var(g(θ^))≈∇g(θ^)⊤⋅Σ^⋅∇g(θ^)
dimana Σ^=In(θ^)−1 adalah estimasi matriks kovarians MLE.
Label: Generalisasi Delta Method ke vektor parameter; ∇g adalah vektor gradien.
7. CI untuk g(θ) via Delta Method:
g(θ^)±zα/2Var(g(θ^))
Label: Setelah variansi g(θ^) tersedia dari Delta Method, CI dibangun secara normal.
Asumsi Eksplisit
Regularitas kondisi MLE: lnL(θ) dua kali terdiferensiabel; support distribusi tidak bergantung pada θ.
Asimtotik normalitas MLE: Untuk n→∞, n(θ^−θ)dN(0,I(θ)−1).
Diferensiabilitas g: Fungsi g(θ) harus diferensiabel di sekitar nilai sejati θ, dan g′(θ)=0.
Ukuran sampel besar: Semua hasil CI dan Delta Method adalah hasil asimtotik — akurasi meningkat dengan n.
Data i.i.d.: Fisher Information total = n× Fisher Information per observasi; berlaku untuk data i.i.d.
Section 3 — Jembatan Logika
◈Dari Definisi ke Rumus: Mengapa MSE = Var + Bias²?›
Mulai dari definisi MSE=E[(θ^−θ)2]. Tambahkan dan kurangkan E[θ^]:
(θ^−θ)=deviasi dari ekspektasi(θ^−E[θ^])+bias(E[θ^]−θ)
Kuadratkan lalu ambil ekspektasi — cross-term hilang karena E[\hat{\theta} - E[\hat{\theta}}]] = 0, sehingga tersisa Var + Bias².
◈Mengapa MLE Memiliki Distribusi Asimtotik Normal?›
MLE θ^ memaksimalkan lnL(θ). Di titik maksimum, kondisi orde pertama ∂θ∂lnL=0 terpenuhi. Ekspansi Taylor orde pertama skor di sekitar θ0:
0=∂θ∂lnLθ^≈∂θ∂lnLθ0+(θ^−θ0)∂θ2∂2lnLθ0
Dengan Hukum Bilangan Besar dan CLT, hasil akhirnya adalah n(θ^−θ0)dN(0,I(θ0)−1).
Derivasi Delta Method Step-by-Step:
Langkah 1: Misalkan kita ingin mendapatkan distribusi g(θ^) dimana g diferensiabel.
Langkah 2: Ekspansi Taylor g(θ^) di sekitar θ0:
g(θ^)≈g(θ0)+g′(θ0)(θ^−θ0)
Langkah 3: Ambil variansi kedua sisi. Karena g(θ0) adalah konstanta:
Var(g(θ^))≈[g′(θ0)]2⋅Var(θ^)
Langkah 4: Dalam praktik, ganti θ0 dengan θ^ (konsistensi MLE) dan Var(θ^) dengan estimasinya dari invers Hessian:
Var(g(θ^))=[g′(θ^)]2⋅Var(θ^)
Langkah 5: Karena g(θ^) asimtotik normal, bangun CI:
g(θ^)±zα/2[g′(θ^)]2⋅Var(θ^)✘Dilarang›
Jangan asumsikan In(θ)=I(θ) — Fisher Information total =n×I(θ), inversinya =nI(θ)1. Melupakan faktor n menyebabkan variansi salah satu faktor n2.
Jangan pakai Delta Method jika g′(θ^)=0 — linearisasi orde pertama menghasilkan variansi nol, yang tidak valid; perlu ekspansi orde kedua.
Jangan substitusi g(θ^) tanpa turunkan g′ terlebih dahulu — kesalahan umum adalah menghitung g(θ^) secara numerik tetapi mengabaikan faktor Jacobian [g′(θ^)]2 saat menghitung variansi.
Section 4 — Contoh Soal
Soal A — Fundamental (Bias dan MSE Estimator Eksponensial)
Diberikan sampel i.i.d. X1,…,Xn∼Exp(θ) dimana E[X]=θ. Estimator yang diusulkan adalah θ^1=Xˉ dan θ^2=n+1nXˉ.
(a) Tentukan bias dan MSE dari θ^1.
(b) Tentukan bias dan MSE dari θ^2.
(c) Estimator mana yang memiliki MSE lebih kecil untuk n=9?
✓Solusi Soal A›
Pendekatan: Hitung E[θ^] dan Var(θ^) untuk masing-masing estimator, lalu gunakan dekomposisi MSE = Var + Bias².
5. Verification10θ2<9θ2 ✓. Meskipun θ^2 bias, trade-off variansi lebih kecil menghasilkan MSE lebih rendah.
Hasil:θ^2 memiliki MSE lebih kecil (θ2/10 vs θ2/9). Ini menunjukkan bahwa estimator tak bias tidak selalu optimal dalam arti MSE.
▲Exam Tips — Soal A›
Target waktu: 3 menit. Common trap: Salah menghitung Var(θ^2) — ingat harus kalikan dengan (n+1n)2, bukan n+1n. Shortcut: MSE dari estimator linear cXˉ adalah nc2θ2+(c−1)2θ2; minimasi atas c menghasilkan c∗=n+2n untuk distribusi Eksponensial.
Soal B — Exam-Typical (Delta Method untuk Mean Pareto)
Distribusi Pareto dengan PDF f(x)=(x+θ)α+1αθα, x>0, memiliki mean μ=α−1θ (untuk α>1).
Dari n=100 observasi, MLE menghasilkan α^=3 dan θ^=800. Matriks kovarians MLE (dari invers Hessian) adalah:
Σ^=(0.18−40−4020000)
dimana baris/kolom berurutan adalah α lalu θ. Gunakan Delta Method untuk membangun CI 95% untuk μ=α−1θ.
✓Solusi Soal B›
Pendekatan: Identifikasi fungsi g(α,θ)=α−1θ, hitung gradien, terapkan Delta Method multi-parameter.
CI 95%: 400±1.96×142.1=400±278.5, yaitu (121.5,678.5).
5. Verification
CI sangat lebar karena hanya 100 observasi untuk model 2-parameter dengan komponen variansi besar. Nilai mean 400 masuk akal untuk Pareto dengan θ=800, α=3. ✓
Hasil: CI 95% untuk μ adalah (121.5,678.5).
▲Exam Tips — Soal B›
Target waktu: 5 menit. Common trap: Lupa negatif pada ∂g/∂α — kesalahan tanda mengubah hasil secara signifikan. Shortcut: Selalu tulis matriks terlebih dahulu sebelum substitusi angka, dan periksa satuan: ∇g harus dimensionless setelah dikalikan dengan μ.
Soal C — Challenging (Fisher Information dan CI MLE Eksponensial)
(a) Tentukan MLE θ^.
(b) Hitung Fisher Information I(θ) dan In(θ).
(c) Bangun CI 95% asimtotik untuk θ.
(d) Gunakan Delta Method untuk membangun CI 95% untuk λ=1/θ (rate parameter).
✓Solusi Soal C›
Pendekatan: Dari log-likelihood Eksponensial, turunkan MLE, Fisher Information, CI untuk θ, lalu terapkan Delta Method untuk transformasi g(θ)=1/θ.
5. Verification
Perhatikan: 1/319.3≈0.00313 dan 1/180.7≈0.00554, yang berbeda dari CI Delta Method (0.00289,0.00511) — wajar karena transformasi 1/θ adalah non-linear. CI Delta Method adalah aproksimasi asimtotik, sedangkan inversi CI θ memberikan CI eksak untuk λ. ✓
Hasil: CI 95% untuk θ: (180.7,319.3); untuk λ=1/θ via Delta Method: (0.00289,0.00511).
▲Exam Tips — Soal C›
Target waktu: 6 menit. Common trap: Pada bagian (d), lupa kuadratkan g′(θ^) — rumus variansi Delta Method mengandung [g′(θ^)]2, bukan g′(θ^). Shortcut: Untuk Eksponensial, Var(θ^)=θ^2/n — hafal hasil ini karena sering muncul sebagai sub-langkah soal panjang.
Section 5 — Verifikasi & Sanity Check
✓Cross-Check MSE via Dekomposisi›
Untuk estimator apa pun, selalu verifikasi: MSE≥Var (karena Bias² ≥ 0). Jika hasil Anda menunjukkan MSE < Var, ada kesalahan aritmetika. Untuk estimator tak bias, MSE = Var secara eksak — gunakan ini sebagai cek cepat.
✓Cross-Check Fisher Information via Variance Identity›
Fisher Information dapat dihitung dua cara ekuivalen:
I(θ)=E[(∂θ∂lnf)2]=−E[∂θ2∂2lnf]
Jika kedua cara menghasilkan nilai berbeda, ada kesalahan. Untuk Eksponensial(θ): cara pertama =E[(X/θ2−1/θ)2]=Var(X)/θ4=1/θ2 ✓.
✓Validasi Lebar CI›
CI asimtotik untuk θ harus memiliki lebar ∝1/n. Jika n dilipatduakan, lebar CI turun 2. Gunakan ini untuk cek rasionalitas: CI selebar 40% dari estimasi titik untuk n=50 adalah masuk akal; CI selebar 4% untuk n=50 adalah mencurigakan.
Metode Alternatif
Selain CI normal asimtotik, ada dua pendekatan alternatif:
1. CI berbasis transformasi log: Untuk parameter positif θ, bangun CI di skala lnθ (yang lebih simetris), lalu back-transform:
CI untuk lnθ:lnθ^±zα/2⋅θ^SE(θ^)
lalu eksponensiasi. Menghasilkan CI yang selalu positif, berguna untuk parameter yang dekat dengan batas.
2. Profile Likelihood CI: Inversi uji likelihood ratio — lebih akurat untuk sampel kecil, tetapi membutuhkan optimasi numerik.
Section 6 — Visualisasi Mental
Dekomposisi MSE — Analogi Pita Pengukur:
Bayangkan seorang pemanah melempar panah berulang kali. Variansi = seberapa menyebar kumpulan anak panah (presisi). Bias = seberapa jauh pusat kumpulan dari target (akurasi). MSE = rata-rata jarak kuadrat setiap anak panah dari target. Estimator dengan bias kecil tapi variansi besar (menyebar) bisa lebih buruk dari estimator sedikit bias tapi sangat presisi.
Jika g naik curam (∣g′∣ besar): ketidakpastian diperbesar. Jika g datar (∣g′∣ kecil): ketidakpastian diperkecil. Ini analogi “amplifikasi” transformasi terhadap noise.
Landscape Fisher Information:
Log-likelihood lnL(θ) berbentuk seperti lengkungan parabola terbalik. Fisher Information = kelengkungan (curvature) di puncak: semakin curam (kelengkungan besar), semakin pasti kita tahu di mana puncak sesungguhnya, semakin kecil variansi MLE.
Hubungan Visual ↔ Rumus
Elemen Visual
Komponen Rumus
Lebar pita panah (variansi pemanah)
Var(θ^)
Geseran pusat dari target
Bias(θ^)
Rata-rata jarak kuadrat ke target
MSE(θ^)
Kecuraman kelengkungan log-likelihood
In(θ)=−E[∂2lnL/∂θ2]
Kemiringan transformasi g
g′(θ^) dalam Delta Method
Amplifikasi ketidakpastian
[g′(θ^)]2⋅Var(θ^)
Section 7 — Jebakan Umum
⬡Kesalahan Parametrisasi Fisher Information›
Salah:In(θ)=I(θ) → menghasilkan Var=1/I(θ) yang terlalu besar (seharusnya dibagi n).
Benar:In(θ)=n⋅I(θ), sehingga Var(θ^)=1/(nI(θ))=1/In(θ).
Jangan bingung antara Fisher Information per observasi dan Fisher Information total dari sampel.
⬡Kesalahan Konseptual Delta Method›
Lupa kuadratkan Jacobian:Var(g)=[g′(θ^)]2⋅Var(θ^) — bukan g′(θ^)⋅Var(θ^).
Menganggap CI g(θ) = g(CI θ): Untuk fungsi non-monoton atau non-linear, g(θ^±z⋅SE) tidak sama dengan g(θ^)±z⋅∣g′(θ^)∣⋅SE.
Menggunakan Delta Method ketika g′(θ^)=0: Perkiraan orde pertama kolaps; tidak valid.
Keliru menghitung turunan parsial multi-parameter: Untuk g(α,θ), harus hitung ∂g/∂α DAN ∂g/∂θ, lalu susun sebagai vektor gradien.
⬡Kesalahan Interpretasi Soal›
Ketika soal meminta “CI untuk fungsi parameter” tapi tidak menyebutkan Delta Method secara eksplisit — itu hampir pasti Delta Method yang dimaksud.
Ketika matriks kovarians Σ^ diberikan, pastikan urutan parameter sesuai dengan gradien yang dihitung — urutan yang terbalik menghasilkan dot product yang salah.
“Variansi asimtotik MLE” selalu merujuk ke 1/In(θ^), bukan variansi sampel biasa.
▲Red Flags — Keyword Pemicu Prosedur›
“Variansi MLE dari fungsi parameter” → Delta Method (satu atau multi-parameter)
“Selang kepercayaan untuk g(θ)” → Delta Method + CI normal asimtotik
“Fisher Information” → hitung −E[∂2lnf/∂θ2] terlebih dahulu, lalu invers untuk variansi
graph TD A["Soal tentang ketidakpastian estimasi"] --> B{"Apa yang ditanya?"} B -->|"MSE atau Bias"| C["Hitung E[θ̂] dan Var(θ̂)<br>MSE = Var + Bias²"] B -->|"CI untuk θ langsung"| D["Hitung Var(θ̂) = 1/I_n(θ̂)<br>CI: θ̂ ± z · SE"] B -->|"CI untuk g(θ)"| E{"Berapa parameter?"} E -->|"1 parameter"| F["Delta Method 1-D<br>Var(g) = [g'(θ̂)]² · Var(θ̂)"] E -->|"2+ parameter"| G["Delta Method multi-D<br>Var(g) = ∇g' · Σ̂ · ∇g"] F --> H["CI: g(θ̂) ± z · SE(g)"] G --> H D --> H
❝Follow-up Options›
“Berikan contoh soal variasi Delta Method untuk distribusi Weibull”