PAI · AAMAI · 2026
Aktuaria
Indonesia
CF2 · Materi 4.5

Estimasi Parameter

2026-02-21 Hard Bobot: 20–30% Miller et al. (2014) Bab 10.1–10.4; Hogg-McKean-Craig (2019) Bab 6.1–6.3, 7.2; Hogg-Tanis-Zimm (2015) Bab 5.5–5.6
CF2InferensiStatistikaEstimasiParameterMLEMetodeMomenEstimasiBayesianLikelihoodEstimator

📊 4.5 — Estimasi Parameter

Ringkasan Cepat

Topik: Estimasi Parameter | Bobot: ~20–30% | Difficulty: Hard Ref: Miller et al. (2014) Bab 10.1–10.4; Hogg-McKean-Craig (2019) Bab 6.1–6.3, 7.2 | Prereq: 4.1 Penarikan Sampel Acak, 4.2 Distribusi Sampel, 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 4: Inferensi Statistik4.5Menurunkan estimator momen; menurunkan MLE untuk distribusi diskrit dan kontinu; menghitung estimasi Bayesian (prior konjugat); menentukan dan membandingkan estimator berdasarkan properti tak-bias dan konsistensi20–30%Hard4.1 Penarikan Sampel Acak, 4.2 Distribusi Sampel, 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu, 2.3 Fungsi Pembangkit4.6 Sifat-Sifat Estimator, 4.7 Selang Kepercayaan, 4.8 Uji Hipotesis, 3.3 Distribusi Bersyarat (Conditional Distribution)Miller et al. (2014) Bab 10.1–10.4; Hogg-McKean-Craig (2019) Bab 6.1–6.3, 7.2; Hogg-Tanis-Zimm (2015) Bab 5.5–5.6

Section 1 — Intuisi

Bayangkan seorang aktuaris yang harus menetapkan premi asuransi jiwa untuk kelompok nasabah baru. Dia tahu bahwa kematian di kelompok ini mengikuti distribusi eksponensial dengan laju λ\lambda — namun nilai λ\lambda yang sebenarnya tidak diketahui. Yang dia miliki hanyalah data historis: umur tujuh puluh nasabah yang telah meninggal. Tugasnya adalah menggunakan data tersebut untuk “menebak” nilai λ\lambda yang paling masuk akal — dan inilah inti dari estimasi parameter: menggunakan sampel yang teramati untuk menarik kesimpulan tentang parameter populasi yang tidak diketahui.

Ada tiga pendekatan utama yang diuji di CF2. Metode momen adalah pendekatan paling intuitif: samakan momen-momen teoritis distribusi (yang bergantung pada parameter tak diketahui) dengan momen-momen sampel (yang bisa dihitung langsung dari data), lalu selesaikan sistem persamaan tersebut untuk mendapatkan estimasi. Maximum Likelihood Estimation (MLE) mengajukan pertanyaan berbeda: “Nilai parameter mana yang membuat data yang kita amati paling mungkin terjadi?” MLE mencari parameter yang memaksimalkan fungsi likelihood — yakni probabilitas (atau densitas) bersama dari seluruh data sebagai fungsi dari parameter. Di antara keduanya, MLE umumnya dianggap lebih unggul karena memiliki sifat-sifat statistik yang baik secara asimtotik.

Estimasi Bayesian mengambil perspektif yang berbeda secara filosofis: parameter θ\theta bukan dianggap sebagai konstanta tetap yang tidak diketahui, melainkan sebagai variabel acak yang memiliki distribusi prior sebelum data diamati. Setelah data masuk, kita memperbarui keyakinan tentang θ\theta menggunakan Teorema Bayes untuk mendapatkan distribusi posterior. Estimasi Bayesian sangat relevan untuk aktuaria ketika ada informasi sebelumnya tentang parameter — misalnya data industri tentang frekuensi klaim yang dapat digunakan sebagai prior sebelum menganalisis portofolio nasabah baru.

Section 2 — Definisi Formal

Definisi Matematis

Misalkan X1,X2,,XnX_1, X_2, \ldots, X_n adalah sampel acak dari distribusi dengan PDF/PMF f(x;θ)f(x; \theta), di mana θΘ\theta \in \Theta adalah parameter yang tidak diketahui.

Fungsi Likelihood:

L(θ)=L(θ;x1,,xn)=i=1nf(xi;θ)L(\theta) = L(\theta; x_1, \ldots, x_n) = \prod_{i=1}^{n} f(x_i; \theta)

Log-Likelihood:

(θ)=lnL(θ)=i=1nlnf(xi;θ)\ell(\theta) = \ln L(\theta) = \sum_{i=1}^{n} \ln f(x_i; \theta)

MLE: Nilai θ^MLE\hat{\theta}_{\text{MLE}} yang memaksimalkan L(θ)L(\theta) (ekivalen: memaksimalkan (θ)\ell(\theta)):

θ^MLE=argmaxθΘL(θ)\hat{\theta}_{\text{MLE}} = \arg\max_{\theta \in \Theta} L(\theta)

Estimator Momen ke-kk: Diperoleh dengan memecahkan sistem μk=mk\mu_k' = m_k', di mana:

μk=E[Xk](momen teoritis ke-k)mk=1ni=1nXik(momen sampel ke-k)\mu_k' = E[X^k] \quad \text{(momen teoritis ke-}k\text{)} \qquad m_k' = \frac{1}{n}\sum_{i=1}^{n} X_i^k \quad \text{(momen sampel ke-}k\text{)}

Distribusi Posterior (Bayes):

π(θx)=f(xθ)π(θ)f(x)f(xθ)π(θ)\pi(\theta \mid \mathbf{x}) = \frac{f(\mathbf{x} \mid \theta)\, \pi(\theta)}{f(\mathbf{x})} \propto f(\mathbf{x} \mid \theta)\, \pi(\theta)

Variabel & Parameter

SimbolMaknaCatatan
θ\thetaParameter populasi yang tidak diketahuiSkalar atau vektor θ=(θ1,,θk)\boldsymbol{\theta} = (\theta_1, \ldots, \theta_k)
θ^\hat{\theta}Estimator (fungsi dari sampel) atau estimasi (nilai numeriknya)Estimator adalah variabel acak; estimasi adalah angka
X1,,XnX_1, \ldots, X_nSampel acak berukuran nn (variabel acak)iid dari f(x;θ)f(x;\theta)
x1,,xnx_1, \ldots, x_nNilai observasi sampel (realisasi)Konstanta setelah diamati
L(θ)L(\theta)Fungsi likelihoodFungsi θ\theta, bukan fungsi xx
(θ)\ell(\theta)Log-likelihood: lnL(θ)\ln L(\theta)Lebih mudah dimaksimalkan; ln\ln monoton sehingga argmax sama
μk\mu_k'Momen teoritis ke-kk tentang nol: E[Xk]E[X^k]Bergantung pada θ\theta
mkm_k'Momen sampel ke-kk: 1nXik\frac{1}{n}\sum X_i^kStatistik, tidak bergantung pada θ\theta
π(θ)\pi(\theta)Distribusi prior atas θ\theta (Bayes)Merepresentasikan keyakinan sebelum melihat data
π(θx)\pi(\theta \mid \mathbf{x})Distribusi posterior atas θ\theta (Bayes)Distribusi θ\theta setelah melihat data
θ^Bayes\hat{\theta}_{\text{Bayes}}Estimator BayesMean, median, atau modus dari distribusi posterior
Θ\ThetaRuang parameterDomain valid untuk θ\theta
Xˉ\bar{X}Mean sampel: 1ni=1nXi\frac{1}{n}\sum_{i=1}^n X_iMomen sampel pertama m1m_1'
S2S^2Variansi sampel: 1n1(XiXˉ)2\frac{1}{n-1}\sum(X_i - \bar{X})^2Estimator tak-bias untuk σ2\sigma^2

Rumus Utama

L(θ)=i=1nf(xi;θ)L(\theta) = \prod_{i=1}^{n} f(x_i; \theta)

Label: Fungsi Likelihood — produk dari semua PDF/PMF individual karena XiX_i diasumsikan iid; ini mengukur seberapa “compatible” parameter θ\theta dengan data yang diamati.

(θ)θ=0\frac{\partial \ell(\theta)}{\partial \theta} = 0

Label: Persamaan Likelihood (Likelihood Equation) — syarat perlu untuk MLE interior; wajib diverifikasi bahwa titik kritis ini memang maksimum (bukan minimum atau saddle point) melalui syarat cukup 2θ2<0\frac{\partial^2 \ell}{\partial \theta^2} < 0.

θ^MOM dari E[X]=Xˉμ1(θ^)=m1\hat{\theta}_{\text{MOM}} \text{ dari } E[X] = \bar{X} \quad \Longrightarrow \quad \mu_1'(\hat{\theta}) = m_1'

Label: Metode Momen Orde Pertama — persamaan tunggal untuk distribusi berparameter satu; untuk distribusi berparameter dua, diperlukan sistem dua persamaan menggunakan μ1=m1\mu_1' = m_1' dan μ2=m2\mu_2' = m_2'.

π(θx)L(θx)π(θ)\pi(\theta \mid \mathbf{x}) \propto L(\theta \mid \mathbf{x}) \cdot \pi(\theta)

Label: Teorema Bayes untuk Estimasi — posterior proporsional terhadap likelihood dikali prior; konstanta normalisasi f(x)f(\mathbf{x}) tidak bergantung pada θ\theta sehingga sering diabaikan saat menentukan bentuk posterior.

θ^Bayes, mean=E[θx]=θπ(θx)dθ\hat{\theta}_{\text{Bayes, mean}} = E[\theta \mid \mathbf{x}] = \int \theta \cdot \pi(\theta \mid \mathbf{x}) \, d\theta

Label: Estimator Bayes Mean Posterior — estimasi Bayes yang meminimalkan expected squared error loss; yang paling sering diuji di CF2.

Asumsi Eksplisit

  • iid: Observasi X1,,XnX_1, \ldots, X_n diasumsikan independent and identically distributed (iid) dari f(x;θ)f(x;\theta).
  • Identifiabilitas: Untuk MLE valid, distribusi harus identifiable: f(x;θ1)=f(x;θ2)f(x;\theta_1) = f(x;\theta_2) untuk semua xx jika dan hanya jika θ1=θ2\theta_1 = \theta_2.
  • Regularitas: Persamaan likelihood /θ=0\partial \ell / \partial \theta = 0 mengasumsikan support f(x;θ)f(x;\theta) tidak bergantung pada θ\theta (kondisi regularitas). Jika support bergantung pada θ\theta (seperti U(0,θ)U(0,\theta)), MLE dicari melalui argumen batas, bukan kalkulus.
  • Existensi momen: Untuk metode momen, E[Xk]E[X^k] harus terdefinisi untuk kk yang diperlukan.
  • Prior informatif (Bayes): Pilihan prior π(θ)\pi(\theta) mempengaruhi posterior; prior konjugat dipilih agar bentuk posterior memiliki bentuk distribusi yang dikenal.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Mengapa produk dalam L(θ)L(\theta)? Karena XiX_i iid, probabilitas bersama dari seluruh sampel adalah produk dari probabilitas individual: P(X1=x1,,Xn=xn)=P(Xi=xi)=f(xi;θ)P(X_1 = x_1, \ldots, X_n = x_n) = \prod P(X_i = x_i) = \prod f(x_i; \theta). Kita membalik perspektif: anggap data x1,,xnx_1, \ldots, x_n sudah tetap, dan θ\theta sebagai variabel. Maka L(θ)L(\theta) mengukur seberapa besar peluang data ini “terbangkitkan” oleh nilai θ\theta tertentu — kita cari θ\theta yang memberikan nilai terbesar.

Mengapa log-likelihood? Karena ln\ln adalah fungsi monoton meningkat, argmax dari LL dan =lnL\ell = \ln L identik. Namun =lnf(xi;θ)\ell = \sum \ln f(x_i; \theta) jauh lebih mudah didiferensialkan daripada produk — ini adalah justifikasi teknis utama transformasi ke log.

Mengapa metode momen? Intuisinya sederhana: jika model yang benar, momen sampel mk=1nXikm_k' = \frac{1}{n}\sum X_i^k akan konvergen ke momen teoritis μk=E[Xk]\mu_k' = E[X^k] (Hukum Bilangan Besar, lihat 4.4 Hukum Bilangan Besar (LLN)). Maka menyamakannya dan memecahkan untuk θ\theta adalah pendekatan yang konsisten.

Support dan Domain
  • MLE dengan kalkulus hanya valid jika support f(x;θ)f(x;\theta) tidak bergantung pada θ\theta. Contoh yang valid: Poisson, Normal, Eksponensial. Contoh pengecualian: U(0,θ)U(0,\theta) di mana support [0,θ][0,\theta] bergantung pada θ\theta — MLE adalah X(n)=max(X1,,Xn)X_{(n)} = \max(X_1, \ldots, X_n), diperoleh dari argumen bahwa L(θ)=1/θnL(\theta) = 1/\theta^n untuk θX(n)\theta \geq X_{(n)} dan nol untuk θ<X(n)\theta < X_{(n)}.
  • Ruang parameter Θ\Theta bisa memiliki batasan yang membuat MLE berada di batas (boundary solution), bukan di titik stasioner interior.

Derivasi MLE untuk Distribusi Bernoulli:

Misalkan X1,,XniidBernoulli(p)X_1, \ldots, X_n \overset{\text{iid}}{\sim} \text{Bernoulli}(p), dengan P(Xi=xi)=pxi(1p)1xiP(X_i = x_i) = p^{x_i}(1-p)^{1-x_i}.

Fungsi likelihood:

L(p)=i=1npxi(1p)1xi=pxi(1p)nxiL(p) = \prod_{i=1}^{n} p^{x_i}(1-p)^{1-x_i} = p^{\sum x_i}(1-p)^{n - \sum x_i}

Log-likelihood:

(p)=(i=1nxi)lnp+(ni=1nxi)ln(1p)\ell(p) = \left(\sum_{i=1}^n x_i\right) \ln p + \left(n - \sum_{i=1}^n x_i\right) \ln(1-p)

Turunkan terhadap pp dan samakan nol:

p=xipnxi1p=0\frac{\partial \ell}{\partial p} = \frac{\sum x_i}{p} - \frac{n - \sum x_i}{1-p} = 0

Kalikan kedua ruas dengan p(1p)p(1-p):

(1p)xi=p(nxi)(1-p)\sum x_i = p\left(n - \sum x_i\right) xipxi=pnpxi\sum x_i - p \sum x_i = pn - p \sum x_i xi=pn    p^MLE=i=1nxin=xˉ\sum x_i = pn \implies \hat{p}_{\text{MLE}} = \frac{\sum_{i=1}^n x_i}{n} = \bar{x}

Verifikasi maksimum: 2p2=xip2nxi(1p)2<0\frac{\partial^2 \ell}{\partial p^2} = -\frac{\sum x_i}{p^2} - \frac{n - \sum x_i}{(1-p)^2} < 0

Derivasi Estimator Momen untuk Distribusi Gamma Γ(α,β)\Gamma(\alpha, \beta):

Untuk XΓ(α,β)X \sim \Gamma(\alpha, \beta) dengan E[X]=αβE[X] = \alpha\beta dan Var(X)=αβ2\text{Var}(X) = \alpha\beta^2:

Sistem dua persamaan (dua parameter):

μ1=αβ=Xˉ=m1\mu_1' = \alpha\beta = \bar{X} = m_1' μ2=Var(X)+(E[X])2=αβ2+α2β2=m2\mu_2' = \text{Var}(X) + (E[X])^2 = \alpha\beta^2 + \alpha^2\beta^2 = m_2'

Atau lebih praktis, gunakan Var(X)S2\text{Var}(X) \approx S^2 (variansi sampel):

α^β^=Xˉ,α^β^2=S2\hat{\alpha}\hat{\beta} = \bar{X}, \qquad \hat{\alpha}\hat{\beta}^2 = S^2

Dari persamaan kedua dibagi pertama: β^=S2/Xˉ\hat{\beta} = S^2/\bar{X}. Substitusi ke pertama: α^=Xˉ2/S2\hat{\alpha} = \bar{X}^2/S^2.

Estimasi Bayes dengan Prior Konjugat Beta-Binomial:

Misalkan XpB(n,p)X \mid p \sim B(n, p) (Binomial) dan pBeta(α,β)p \sim \text{Beta}(\alpha, \beta) (prior). Posterior:

π(px)px(1p)nxpα1(1p)β1=p(x+α)1(1p)(nx+β)1\pi(p \mid x) \propto p^x(1-p)^{n-x} \cdot p^{\alpha-1}(1-p)^{\beta-1} = p^{(x+\alpha)-1}(1-p)^{(n-x+\beta)-1}

Ini adalah kernel distribusi Beta(x+α,nx+β)\text{Beta}(x+\alpha, n-x+\beta), sehingga:

pxBeta(x+α,nx+β)p \mid x \sim \text{Beta}(x + \alpha, n - x + \beta)

Estimator Bayes (mean posterior):

p^Bayes=x+αn+α+β\hat{p}_{\text{Bayes}} = \frac{x + \alpha}{n + \alpha + \beta}
Dilarang
  1. Dilarang menggunakan persamaan likelihood /θ=0\partial \ell / \partial \theta = 0 untuk distribusi di mana support bergantung pada θ\theta (seperti U(0,θ)U(0,\theta), U(θ,1)U(\theta, 1), atau distribusi dengan θ\theta sebagai batas support) — dalam kasus ini L(θ)L(\theta) tidak dua kali differensiable di titik kritis; MLE harus dicari melalui argumen analitik batas.
  2. Dilarang mengidentifikasi estimator momen dengan MLE tanpa memverifikasinya — keduanya umumnya berbeda, kecuali untuk distribusi tertentu (seperti Normal). Klaim kesamaan harus dibuktikan.
  3. Dilarang menyimpulkan bahwa posterior π(θx)\pi(\theta \mid \mathbf{x}) sudah ternormalisasi dari π(θx)L(θ)π(θ)\pi(\theta \mid \mathbf{x}) \propto L(\theta) \cdot \pi(\theta) — tanda \propto artinya belum ternormalisasi; untuk mendapat mean posterior, harus mengidentifikasi bentuk distribusi yang dikenal atau menghitung integral normalisasi.

Section 4 — Contoh Soal

Soal A — Fundamental

Sebuah perusahaan asuransi mengamati bahwa jumlah klaim harian XX mengikuti distribusi Poisson dengan parameter λ\lambda yang tidak diketahui. Dalam sampel acak selama 5 hari, dicatat jumlah klaim: x1=3x_1 = 3, x2=1x_2 = 1, x3=4x_3 = 4, x4=2x_4 = 2, x5=0x_5 = 0. (a) Tuliskan fungsi likelihood L(λ)L(\lambda) dan log-likelihood (λ)\ell(\lambda). (b) Tentukan MLE dari λ\lambda. (c) Tentukan juga estimator momen dari λ\lambda dan bandingkan hasilnya dengan MLE.

Solusi Soal A

1. Identifikasi Variabel

  • Variabel acak: XiiidPoisson(λ)X_i \overset{\text{iid}}{\sim} \text{Poisson}(\lambda), dengan PMF f(x;λ)=eλλxx!f(x;\lambda) = \frac{e^{-\lambda}\lambda^x}{x!} untuk x=0,1,2,x = 0, 1, 2, \ldots
  • Data observasi: x1=3,x2=1,x3=4,x4=2,x5=0x_1 = 3, x_2 = 1, x_3 = 4, x_4 = 2, x_5 = 0; n=5n = 5
  • i=15xi=3+1+4+2+0=10\sum_{i=1}^5 x_i = 3 + 1 + 4 + 2 + 0 = 10; xˉ=10/5=2\bar{x} = 10/5 = 2

2. Identifikasi Distribusi / Model

  • XiPoisson(λ)X_i \sim \text{Poisson}(\lambda): tipe diskrit, support {0,1,2,}\{0, 1, 2, \ldots\}, parameter λ>0\lambda > 0
  • Support tidak bergantung pada λ\lambda, sehingga MLE dapat diturunkan via kalkulus ✓

3. Setup Persamaan

L(λ)=i=15eλλxixi!L(\lambda) = \prod_{i=1}^{5} \frac{e^{-\lambda}\lambda^{x_i}}{x_i!} (λ)=i=15(λ+xilnλlnxi!)\ell(\lambda) = \sum_{i=1}^5 \left(-\lambda + x_i \ln \lambda - \ln x_i!\right) ddλ=0\frac{d\ell}{d\lambda} = 0

4. Eksekusi Aljabar

(a) Likelihood dan log-likelihood:

L(λ)=i=15eλλxixi!=e5λλxixi!=e5λλ103!1!4!2!0!L(\lambda) = \prod_{i=1}^{5} \frac{e^{-\lambda}\lambda^{x_i}}{x_i!} = \frac{e^{-5\lambda}\,\lambda^{\sum x_i}}{\prod x_i!} = \frac{e^{-5\lambda}\,\lambda^{10}}{3!\,1!\,4!\,2!\,0!} (λ)=5λ+10lnλln(3!)ln(1!)ln(4!)ln(2!)ln(0!)\ell(\lambda) = -5\lambda + 10 \ln \lambda - \ln(3!) - \ln(1!) - \ln(4!) - \ln(2!) - \ln(0!)

(suku-suku lnxi!-\ln x_i! adalah konstanta tidak bergantung pada λ\lambda, sehingga tidak mempengaruhi maksimisasi)

(b) MLE dari λ\lambda:

ddλ=5+10λ=0    λ^MLE=105=2\frac{d\ell}{d\lambda} = -5 + \frac{10}{\lambda} = 0 \implies \hat{\lambda}_{\text{MLE}} = \frac{10}{5} = 2

Verifikasi maksimum:

d2dλ2=10λ2λ=2=104=2.5<0\frac{d^2\ell}{d\lambda^2} = -\frac{10}{\lambda^2} \bigg|_{\lambda=2} = -\frac{10}{4} = -2.5 < 0 \quad \checkmark

(c) Estimator momen:

Untuk XPoisson(λ)X \sim \text{Poisson}(\lambda), E[X]=λ=μ1E[X] = \lambda = \mu_1'.

Menyamakan dengan momen sampel pertama:

λ^MOM=m1=xˉ=xin=105=2\hat{\lambda}_{\text{MOM}} = m_1' = \bar{x} = \frac{\sum x_i}{n} = \frac{10}{5} = 2

Perbandingan: Untuk distribusi Poisson, λ^MLE=λ^MOM=Xˉ\hat{\lambda}_{\text{MLE}} = \hat{\lambda}_{\text{MOM}} = \bar{X}. Ini bukan kebetulan — keduanya menghasilkan persamaan yang ekivalen karena E[X]=λE[X] = \lambda dan LL hanya bergantung pada xi\sum x_i.

5. Verification

  • λ^=2>0\hat{\lambda} = 2 > 0: berada dalam ruang parameter Θ=(0,)\Theta = (0, \infty)
  • Masuk akal: rata-rata klaim diamati adalah 2 klaim/hari, dan estimasi λ=2\lambda = 2
  • Syarat cukup maksimum (d2/dλ2<0d^2\ell/d\lambda^2 < 0) terpenuhi ✓
Exam Tips — Soal A
  • Target waktu: 5–6 menit
  • Common trap: Lupa membuang konstanta lnxi!-\ln x_i! dari log-likelihood sebelum diferensiasi — konstanta tersebut tidak mempengaruhi argmax, tetapi bisa menyebabkan kesalahan aljabar jika tetap disertakan. Untuk efisiensi exam, langsung tulis (λ)nλ+(xi)lnλ\ell(\lambda) \propto -n\lambda + (\sum x_i)\ln\lambda saja.
  • Shortcut Poisson: Untuk XiiidPoisson(λ)X_i \overset{\text{iid}}{\sim}\text{Poisson}(\lambda), MLE selalu λ^=Xˉ\hat{\lambda} = \bar{X}. Hafalkan hasil ini dan cukup tunjukkan persamaan likelihood untuk justifikasi.

Soal B — Exam-Typical

Misalkan X1,X2,,XnX_1, X_2, \ldots, X_n adalah sampel acak dari distribusi Gamma Γ(α,β)\Gamma(\alpha, \beta) dengan PDF:

f(x;α,β)=1Γ(α)βαxα1ex/β,x>0f(x;\alpha,\beta) = \frac{1}{\Gamma(\alpha)\beta^\alpha} x^{\alpha-1} e^{-x/\beta}, \quad x > 0

di mana α>0\alpha > 0 (parameter bentuk) dan β>0\beta > 0 (parameter skala). Diketahui bahwa E[X]=αβE[X] = \alpha\beta dan Var(X)=αβ2\text{Var}(X) = \alpha\beta^2. Dengan n=4n = 4 observasi: x1=6,x2=3,x3=9,x4=6x_1 = 6, x_2 = 3, x_3 = 9, x_4 = 6:

(a) Tentukan estimator momen α^\hat{\alpha} dan β^\hat{\beta} dalam bentuk Xˉ\bar{X} dan S2S^2. (b) Hitung nilai numerik α^\hat{\alpha} dan β^\hat{\beta} untuk sampel di atas. (c) Turunkan MLE untuk kasus khusus α=2\alpha = 2 diketahui (hanya β\beta yang tidak diketahui).

Solusi Soal B

1. Identifikasi Variabel

  • XiiidΓ(α,β)X_i \overset{\text{iid}}{\sim} \Gamma(\alpha, \beta): tipe kontinu, support (0,)(0, \infty), dua parameter (α,β)(\alpha, \beta)
  • n=4n = 4; observasi: 6,3,9,66, 3, 9, 6
  • xˉ=(6+3+9+6)/4=24/4=6\bar{x} = (6+3+9+6)/4 = 24/4 = 6
  • S2=1n1(xixˉ)2=13[(0)2+(3)2+(3)2+(0)2]=183=6S^2 = \frac{1}{n-1}\sum(x_i - \bar{x})^2 = \frac{1}{3}\left[(0)^2+(-3)^2+(3)^2+(0)^2\right] = \frac{18}{3} = 6

2. Identifikasi Distribusi / Model

  • Distribusi Gamma dua parameter; metode momen membutuhkan dua persamaan
  • Untuk bagian (c): dengan α=2\alpha = 2 diketahui, hanya satu parameter β\beta yang dicari via MLE

3. Setup Persamaan

Untuk metode momen (dua persamaan):

μ1=αβ=Xˉ\mu_1' = \alpha\beta = \bar{X} μ2=αβ2=S2(menggunakan variansi sampel sebagai aproksimasi variansi teoritis)\mu_2 = \alpha\beta^2 = S^2 \quad \text{(menggunakan variansi sampel sebagai aproksimasi variansi teoritis)}

Untuk MLE dengan α=2\alpha = 2, log-likelihood:

(β)=i=1n[lnΓ(2)2lnβ+lnxixiβ]\ell(\beta) = \sum_{i=1}^n \left[-\ln\Gamma(2) - 2\ln\beta + \ln x_i - \frac{x_i}{\beta}\right]

4. Eksekusi Aljabar

(a) Estimator momen dalam Xˉ\bar{X} dan S2S^2:

Dari sistem:

α^β^=Xˉ(i)\hat{\alpha}\hat{\beta} = \bar{X} \quad \cdots (i) α^β^2=S2(ii)\hat{\alpha}\hat{\beta}^2 = S^2 \quad \cdots (ii)

Bagi (ii)(ii) dengan (i)(i):

β^=S2Xˉ\hat{\beta} = \frac{S^2}{\bar{X}}

Substitusi ke (i)(i):

α^=Xˉβ^=Xˉ2S2\hat{\alpha} = \frac{\bar{X}}{\hat{\beta}} = \frac{\bar{X}^2}{S^2}

(b) Nilai numerik:

β^MOM=S2Xˉ=66=1\hat{\beta}_{\text{MOM}} = \frac{S^2}{\bar{X}} = \frac{6}{6} = 1 α^MOM=Xˉ2S2=366=6\hat{\alpha}_{\text{MOM}} = \frac{\bar{X}^2}{S^2} = \frac{36}{6} = 6

(c) MLE untuk β\beta dengan α=2\alpha = 2:

Gunakan Γ(2)=1!=1\Gamma(2) = 1! = 1, sehingga lnΓ(2)=0\ln\Gamma(2) = 0:

(β)=n(2lnβ)+i=1nlnxi1βi=1nxi\ell(\beta) = n(-2\ln\beta) + \sum_{i=1}^n \ln x_i - \frac{1}{\beta}\sum_{i=1}^n x_i

(konstanta lnxi\sum \ln x_i diabaikan untuk diferensiasi)

ddβ=2nβ+xiβ2=0\frac{d\ell}{d\beta} = \frac{-2n}{\beta} + \frac{\sum x_i}{\beta^2} = 0

Kalikan dengan β2/n\beta^2/n:

2β+xin=0    β^MLE=xˉ2=62=3-2\beta + \frac{\sum x_i}{n} = 0 \implies \hat{\beta}_{\text{MLE}} = \frac{\bar{x}}{2} = \frac{6}{2} = 3

Verifikasi: d2dβ2=2nβ22xiβ3=2nβ2(1xˉβ)β^=3=249(12)=89<0\frac{d^2\ell}{d\beta^2} = \frac{2n}{\beta^2} - \frac{2\sum x_i}{\beta^3} = \frac{2n}{\beta^2}\left(1 - \frac{\bar{x}}{\beta}\right)\bigg|_{\hat{\beta}=3} = \frac{2\cdot4}{9}\left(1-2\right) = -\frac{8}{9} < 0

5. Verification

  • α^=6>0\hat{\alpha} = 6 > 0, β^=1>0\hat{\beta} = 1 > 0: kedua estimator berada dalam Θ\Theta
  • Untuk bagian (c): dengan α=2\alpha = 2, rumus umum MLE Gamma memberikan β^=xˉ/α=6/2=3\hat{\beta} = \bar{x}/\alpha = 6/2 = 3 ✓ (konsisten)
  • Perhatikan β^MLE=3β^MOM=1\hat{\beta}_{\text{MLE}} = 3 \neq \hat{\beta}_{\text{MOM}} = 1: ini menunjukkan MLE dan MOM umumnya berbeda
Exam Tips — Soal B
  • Target waktu: 10–12 menit
  • Common trap 1 — Parametrisasi Gamma: Beberapa referensi menggunakan parametrisasi rate λ=1/β\lambda = 1/\beta (bukan skala β\beta), sehingga E[X]=α/λE[X] = \alpha/\lambda. Periksa selalu parametrisasi yang digunakan soal sebelum menghafal rumus.
  • Common trap 2 — Variansi sampel: Metode momen teoritis sebenarnya menyamakan momen populasi dengan momen sampel mentah m2=1nxi2m_2' = \frac{1}{n}\sum x_i^2, bukan S2S^2. Menggunakan S2σ^2S^2 \approx \hat{\sigma}^2 adalah aproksimasi yang diterima di CF2 karena menghasilkan estimator yang sama secara asimtotik, tetapi ketahui perbedaan konseptualnya.
  • Shortcut Gamma: Untuk Γ(α,β)\Gamma(\alpha, \beta) dengan α\alpha diketahui, MLE selalu β^=Xˉ/α\hat{\beta} = \bar{X}/\alpha.

Soal C — Challenging

Suatu aktuaris memodelkan frekuensi klaim dengan XθPoisson(θ)X \mid \theta \sim \text{Poisson}(\theta). Berdasarkan data industri, aktuaris menggunakan prior θGamma(α0,β0)\theta \sim \text{Gamma}(\alpha_0, \beta_0) dengan α0=4\alpha_0 = 4 dan β0=2\beta_0 = 2 (menggunakan parametrisasi skala sehingga E[θ]=α0β0=8E[\theta] = \alpha_0\beta_0 = 8).

Dari portofolio baru, diamati klaim dalam n=5n = 5 periode: x1=3,x2=7,x3=5,x4=6,x5=4x_1 = 3, x_2 = 7, x_3 = 5, x_4 = 6, x_5 = 4, sehingga xi=25\sum x_i = 25.

(a) Tentukan distribusi posterior θx\theta \mid \mathbf{x} dengan menunjukkan bahwa prior Gamma adalah konjugat untuk likelihood Poisson. (b) Hitung estimator Bayes θ^Bayes\hat{\theta}_{\text{Bayes}} (mean posterior). (c) Bandingkan dengan MLE θ^MLE\hat{\theta}_{\text{MLE}} dan tunjukkan bahwa estimator Bayes dapat ditulis sebagai rata-rata tertimbang antara mean prior dan Xˉ\bar{X}. (d) Jika ukuran sampel nn \to \infty, apa yang terjadi pada estimator Bayes?

Solusi Soal C

1. Identifikasi Variabel

  • Model: XiθiidPoisson(θ)X_i \mid \theta \overset{\text{iid}}{\sim} \text{Poisson}(\theta), θ>0\theta > 0
  • Prior: θΓ(α0,β0)=Γ(4,2)\theta \sim \Gamma(\alpha_0, \beta_0) = \Gamma(4, 2) dengan PDF π(θ)θα01eθ/β0\pi(\theta) \propto \theta^{\alpha_0 - 1}e^{-\theta/\beta_0}
  • Data: n=5n = 5, xi=25\sum x_i = 25, xˉ=5\bar{x} = 5
  • MLE dari Poisson: θ^MLE=xˉ=5\hat{\theta}_{\text{MLE}} = \bar{x} = 5

2. Identifikasi Distribusi / Model

  • Prior Gamma + Likelihood Poisson → Posterior Gamma (pasangan konjugat)
  • Tujuan: identifikasi kernel posterior sebagai distribusi yang dikenal

3. Setup Persamaan

π(θx)L(θx)π(θ)\pi(\theta \mid \mathbf{x}) \propto L(\theta \mid \mathbf{x}) \cdot \pi(\theta) =[i=1neθθxixi!]θα01eθ/β0= \left[\prod_{i=1}^n \frac{e^{-\theta}\theta^{x_i}}{x_i!}\right] \cdot \theta^{\alpha_0 - 1}e^{-\theta/\beta_0}

4. Eksekusi Aljabar

(a) Distribusi posterior:

Kumpulkan semua faktor yang bergantung pada θ\theta:

π(θx)enθθxiθα01eθ/β0\pi(\theta \mid \mathbf{x}) \propto e^{-n\theta}\,\theta^{\sum x_i} \cdot \theta^{\alpha_0-1}\,e^{-\theta/\beta_0} =θ(α0+xi)1eθ(n+1/β0)= \theta^{(\alpha_0 + \sum x_i) - 1} \cdot e^{-\theta\left(n + 1/\beta_0\right)}

Ini adalah kernel distribusi Gamma dengan:

  • Parameter bentuk: αn=α0+xi=4+25=29\alpha_n = \alpha_0 + \sum x_i = 4 + 25 = 29
  • Parameter laju: 1/βn=n+1/β0=5+1/2=11/21/\beta_n = n + 1/\beta_0 = 5 + 1/2 = 11/2, sehingga parameter skala βn=2/11\beta_n = 2/11

Jadi: θxΓ ⁣(29,211)\theta \mid \mathbf{x} \sim \Gamma\!\left(29,\, \dfrac{2}{11}\right)

(b) Estimator Bayes (mean posterior):

θ^Bayes=E[θx]=αnβn=29211=58115.273\hat{\theta}_{\text{Bayes}} = E[\theta \mid \mathbf{x}] = \alpha_n \cdot \beta_n = 29 \cdot \frac{2}{11} = \frac{58}{11} \approx 5.273

(c) Representasi rata-rata tertimbang:

Mean prior: E[θ]=α0β0=42=8E[\theta] = \alpha_0\beta_0 = 4 \cdot 2 = 8

MLE: θ^MLE=xˉ=5\hat{\theta}_{\text{MLE}} = \bar{x} = 5

Tuliskan mean posterior:

θ^Bayes=αnβn=α0+xin+1/β0\hat{\theta}_{\text{Bayes}} = \alpha_n\beta_n = \frac{\alpha_0 + \sum x_i}{n + 1/\beta_0}

Bagi pembilang dan penyebut:

=α01/β01/β0n+1/β0+xˉnn+1/β01= \frac{\frac{\alpha_0}{1/\beta_0} \cdot \frac{1/\beta_0}{n + 1/\beta_0} + \bar{x} \cdot \frac{n}{n + 1/\beta_0}}{1}

Definisikan bobot w=nn+1/β0w = \dfrac{n}{n + 1/\beta_0}. Maka:

θ^Bayes=(1w)E[θ]+wXˉ\hat{\theta}_{\text{Bayes}} = (1-w)\cdot E[\theta] + w\cdot\bar{X}

Dengan data ini: w=55+0.5=55.5=1011w = \dfrac{5}{5 + 0.5} = \dfrac{5}{5.5} = \dfrac{10}{11}

Verifikasi:

(11011)8+10115=1118+10115=8+5011=58115.273\left(1 - \frac{10}{11}\right)\cdot 8 + \frac{10}{11}\cdot 5 = \frac{1}{11}\cdot 8 + \frac{10}{11}\cdot 5 = \frac{8 + 50}{11} = \frac{58}{11} \approx 5.273 \quad \checkmark

(d) Perilaku asimtotik nn \to \infty:

Ketika nn \to \infty:

w=nn+1/β01w = \frac{n}{n + 1/\beta_0} \to 1

Sehingga:

θ^Bayes(11)E[θ]+1Xˉ=Xˉ=θ^MLE\hat{\theta}_{\text{Bayes}} \to (1-1)\cdot E[\theta] + 1 \cdot \bar{X} = \bar{X} = \hat{\theta}_{\text{MLE}}

Interpretasi: Dengan semakin banyak data, pengaruh prior semakin kecil dan estimator Bayes konvergen ke MLE. Ini adalah properti konsistensi Bayesian.

5. Verification

  • θ^Bayes=58/115.27\hat{\theta}_{\text{Bayes}} = 58/11 \approx 5.27: berada di antara mean prior (88) dan MLE (55), mengkonfirmasi sifat “kompromi” ✓
  • Karena n=5n = 5 cukup besar relatif terhadap informasi prior, estimasi lebih dekat ke MLE (5) daripada mean prior (8) ✓
  • θ^Bayes>θ^MLE=5\hat{\theta}_{\text{Bayes}} > \hat{\theta}_{\text{MLE}} = 5: prior menarik estimasi ke atas menuju mean prior 8 ✓
Exam Tips — Soal C
  • Target waktu: 15–18 menit
  • Common trap 1 — Parametrisasi Gamma posterior: Pastikan parameter βn\beta_n adalah parameter skala (sehingga mean = αnβn\alpha_n\beta_n), bukan parameter laju (mean = αn/λn\alpha_n/\lambda_n). Konfusikan keduanya menyebabkan mean posterior yang salah.
  • Common trap 2 — Mengabaikan update β\beta: Banyak kandidat hanya meng-update α\alpha (menambahkan xi\sum x_i) tetapi lupa meng-update β\beta menjadi βn=β0/(1+nβ0)\beta_n = \beta_0/(1 + n\beta_0). Keduanya harus di-update.
  • Shortcut Gamma-Poisson konjugat: Untuk XθPoisson(θ)X \mid \theta \sim \text{Poisson}(\theta) dan θΓ(α0,β0)\theta \sim \Gamma(\alpha_0, \beta_0), hasil posterior adalah Γ ⁣(α0+xi,β01+nβ0)\Gamma\!\left(\alpha_0 + \sum x_i,\, \dfrac{\beta_0}{1 + n\beta_0}\right). Hafalkan rumus update ini untuk efisiensi exam.

Section 5 — Verifikasi & Sanity Check

Validasi MLE
  1. Cek ruang parameter: θ^MLEΘ\hat{\theta}_{\text{MLE}} \in \Theta (e.g., λ^>0\hat{\lambda} > 0 untuk Poisson, 0<p^<10 < \hat{p} < 1 untuk Binomial). Estimasi di luar ruang parameter pasti ada kesalahan aljabar.
  2. Cek syarat orde dua: d2dθ2θ^<0\frac{d^2\ell}{d\theta^2}\big|_{\hat{\theta}} < 0 untuk memastikan titik kritis adalah maksimum. Jika kondisi ini tidak diperiksa, titik kritis bisa jadi minimum.
  3. Cek konsistensi dengan data: MLE dari distribusi yang merupakan rata-rata tertimbang data (seperti μ^Normal=xˉ\hat{\mu}_{\text{Normal}} = \bar{x}, λ^Poisson=xˉ\hat{\lambda}_{\text{Poisson}} = \bar{x}, p^Binom=xˉ/n\hat{p}_{\text{Binom}} = \bar{x}/n) harus berada dalam rentang data yang diamati.
Validasi Metode Momen
  1. Jumlah persamaan = jumlah parameter: Distribusi satu parameter → gunakan μ1=m1\mu_1' = m_1'. Distribusi dua parameter → tambahkan μ2=m2\mu_2' = m_2' (atau padanan variansi).
  2. Solusi harus dalam ruang parameter: Jika sistem menghasilkan α^<0\hat{\alpha} < 0 untuk distribusi Gamma, ada kesalahan dalam menyusun sistem persamaan.
  3. Momen sampel adalah statistik: mk=1nXikm_k' = \frac{1}{n}\sum X_i^k — pastikan tidak menggunakan S2S^2 (yang memiliki faktor 1/(n1)1/(n-1)) sebagai m2m_2' (yang menggunakan faktor 1/n1/n) kecuali secara eksplisit disebutkan menggunakan variansi sampel sebagai proxy.
Validasi Estimasi Bayes
  1. Prior konjugat: Verifikasi bahwa posterior memiliki bentuk yang sama dengan prior (keluarga distribusi yang sama). Jika tidak, ada kesalahan dalam mengidentifikasi prior konjugat.
  2. Estimator Bayes sebagai kompromi: Mean posterior selalu berada di antara mean prior dan MLE (untuk prior konjugat standar). Hasil di luar rentang ini menandakan kesalahan.
  3. Batas asimtotik: Ketika nn \to \infty, estimator Bayes harus konvergen ke MLE (data mendominasi prior).

Metode Alternatif

MLE vs Metode Momen: Untuk distribusi Normal N(μ,σ2)N(\mu, \sigma^2) dengan kedua parameter tidak diketahui, keduanya memberikan μ^=Xˉ\hat{\mu} = \bar{X} tetapi berbeda untuk variansi: MLE menghasilkan σ^MLE2=1n(XiXˉ)2\hat{\sigma}^2_{\text{MLE}} = \frac{1}{n}\sum(X_i - \bar{X})^2 (bias), sedangkan metode momen (menggunakan μ2=σ2\mu_2 = \sigma^2, yaitu variansi populasi ≈ variansi sampel S2S^2) menghasilkan σ^MOM2=S2=1n1(XiXˉ)2\hat{\sigma}^2_{\text{MOM}} = S^2 = \frac{1}{n-1}\sum(X_i-\bar{X})^2 (tak-bias). Ini salah satu perbedaan paling penting untuk diketahui di CF2.

Maksimisasi LL vs \ell: Secara matematis ekivalen karena ln\ln monoton. Namun di CF2, hampir selalu lebih mudah menggunakan \ell. Pengecualian: distribusi sederhana seperti U(0,θ)U(0,\theta) di mana L(θ)=1/θnL(\theta) = 1/\theta^n bisa langsung dianalisis tanpa log.

Section 6 — Visualisasi Mental

Fungsi Likelihood sebagai “Permukaan Kepercayaan”:

Bayangkan grafik dengan sumbu horizontal = nilai parameter θ\theta dan sumbu vertikal = L(θ)L(\theta) atau (θ)\ell(\theta). Untuk setiap nilai θ\theta di sumbu horizontal, tinggi grafik mengukur “seberapa kompatibel” nilai θ\theta tersebut dengan data yang diamati. Grafik ini memiliki puncak (peak) di θ^MLE\hat{\theta}_{\text{MLE}} — titik di mana data paling “mungkin” terjadi jika parameter adalah θ^\hat{\theta}.

Bentuk umum log-likelihood untuk distribusi reguler adalah kurva cembung (concave, membuka ke bawah) dengan puncak tunggal. Semakin “tajam” puncaknya (semakin negatif (θ^)\ell''(\hat{\theta})), semakin presisi estimasi — ini terhubung dengan konsep Informasi Fisher I(θ)=E[(θ)]I(\theta) = -E[\ell''(\theta)] (lihat 4.6 Sifat-Sifat Estimator).

Diagram Pembaruan Bayes:

Bayangkan tiga kurva pada grafik yang sama (sumbu horizontal = θ\theta, sumbu vertikal = densitas/nilai):

  • Kurva kiri yang lebar: prior π(θ)\pi(\theta) — merepresentasikan keyakinan sebelum melihat data, biasanya lebih datar/tersebar.
  • Kurva tengah: likelihood L(θx)L(\theta \mid \mathbf{x}) — bentuknya ditentukan oleh data; semakin banyak data, semakin tajam puncaknya.
  • Kurva kanan yang lebih sempit: posterior π(θx)\pi(\theta \mid \mathbf{x}) — selalu merupakan “kompromi” antara prior dan likelihood. Puncaknya berada di antara puncak prior dan MLE, dan lebih sempit dari prior (data mengurangi ketidakpastian).

Hubungan Visual ↔ Rumus

Puncak log-likelihood pada grafik (θ)\ell(\theta) berkorespondensi langsung dengan persamaan:

ddθθ^=0titik puncak kurva log-likelihood\frac{d\ell}{d\theta}\bigg|_{\hat{\theta}} = 0 \longleftrightarrow \text{titik puncak kurva log-likelihood}

“Ketajaman” puncak (kelengkungan negatif) berkorespondensi dengan:

d2dθ2θ^=In(θ)ukuran informasi dalam sampel tentang θ-\frac{d^2\ell}{d\theta^2}\bigg|_{\hat{\theta}} = I_n(\theta) \longleftrightarrow \text{ukuran informasi dalam sampel tentang } \theta

Posisi posterior sebagai kompromi berkorespondensi dengan rumus rata-rata tertimbang:

θ^Bayes=(1w)Eprior[θ]+wθ^MLEpuncak posterior di antara prior dan likelihood\hat{\theta}_{\text{Bayes}} = (1-w)\cdot E_{\text{prior}}[\theta] + w \cdot \hat{\theta}_{\text{MLE}} \longleftrightarrow \text{puncak posterior di antara prior dan likelihood}

Section 7 — Jebakan Umum

Kesalahan Parametrisasi

Kesalahan 1 — Parametrisasi Gamma (skala vs laju): Distribusi Gamma memiliki dua konvensi. Parametrisasi skala: E[X]=αβE[X] = \alpha\beta; parametrisasi laju (λ=1/β\lambda = 1/\beta): E[X]=α/λE[X] = \alpha/\lambda. Menggunakan rumus dari satu konvensi dalam konteks konvensi lain menyebabkan MLE/MOM yang salah. Salah: Menulis β^=xˉ/α\hat{\beta} = \bar{x}/\alpha ketika soal menggunakan parametrisasi laju. Benar: Periksa apakah soal menggunakan β\beta sebagai parameter skala (E[X]=αβE[X]=\alpha\beta) atau laju (E[X]=α/βE[X]=\alpha/\beta) sebelum menerapkan rumus apapun.

Kesalahan 2 — Variansi sampel S2S^2 vs momen sampel kedua m2m_2': Metode momen formal menggunakan m2=1nxi2m_2' = \frac{1}{n}\sum x_i^2 (momen sampel mentah orde dua, bukan variansi). Namun CF2 sering mengijinkan penggunaan Var(X)S2\text{Var}(X) \approx S^2 untuk menentukan parameter kedua. Konfirmasi mana yang digunakan: dengan m2=1nxi2m_2' = \frac{1}{n}\sum x_i^2, atau dengan μ2=Var(X)S2=1n1(xixˉ)2\mu_2 = \text{Var}(X) \approx S^2 = \frac{1}{n-1}\sum(x_i-\bar{x})^2.

Kesalahan Konseptual
  1. Menggunakan L/θ=0\partial L/\partial\theta = 0 alih-alih /θ=0\partial\ell/\partial\theta = 0 untuk distribusi dengan banyak observasi. Secara matematis ekivalen, tetapi L/θ=0\partial L/\partial\theta = 0 untuk produk sangat rawan kesalahan aljabar pada exam. Selalu gunakan log-likelihood.
  2. Memperlakukan L(θ)L(\theta) sebagai PDF atas θ\theta. Likelihood bukan distribusi probabilitas atas θ\theta; L(θ)dθ\int L(\theta)\,d\theta tidak harus sama dengan 1. Likelihood hanya mengukur kesesuaian relatif nilai θ\theta dengan data.
  3. Mengabaikan update parameter β\beta pada posterior Gamma-Poisson. Posterior Gamma memiliki kedua parameter yang berubah (αn=α0+xi\alpha_n = \alpha_0 + \sum x_i DAN βn=β0/(1+nβ0)\beta_n = \beta_0/(1+n\beta_0)), bukan hanya α\alpha.
  4. Salah mengidentifikasi syarat cukup maksimum MLE. Setelah menemukan titik kritis dari (θ)=0\ell'(\theta) = 0, wajib memeriksa (θ^)<0\ell''(\hat{\theta}) < 0. Untuk beberapa distribusi (seperti distribusi campuran), log-likelihood bisa multimodal dan perlu diperiksa semua titik kritis.
Kesalahan Interpretasi Soal
  • “Estimasi” vs “Estimator”: “Estimator” adalah fungsi dari sampel (variabel acak); “estimasi” adalah nilai numeriknya (konstanta) setelah data substitusi. Soal yang meminta “estimator” mengharapkan ekspresi dalam X1,,XnX_1, \ldots, X_n atau Xˉ\bar{X}; soal yang meminta “estimasi” mengharapkan angka numerik.
  • “Prior konjugat” vs “sembarang prior”: Soal dengan kata “konjugat” menginformasikan bahwa posterior memiliki bentuk distribusi yang sama dengan prior — manfaatkan ini untuk langsung menentukan parameter posterior tanpa menghitung integral normalisasi.
  • “MLE” vs “MAP (Maximum A Posteriori)”: MAP adalah modus dari distribusi posterior, bukan mean posterior. Untuk distribusi simetris (Normal), keduanya sama; untuk distribusi asimetris (Gamma, Beta), keduanya berbeda. Soal yang meminta “estimator Bayes” tanpa kualifikasi biasanya mengacu pada mean posterior (meminimalkan squared error loss).
Red Flags
  • Support bergantung pada parameter: Kata kunci seperti "XU(0,θ)X \sim U(0, \theta)" atau “distribusi dengan batas atas θ\theta” → MLE tidak dari (θ)=0\ell'(\theta) = 0; gunakan argumen batas/analitik.
  • Distribusi berparameter banyak: Jika distribusi memiliki kk parameter, metode momen membutuhkan kk persamaan (μ1=m1,,μk=mk\mu_1' = m_1', \ldots, \mu_k' = m_k') dan MLE membutuhkan sistem kk persamaan likelihood.
  • Kata “prior” atau “posterior” atau “Bayesian”: Langsung identifikasi pasangan konjugat yang relevan (Beta-Binomial, Gamma-Poisson, Normal-Normal) untuk menghemat waktu.
  • Distribusi Gamma/Beta dalam konteks Bayes: Periksa apakah distribusi tersebut adalah prior atau model data; konfusikan keduanya adalah kesalahan fatal.
  • Log-likelihood mengandung lnxi\sum \ln x_i untuk data: Ini sering muncul untuk distribusi Gamma dan Log-normal; suku ini adalah konstanta terhadap θ\theta dan tidak mempengaruhi solusi MLE, tetapi pastikan tidak salah menurunkannya.

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Fungsi likelihood (iid): L(θ)=i=1nf(xi;θ),(θ)=i=1nlnf(xi;θ)L(\theta) = \prod_{i=1}^{n} f(x_i;\theta), \qquad \ell(\theta) = \sum_{i=1}^{n} \ln f(x_i;\theta)
  2. MLE: selesaikan persamaan likelihood (jika support tidak bergantung θ\theta): d(θ)dθ=0dan verifikasid2dθ2θ^<0\frac{d\ell(\theta)}{d\theta} = 0 \quad \text{dan verifikasi} \quad \frac{d^2\ell}{d\theta^2}\bigg|_{\hat{\theta}} < 0
  3. Metode momen (kk parameter → kk persamaan): μ1(θ^)=m1=Xˉ,μ2(θ^)=m2=1nXi2,\mu_1'(\hat{\boldsymbol{\theta}}) = m_1' = \bar{X}, \quad \mu_2'(\hat{\boldsymbol{\theta}}) = m_2' = \frac{1}{n}\sum X_i^2, \quad \ldots
  4. Posterior Bayes (Teorema Bayes): π(θx)L(θx)π(θ)\pi(\theta \mid \mathbf{x}) \propto L(\theta \mid \mathbf{x}) \cdot \pi(\theta)
  5. Pasangan konjugat kunci di CF2: Beta(α,β)data Binom(n,p)Beta(α+xi,  β+nxi)\text{Beta}(\alpha,\beta) \,\xrightarrow{\text{data Binom}(n,p)}\, \text{Beta}(\alpha+\sum x_i,\; \beta + n - \sum x_i) Γ(α0,β0)data Poisson(θ)Γ ⁣(α0+xi,  β01+nβ0)\Gamma(\alpha_0,\beta_0) \,\xrightarrow{\text{data Poisson}(\theta)}\, \Gamma\!\left(\alpha_0+\textstyle\sum x_i,\; \frac{\beta_0}{1+n\beta_0}\right)

Kapan Digunakan

  • Trigger keywords: “MLE”, “maximum likelihood”, “estimator”, “hitung estimasi”, “metode momen”, “prior”, “posterior”, “distribusi parameter”, “inferensi”, “Bayesian update”.
  • Tipe skenario soal:
    • Diberikan distribusi dan data sampel: tentukan MLE numerik atau dalam bentuk statistik cukup.
    • Diberikan distribusi dua parameter: tentukan pasangan estimator momen (θ^1,θ^2)(\hat{\theta}_1, \hat{\theta}_2).
    • Diberikan prior konjugat dan data: tentukan posterior, hitung mean/varians posterior sebagai estimasi Bayes.
    • Perbandingan MLE vs estimator momen: tunjukkan apakah keduanya sama atau berbeda.

Kapan TIDAK Boleh Digunakan

  • Jika soal meminta interval estimasi: Beralih ke 4.7 Selang Kepercayaan, yang membutuhkan distribusi sampling dari estimator, bukan hanya estimasi titik.
  • Jika soal meminta uji hipotesis tentang θ\theta: Beralih ke 4.8 Uji Hipotesis; estimasi titik adalah prasyarat tetapi bukan tujuan akhir.
  • Jika support bergantung pada θ\theta DAN kamu tidak tahu prosedur alternatifnya: Jangan terapkan (θ)=0\ell'(\theta) = 0 untuk U(0,θ)U(0,\theta), distribusi triangular, atau distribusi dengan batas bergantung θ\theta.

Quick Decision Tree

graph TD
    A["Ada parameter tidak diketahui<br>dalam distribusi X?"] --> B["Apa yang diminta?"]
    B --> C["Titik estimasi (satu angka)?"]
    B --> D["Distribusi posterior (Bayes)?"]
    C --> E["Metode mana yang digunakan?"]
    E --> F["MLE"]
    E --> G["Metode Momen"]
    F --> H["Support bergantung theta?"]
    H -->|"Ya"| I["Argumen analitik batas<br>contoh: max atau min statistik order"]
    H -->|"Tidak"| J["Turunkan log-likelihood<br>selesaikan d(ell)/d(theta) = 0<br>verifikasi d2(ell)/d(theta)2 < 0"]
    G --> K["Jumlah parameter k?"]
    K -->|"1 parameter"| L["1 persamaan:<br>E[X] = X-bar"]
    K -->|"2 parameter"| M["2 persamaan:<br>E[X]=X-bar, Var(X)=S^2"]
    D --> N["Identifikasi pasangan konjugat"]
    N --> O["Beta-Binomial atau<br>Gamma-Poisson atau<br>Normal-Normal"]
    O --> P["Update parameter prior<br>hitung mean posterior"]

Follow-up Options
  1. “Berikan contoh soal MLE untuk distribusi Normal dengan kedua parameter tidak diketahui”
  2. “Jelaskan hubungan 4.5 Estimasi Parameter dengan 4.6 Sifat-Sifat Estimator (tak-bias, efisiensi, Cramér-Rao)”
  3. “Buat flashcard 1-halaman untuk pasangan prior konjugat yang sering diuji di CF2”

📖 Ref: Miller et al. (2014) Bab 10.1–10.4; Hogg-McKean-Craig (2019) Bab 6.1–6.3, 7.2; Hogg-Tanis-Zimm (2015) Bab 5.5–5.6 | 🗓️ 2026-02-21 | #CF2 #Inferensi #EstimasiParameter #MLE #MetodeMomen #Bayes