PAI · AAMAI · 2026
Aktuaria
Indonesia
CF2 · Materi 4.3

Teorema Limit Pusat (CLT)

2026-02-21 Medium Bobot: 15–25% Hogg-Tanis-Zimmerman (2015) Bab 5.3–5.4; Hogg-McKean-Craig (2019) Bab 4.1–4.2; Miller et al. (2014) Bab 8.6–8.7; Walpole et al. (2012) Bab 8.3
CF2InferensStatistikCLTTeoremaLimitPusatNormalAproksimasiKonvergensiDistribusiSampelTopikEmpat

📊 4.3 — Teorema Limit Pusat (CLT)

Ringkasan Cepat

Topik: Teorema Limit Pusat (Central Limit Theorem) — Aproksimasi Normal untuk Xˉ\bar{X} dan SnS_n | Bobot: ~15–25% | Difficulty: Medium Ref: Hogg-Tanis-Zimm (2015) Bab 5.3–5.4; Hogg-McKean-Craig (2019) Bab 4.1–4.2; Miller et al. (2014) Bab 8.6–8.7; Walpole et al. (2012) Bab 8.3 | Prereq: 2.3 Fungsi Pembangkit, 2.6 Distribusi Kontinu Umum, 4.1 Penarikan Sampel Acak, 4.2 Distribusi Sampel

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 4: Inferensi Statistik4.3Menyatakan CLT secara formal untuk Xˉ\bar{X} dan Sn=XiS_n = \sum X_i; menerapkan aproksimasi Normal untuk berbagai distribusi populasi (Binomial, Poisson, Gamma, Uniform); menentukan ukuran sampel minimal untuk validitas aproksimasi; menghitung probabilitas aproksimasi menggunakan tabel Φ\Phi dengan standarisasi yang benar; memahami koreksi kontinuitas untuk aproksimasi distribusi diskrit ke Normal; menyatakan dan menggunakan Hukum Bilangan Besar (LLN) sebagai hasil terkait CLT15–25%Medium2.3 Fungsi Pembangkit, 2.6 Distribusi Kontinu Umum, 4.1 Penarikan Sampel Acak, 4.2 Distribusi Sampel4.1 Penarikan Sampel Acak, 4.2 Distribusi Sampel, 4.4 Hukum Bilangan Besar (LLN), 4.5 Estimasi Parameter, 4.8 Interval KepercayaanHogg-Tanis-Zimm (2015) Bab 5.3–5.4; Hogg-McKean-Craig (2019) Bab 4.1–4.2; Miller et al. (2014) Bab 8.6–8.7; Walpole et al. (2012) Bab 8.3

Section 1 — Intuisi

Ada satu hasil dalam teori probabilitas yang lebih menakjubkan dari hampir semua yang lain: apapun bentuk distribusi populasi asal — miring kanan, miring kiri, diskrit, kontinu, bimodal — jika kita mengambil rata-rata dari sampel yang cukup besar, distribusi dari rata-rata itu akan mendekati distribusi Normal. Ini bukan kebetulan atau aproksimasi kasar: ini adalah Teorema Limit Pusat, salah satu teorema paling fundamental dalam matematika.

Bayangkan klaim asuransi tunggal XX berdistribusi Eksponensial — miring kanan ekstrem, tidak simetris sama sekali. Namun, jika perusahaan asuransi menanggung 500 polis, total klaim S500=XiS_{500} = \sum X_i dan rata-rata klaim Xˉ500\bar{X}_{500} akan mengikuti distribusi yang hampir persis Normal. Mengapa? Secara intuitif: fluktuasi di satu arah dari satu polis cenderung diimbangi oleh fluktuasi berlawanan dari polis lain. Semakin banyak polis, semakin sempurna keseimbangan ini, dan distribusi rata-rata semakin simetris dan berbentuk lonceng.

Implikasi aktuaria sangat luas. CLT adalah justifikasi teoritis mengapa pendekatan Normal digunakan secara universal dalam portofolio besar — untuk menghitung modal berbasis risiko (risk-based capital), value at risk, dan premi kolektif. Tanpa CLT, setiap distribusi klaim yang berbeda akan membutuhkan metode komputasi yang berbeda. Dengan CLT, kita memiliki satu alat pemersatu: selama nn cukup besar dan distribusi asal memiliki momen terbatas, semuanya bermuara ke Normal.

Yang tidak kalah pentingnya adalah apa yang tidak dijamin CLT. Ia hanya berbicara tentang distribusi limit — seberapa cepat konvergensi ke Normal bergantung pada bentuk distribusi asal. Untuk distribusi simetris dan “ringan ekor” (seperti Uniform), n=10n = 10 sudah cukup. Untuk distribusi sangat miring atau “berat ekor” (seperti distribusi dengan variansi besar), mungkin dibutuhkan n=100n = 100 atau lebih. Mengenali batas-batas berlakunya CLT adalah keterampilan kritis yang membedakan penggunaan yang tepat dari yang keliru.

Section 2 — Definisi Formal

Definisi Matematis

Teorema Limit Pusat (Versi Standar): Misalkan X1,X2,,Xni.i.d.f(x)X_1, X_2, \ldots, X_n \overset{\text{i.i.d.}}{\sim} f(x) dengan E[Xi]=μ<E[X_i] = \mu < \infty dan Var(Xi)=σ2<\text{Var}(X_i) = \sigma^2 < \infty. Definisikan: Xˉn=1ni=1nXi,Sn=i=1nXi\bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i, \qquad S_n = \sum_{i=1}^n X_i

Maka untuk setiap bilangan real zz: limnP ⁣(Xˉnμσ/nz)=Φ(z)\lim_{n \to \infty} P\!\left(\frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \leq z\right) = \Phi(z)

atau ekuivalen: limnP ⁣(Snnμσnz)=Φ(z)\lim_{n \to \infty} P\!\left(\frac{S_n - n\mu}{\sigma\sqrt{n}} \leq z\right) = \Phi(z)

Notasi Konvergensi dalam Distribusi: Xˉnμσ/ndN(0,1)saat n\frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1) \quad \text{saat } n \to \infty

Aproksimasi Praktis (untuk nn cukup besar): XˉnapproxN ⁣(μ,  σ2n),SnapproxN(nμ,  nσ2)\bar{X}_n \overset{\text{approx}}{\sim} N\!\left(\mu,\; \frac{\sigma^2}{n}\right), \qquad S_n \overset{\text{approx}}{\sim} N(n\mu,\; n\sigma^2)

Variabel & Parameter

SimbolMaknaCatatan
μ=E[Xi]\mu = E[X_i]Mean populasiHarus terbatas — syarat eksistensi CLT
σ2=Var(Xi)\sigma^2 = \text{Var}(X_i)Variansi populasiHarus terbatas dan positif — syarat kritis CLT; distribusi Cauchy tidak memenuhi
Xˉn\bar{X}_nMean sampel berukuran nnVariabel acak dengan distribusi mendekati N(μ,σ2/n)N(\mu, \sigma^2/n)
Sn=XiS_n = \sum X_iJumlah sampelVariabel acak dengan distribusi mendekati N(nμ,nσ2)N(n\mu, n\sigma^2)
Zn=(Xˉnμ)/(σ/n)Z_n = (\bar{X}_n - \mu)/(\sigma/\sqrt{n})Statistik CLT terstandarisasiKonvergen ke N(0,1)N(0,1) dalam distribusi
d\xrightarrow{d}Konvergensi dalam distribusi (convergence in distribution)Bukan konvergensi nilai; distribusi CDF konvergen ke Φ\Phi
nminn_{\min}Ukuran sampel minimal untuk validitas aproksimasiBergantung distribusi asal: 30\approx 30 untuk simetris; lebih besar untuk skewed
CCKoreksi kontinuitas (continuity correction)±0,5\pm 0{,}5 untuk aproksimasi distribusi diskrit dengan Normal

Rumus Utama

Zn=Xˉnμσ/ndN(0,1)(n)Z_n = \frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \xrightarrow{d} N(0,1) \quad (n \to \infty)

Label: CLT untuk Mean Sampel — standarisasi menggunakan σ/n\sigma/\sqrt{n} (standar error), bukan σ\sigma; ini adalah bentuk CLT yang paling sering digunakan di soal CF2.

Zn=SnnμσndN(0,1)(n)Z_n = \frac{S_n - n\mu}{\sigma\sqrt{n}} \xrightarrow{d} N(0,1) \quad (n \to \infty)

Label: CLT untuk Jumlah Sampel — ekuivalen dengan CLT untuk mean; digunakan ketika soal melibatkan total (penjumlahan) bukan rata-rata.

P(aXˉnb)Φ ⁣(bμσ/n)Φ ⁣(aμσ/n)P(a \leq \bar{X}_n \leq b) \approx \Phi\!\left(\frac{b - \mu}{\sigma/\sqrt{n}}\right) - \Phi\!\left(\frac{a - \mu}{\sigma/\sqrt{n}}\right)

Label: Aproksimasi Probabilitas via CLT — formula kerja untuk menghitung probabilitas menggunakan aproksimasi Normal; valid untuk nn cukup besar.

P(aSnb)Φ ⁣(bnμσn)Φ ⁣(anμσn)P(a \leq S_n \leq b) \approx \Phi\!\left(\frac{b - n\mu}{\sigma\sqrt{n}}\right) - \Phi\!\left(\frac{a - n\mu}{\sigma\sqrt{n}}\right)

Label: Aproksimasi Probabilitas untuk Jumlah — untuk total klaim, total skor, dsb.; standarisasi menggunakan σn\sigma\sqrt{n} (bukan σ/n\sigma/\sqrt{n}).

P(Xk)Φ ⁣(k+0,5μσ)(koreksi kontinuitas, distribusi diskrit)P(X \leq k) \approx \Phi\!\left(\frac{k + 0{,}5 - \mu}{\sigma}\right) \quad \text{(koreksi kontinuitas, distribusi diskrit)}

Label: Koreksi Kontinuitas — saat mengaproksimasi distribusi diskrit (Binomial, Poisson) dengan Normal; ±0,5\pm 0{,}5 mengkompensasi transisi dari diskrit ke kontinu; meningkatkan akurasi aproksimasi secara signifikan.

Asumsi Eksplisit

  • i.i.d.: Variabel acak X1,,XnX_1,\ldots,X_n harus independen dan identik terdistribusi — syarat paling mendasar. CLT umum (Lindeberg-Lévy) dapat melonggarkan ini, tetapi di CF2 asumsi i.i.d. selalu berlaku.
  • Momen terbatas: μ=E[X]<\mu = E[X] < \infty dan σ2=Var(X)<\sigma^2 = \text{Var}(X) < \inftykedua syarat ini wajib. Distribusi Cauchy (f(x)1/(1+x2)f(x) \propto 1/(1+x^2)) tidak memiliki mean terbatas dan CLT tidak berlaku untuknya.
  • nn cukup besar: CLT adalah pernyataan limit (nn \to \infty). Untuk penggunaan praktis: aturan umum n30n \geq 30 untuk distribusi mendekati simetris; n50n \geq 50 hingga n100n \geq 100 untuk distribusi sangat miring (highly skewed). Ini bukan aturan absolut — distribusi Normal menghasilkan aproksimasi sempurna untuk nn berapapun.
  • Tidak memerlukan distribusi populasi Normal: Ini adalah kekuatan CLT — ia bekerja untuk distribusi apapun selama dua syarat momen di atas terpenuhi.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Mengapa CLT bekerja — Sketsa Bukti via MGF:

Misalkan Yi=(Xiμ)/σY_i = (X_i - \mu)/\sigma sehingga E[Yi]=0E[Y_i] = 0 dan Var(Yi)=1\text{Var}(Y_i) = 1. Maka: Zn=Xˉnμσ/n=1ni=1nYiZ_n = \frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} = \frac{1}{\sqrt{n}}\sum_{i=1}^n Y_i

MGF dari ZnZ_n (menggunakan independensi): MZn(t)=[MY ⁣(tn)]nM_{Z_n}(t) = \left[M_Y\!\left(\frac{t}{\sqrt{n}}\right)\right]^n

Ekspansi Taylor MY(s)=1+E[Y]s+E[Y2]s2/2+O(s3)=1+0+s2/2+O(s3)M_Y(s) = 1 + E[Y]s + E[Y^2]s^2/2 + O(s^3) = 1 + 0 + s^2/2 + O(s^3) (karena E[Y]=0E[Y]=0, E[Y2]=1E[Y^2]=1): MY ⁣(tn)=1+t22n+O ⁣(n3/2)M_Y\!\left(\frac{t}{\sqrt{n}}\right) = 1 + \frac{t^2}{2n} + O\!\left(n^{-3/2}\right)

Maka: MZn(t)=[1+t22n+O(n3/2)]nnet2/2M_{Z_n}(t) = \left[1 + \frac{t^2}{2n} + O(n^{-3/2})\right]^n \xrightarrow{n\to\infty} e^{t^2/2}

(menggunakan (1+a/n)nea(1 + a/n)^n \to e^a)

Karena et2/2e^{t^2/2} adalah MGF N(0,1)N(0,1), dan MGF mengkarakterisasi distribusi (Uniqueness Theorem): ZndN(0,1)Z_n \xrightarrow{d} N(0,1) \quad \checkmark

Kunci: Konvergensi MGF ke MGF Normal mengimplikasikan konvergensi distribusi. Bukti ini valid selama MGF XiX_i terdefinisi pada suatu lingkungan t=0t = 0 — kondisi yang lebih kuat dari sekadar variansi terbatas, tetapi cukup untuk sebagian besar distribusi yang digunakan di CF2.

CLT untuk Distribusi Spesifik
Distribusi Asalμ\muσ2\sigma^2Aproksimasi SnS_nCatatan
B(1,p)B(1,p) (Bernoulli)ppp(1p)p(1-p)Sn=XB(n,p)N(np,np(1p))S_n = X \sim B(n,p) \approx N(np, np(1-p))CLT menjelaskan aproksimasi Normal-Binomial
Poisson(λ)\text{Poisson}(\lambda) individualλ\lambdaλ\lambdaSnN(nλ,nλ)S_n \approx N(n\lambda, n\lambda)SnPoisson(nλ)S_n \sim \text{Poisson}(n\lambda) eksak; CLT digunakan untuk nλn\lambda besar
Exp(β)\text{Exp}(\beta)β\betaβ2\beta^2SnN(nβ,nβ2)S_n \approx N(n\beta, n\beta^2)SnS_n eksak Γ(n,β)\Gamma(n,\beta); CLT digunakan untuk nn besar
U(a,b)U(a,b)(a+b)/2(a+b)/2(ba)2/12(b-a)^2/12Konvergensi cepat, n5n \geq 5 cukupDistribusi simetris, konvergensi sangat cepat
Γ(α,β)\Gamma(\alpha,\beta)αβ\alpha\betaαβ2\alpha\beta^2Aproksimasi lebih baik untuk α\alpha besarα\alpha besar → distribusi lebih simetris

Aproksimasi Normal-Binomial (kasus khusus penting): Jika XB(n,p)X \sim B(n,p), maka untuk nn besar: XN(np,  np(1p))X \approx N(np,\; np(1-p)) Aturan praktis: valid jika np5np \geq 5 dan n(1p)5n(1-p) \geq 5.

Koreksi Kontinuitas — Mengapa dan Bagaimana:

Distribusi Binomial dan Poisson adalah diskrit: P(X=k)P(X = k) adalah probabilitas titik. Distribusi Normal adalah kontinu: P(X=k)=0P(X = k) = 0. Koreksi kontinuitas menjembatani ini dengan memperlakukan nilai diskrit kk sebagai interval kontinu [k0,5,  k+0,5][k-0{,}5,\; k+0{,}5]:

P(X=k)P ⁣(k0,5ZNormalk+0,5)P(X = k) \approx P\!\left(k-0{,}5 \leq Z_{\text{Normal}} \leq k+0{,}5\right)

P(Xk)P ⁣(ZNormalk+0,5)=Φ ⁣(k+0,5μσ)P(X \leq k) \approx P\!\left(Z_{\text{Normal}} \leq k+0{,}5\right) = \Phi\!\left(\frac{k+0{,}5-\mu}{\sigma}\right)

P(Xk)P ⁣(ZNormalk0,5)=1Φ ⁣(k0,5μσ)P(X \geq k) \approx P\!\left(Z_{\text{Normal}} \geq k-0{,}5\right) = 1 - \Phi\!\left(\frac{k-0{,}5-\mu}{\sigma}\right)

P(jXk)Φ ⁣(k+0,5μσ)Φ ⁣(j0,5μσ)P(j \leq X \leq k) \approx \Phi\!\left(\frac{k+0{,}5-\mu}{\sigma}\right) - \Phi\!\left(\frac{j-0{,}5-\mu}{\sigma}\right)

Aturan arah +0,5+0{,}5 atau 0,5-0{,}5: Sisi yang “lebih inklusif” mendapatkan tanda yang “memperlebar” interval:

  • k\leq k (inklusif atas) → k+0,5k + 0{,}5 (perlebar ke atas)
  • <k< k (eksklusif atas) → k0,5k - 0{,}5 (persempit ke atas)
  • k\geq k (inklusif bawah) → k0,5k - 0{,}5 (perlebar ke bawah)
  • >k> k (eksklusif bawah) → k+0,5k + 0{,}5 (persempit ke bawah)

Hukum Bilangan Besar (LLN) — Hasil Terkait:

LLN adalah pernyataan yang lebih lemah dari CLT namun lebih mendasar. CLT mengatakan distribusi Xˉn\bar{X}_n mendekati Normal; LLN mengatakan nilai Xˉn\bar{X}_n mendekati μ\mu:

XˉnPμ(n)(LLN Lemah)\bar{X}_n \xrightarrow{P} \mu \quad (n \to \infty) \qquad \text{(LLN Lemah)}

P(Xˉnμ>ε)0 untuk setiap ε>0P(|\bar{X}_n - \mu| > \varepsilon) \to 0 \text{ untuk setiap } \varepsilon > 0

LLN hanya memerlukan E[X]<E[X] < \infty (tidak perlu variansi terbatas); CLT memerlukan Var(X)<\text{Var}(X) < \infty. Setiap distribusi yang memenuhi syarat CLT juga memenuhi LLN, tetapi tidak sebaliknya.

Dilarang
  1. Dilarang menerapkan CLT untuk distribusi dengan variansi tidak terbatas (misalnya Pareto dengan ekor sangat berat, atau Cauchy). Syarat σ2<\sigma^2 < \infty adalah wajib. Untuk distribusi berat ekor yang relevan di aktuaria (misalnya distribusi dengan α<2\alpha < 2 untuk distribusi stabil), CLT tidak berlaku dalam bentuk standar.
  2. Dilarang menggunakan aproksimasi Normal tanpa koreksi kontinuitas untuk distribusi diskrit (Binomial, Poisson) jika presisi diperlukan. Tanpa koreksi kontinuitas, kesalahan aproksimasi bisa signifikan terutama untuk nn yang tidak terlalu besar.
  3. Dilarang mengabaikan arah koreksi kontinuitas. Untuk P(Xk)P(X \leq k): gunakan k+0,5k + 0{,}5 (bukan k0,5k - 0{,}5). Terbalik arahnya menghasilkan kesalahan aproksimasi yang lebih buruk daripada tanpa koreksi sama sekali.

Section 4 — Contoh Soal

Soal A — Fundamental

Sebuah perusahaan asuransi menanggung n=100n = 100 polis secara independen. Nilai klaim masing-masing polis berdistribusi dengan μ=500\mu = 500 ribu rupiah dan σ=200\sigma = 200 ribu rupiah (distribusi populasi tidak diketahui bentuknya).

(a) Nyatakan distribusi aproksimasi dari Xˉ100\bar{X}_{100} menggunakan CLT. (b) Hitung P(480Xˉ530)P(480 \leq \bar{X} \leq 530). (c) Nyatakan distribusi aproksimasi dari S100=i=1100XiS_{100} = \sum_{i=1}^{100} X_i (total klaim). (d) Hitung P(S100>52.000)P(S_{100} > 52.000) (dalam satuan ribu rupiah). (e) Tentukan batas cc sehingga P(Xˉc)=0,99P(\bar{X} \leq c) = 0{,}99.

Solusi Soal A

1. Identifikasi Variabel

  • XiX_i i.i.d.; μ=500\mu = 500, σ=200\sigma = 200 (satuan: ribu rupiah)
  • n=100n = 100; distribusi asal tidak diketahui
  • SE(Xˉ)=σ/n=200/100=200/10=20\text{SE}(\bar{X}) = \sigma/\sqrt{n} = 200/\sqrt{100} = 200/10 = 20

2. Identifikasi Distribusi / Model CLT berlaku karena μ\mu dan σ2\sigma^2 terbatas dan n=10030n = 100 \geq 30. Distribusi populasi tidak perlu diketahui.

3. Setup Persamaan

CLT: XˉapproxN(500,202)\bar{X} \overset{\text{approx}}{\sim} N(500, 20^2) dan S100approxN(100×500,  100×2002)=N(50.000,  4.000.000)S_{100} \overset{\text{approx}}{\sim} N(100 \times 500,\; 100 \times 200^2) = N(50.000,\; 4.000.000)

4. Eksekusi Aljabar

(a) Distribusi aproksimasi Xˉ\bar{X}: XˉapproxN ⁣(500,  2002100)=N(500,  400)\bar{X} \overset{\text{approx}}{\sim} N\!\left(500,\; \frac{200^2}{100}\right) = N(500,\; 400) Standar error: SE(Xˉ)=400=20\text{SE}(\bar{X}) = \sqrt{400} = 20 ribu rupiah.

(b) P(480Xˉ530)P(480 \leq \bar{X} \leq 530):

Standarisasi: z1=48050020=2020=1,00,z2=53050020=3020=1,50z_1 = \frac{480 - 500}{20} = \frac{-20}{20} = -1{,}00, \qquad z_2 = \frac{530 - 500}{20} = \frac{30}{20} = 1{,}50

P(480Xˉ530)Φ(1,50)Φ(1,00)=0,9332(10,8413)P(480 \leq \bar{X} \leq 530) \approx \Phi(1{,}50) - \Phi(-1{,}00) = 0{,}9332 - (1 - 0{,}8413) =0,93320,1587=0,7745= 0{,}9332 - 0{,}1587 = 0{,}7745

(c) Distribusi aproksimasi S100S_{100}: S100approxN(nμ,  nσ2)=N(100×500,  100×2002)S_{100} \overset{\text{approx}}{\sim} N(n\mu,\; n\sigma^2) = N(100 \times 500,\; 100 \times 200^2) =N(50.000,  4.000.000)= N(50.000,\; 4.000.000) Standar deviasi S100S_{100}: σS=σn=200100=2.000\sigma_{S} = \sigma\sqrt{n} = 200\sqrt{100} = 2.000 ribu rupiah.

(d) P(S100>52.000)P(S_{100} > 52.000):

Standarisasi menggunakan σS=2.000\sigma_S = 2.000: z=52.00050.0002.000=2.0002.000=1,00z = \frac{52.000 - 50.000}{2.000} = \frac{2.000}{2.000} = 1{,}00

P(S100>52.000)1Φ(1,00)=10,8413=0,1587P(S_{100} > 52.000) \approx 1 - \Phi(1{,}00) = 1 - 0{,}8413 = 0{,}1587

(e) Nilai cc sehingga P(Xˉc)=0,99P(\bar{X} \leq c) = 0{,}99:

P ⁣(Xˉ50020c50020)=0,99    Φ ⁣(c50020)=0,99P\!\left(\frac{\bar{X}-500}{20} \leq \frac{c-500}{20}\right) = 0{,}99 \implies \Phi\!\left(\frac{c-500}{20}\right) = 0{,}99

Dari tabel: Φ(z)=0,99    z=2,326\Phi(z) = 0{,}99 \implies z = 2{,}326: c50020=2,326    c=500+20×2,326=500+46,52=546,52 ribu rupiah\frac{c - 500}{20} = 2{,}326 \implies c = 500 + 20 \times 2{,}326 = 500 + 46{,}52 = 546{,}52 \text{ ribu rupiah}

5. Verification

  • Standar deviasi Xˉ=20\bar{X} = 20 vs σ=200\sigma = 200: pengambilan rata-rata 100 pengamatan mengurangi variabilitas oleh faktor 100=10\sqrt{100} = 10
  • P(480Xˉ530)=0,775P(480 \leq \bar{X} \leq 530) = 0{,}775: interval mencakup μ=500\mu = 500 dan selebar [1σXˉ,+1,5σXˉ][-1\sigma_{\bar{X}}, +1{,}5\sigma_{\bar{X}}] — probabilitas sekitar 77% wajar ✓
  • c=546,52c = 546{,}52: persentil ke-99 dari N(500,400)N(500,400) — selisih dari mean adalah 46,52=2,326×2046{,}52 = 2{,}326 \times 20
  • Hubungan Xˉ\bar{X} dan S100S_{100}: P(S100>52.000)=P(Xˉ>520)=P(Z>1,00)=0,1587P(S_{100} > 52.000) = P(\bar{X} > 520) = P(Z > 1{,}00) = 0{,}1587 — konsisten dengan bagian (d) karena S100=100XˉS_{100} = 100 \bar{X}
Exam Tips — Soal A

Target waktu: 10–12 menit Common trap 1: Standar error untuk Xˉ\bar{X} adalah σ/n\sigma/\sqrt{n}, bukan σ/n\sigma/n dan bukan σ\sigma. Untuk n=100n=100: SE=200/10=20\text{SE} = 200/10 = 20, bukan 200/100=2200/100 = 2. Common trap 2: Standar deviasi untuk SnS_n adalah σn\sigma\sqrt{n} (bukan σ/n\sigma/\sqrt{n}). Untuk n=100n=100: σS=200100=2.000\sigma_S = 200\sqrt{100} = 2.000, bukan 20. Shortcut: Verifikasi konsistensi: P(Sn>cS)=P(Xˉ>cS/n)P(S_n > c_S) = P(\bar{X} > c_S/n) — selalu periksa bahwa jawaban bagian SnS_n konsisten dengan bagian Xˉ\bar{X} ketika keduanya ada dalam soal.


Soal B — Exam-Typical

Suatu perusahaan asuransi menerbitkan 200 polis. Probabilitas setiap polis mengajukan klaim dalam setahun adalah p=0,3p = 0{,}3, independen satu sama lain. Misalkan XX = jumlah polis yang mengajukan klaim.

(a) Identifikasi distribusi eksak XX dan nyatakan E[X]E[X] serta Var(X)\text{Var}(X). (b) Gunakan CLT (tanpa koreksi kontinuitas) untuk mengaproksimasi P(X55)P(X \leq 55). (c) Ulangi bagian (b) dengan koreksi kontinuitas dan bandingkan hasilnya. (d) Gunakan CLT untuk mengaproksimasi P(50X70)P(50 \leq X \leq 70) dengan koreksi kontinuitas. (e) Tentukan nilai kk terkecil sehingga P(Xk)0,90P(X \leq k) \geq 0{,}90 menggunakan aproksimasi Normal dengan koreksi kontinuitas.

Solusi Soal B

1. Identifikasi Variabel

  • X=i=1200BiX = \sum_{i=1}^{200} B_i di mana BiBern(0,3)B_i \sim \text{Bern}(0{,}3) i.i.d. → XB(200,0,3)X \sim B(200, 0{,}3)
  • μX=np=200×0,3=60\mu_X = np = 200 \times 0{,}3 = 60
  • σX2=np(1p)=200×0,3×0,7=42\sigma_X^2 = np(1-p) = 200 \times 0{,}3 \times 0{,}7 = 42; σX=426,481\sigma_X = \sqrt{42} \approx 6{,}481
  • Cek validitas CLT: np=605np = 60 \geq 5 ✓ dan n(1p)=1405n(1-p) = 140 \geq 5

2. Identifikasi Distribusi / Model Distribusi eksak: B(200,0,3)B(200, 0{,}3). CLT berlaku karena n=200n=200 besar dan pp tidak ekstrem. Aproksimasi Normal: XN(60,42)X \approx N(60, 42).

3. Setup Persamaan

Standarisasi: Z=(X60)/42Z = (X - 60)/\sqrt{42}

4. Eksekusi Aljabar

(a) Distribusi eksak, E[X]E[X], Var(X)\text{Var}(X): XB(200,0,3),E[X]=60,Var(X)=42X \sim B(200, 0{,}3), \quad E[X] = 60, \quad \text{Var}(X) = 42

(b) P(X55)P(X \leq 55) tanpa koreksi kontinuitas:

z=556042=56,481=0,7715z = \frac{55 - 60}{\sqrt{42}} = \frac{-5}{6{,}481} = -0{,}7715

P(X55)Φ(0,772)=1Φ(0,772)10,7801=0,2199P(X \leq 55) \approx \Phi(-0{,}772) = 1 - \Phi(0{,}772) \approx 1 - 0{,}7801 = 0{,}2199

(c) P(X55)P(X \leq 55) dengan koreksi kontinuitas:

Karena 55\leq 55 (inklusif), gunakan batas atas 55+0,5=55,555 + 0{,}5 = 55{,}5:

zCC=55,56042=4,56,481=0,6943z_{\text{CC}} = \frac{55{,}5 - 60}{\sqrt{42}} = \frac{-4{,}5}{6{,}481} = -0{,}6943

P(X55)Φ(0,694)=1Φ(0,694)10,7561=0,2439P(X \leq 55) \approx \Phi(-0{,}694) = 1 - \Phi(0{,}694) \approx 1 - 0{,}7561 = 0{,}2439

Nilai eksak (Binomial): P(X55)0,2443P(X \leq 55) \approx 0{,}2443.

Perbandingan:

MetodeNilaiKesalahan vs Eksak
Normal tanpa CC0{,}21990,0244-0{,}0244 (2,44%)
Normal dengan CC0{,}24390,0004-0{,}0004 (0,04%)
Eksak (Binomial)0{,}2443

Koreksi kontinuitas meningkatkan akurasi dari 2,44% menjadi 0,04%.

(d) P(50X70)P(50 \leq X \leq 70) dengan koreksi kontinuitas:

Interval inklusif di kedua sisi: gunakan 49,549{,}5 hingga 70,570{,}5:

z1=49,56042=10,56,481=1,620z_1 = \frac{49{,}5 - 60}{\sqrt{42}} = \frac{-10{,}5}{6{,}481} = -1{,}620 z2=70,56042=10,56,481=1,620z_2 = \frac{70{,}5 - 60}{\sqrt{42}} = \frac{10{,}5}{6{,}481} = 1{,}620

P(50X70)Φ(1,620)Φ(1,620)=2Φ(1,620)1P(50 \leq X \leq 70) \approx \Phi(1{,}620) - \Phi(-1{,}620) = 2\Phi(1{,}620) - 1 =2(0,9474)1=0,8948= 2(0{,}9474) - 1 = 0{,}8948

(e) kk terkecil sehingga P(Xk)0,90P(X \leq k) \geq 0{,}90:

Dengan koreksi kontinuitas, P(Xk)Φ ⁣(k+0,56042)0,90P(X \leq k) \approx \Phi\!\left(\frac{k+0{,}5-60}{\sqrt{42}}\right) \geq 0{,}90:

k+0,56042z0,10=1,282\frac{k + 0{,}5 - 60}{\sqrt{42}} \geq z_{0{,}10} = 1{,}282

k+0,5601,282×6,481=8,307k + 0{,}5 - 60 \geq 1{,}282 \times 6{,}481 = 8{,}307

k600,5+8,307=67,807k \geq 60 - 0{,}5 + 8{,}307 = 67{,}807

Karena kk harus integer: kmin=68k_{\min} = 68.

Verifikasi: Φ ⁣(68,5606,481)=Φ(1,311)0,9050,90\Phi\!\left(\frac{68{,}5 - 60}{6{,}481}\right) = \Phi(1{,}311) \approx 0{,}905 \geq 0{,}90

Cek k=67k=67: Φ ⁣(67,5606,481)=Φ(1,157)0,876<0,90\Phi\!\left(\frac{67{,}5-60}{6{,}481}\right) = \Phi(1{,}157) \approx 0{,}876 < 0{,}90

5. Verification

  • Cek CLT valid: np=605np = 60 \geq 5 dan nq=1405nq = 140 \geq 5
  • Koreksi kontinuitas drastis meningkatkan akurasi (error 2,44% → 0,04%) ✓
  • P(50X70)P(50 \leq X \leq 70): interval simetris sekitar μ=60\mu = 60 dengan lebar ±10±1,54σ\pm 10 \approx \pm 1{,}54\sigma → probabilitas sekitar 87-88% wajar ✓
  • kmin=68>μ=60k_{\min} = 68 > \mu = 60: persentil ke-90 di atas mean untuk distribusi yang tidak terlalu skewed ✓
Exam Tips — Soal B

Target waktu: 14–16 menit Common trap 1: Arah koreksi kontinuitas paling sering salah. Hafal aturan: P(Xk)P(X \leq k) → gunakan k+0,5k + 0{,}5; P(Xk)P(X \geq k) → gunakan k0,5k - 0{,}5. Bayangkan bahwa k\leq k “mencakup” hingga tepat sebelum k+1k+1, yaitu k+0,5k+0{,}5. Common trap 2: Untuk P(50X70)P(50 \leq X \leq 70) dengan CC: batas bawah inklusif menggunakan 500,5=49,550 - 0{,}5 = 49{,}5 (perlebar ke bawah), batas atas inklusif menggunakan 70+0,5=70,570 + 0{,}5 = 70{,}5 (perlebar ke atas). Common trap 3: Untuk bagian (e), setelah mendapat k67,807k \geq 67{,}807, bulatkan ke atas ke 68 karena kk adalah integer dan harus memenuhi 0,90\geq 0{,}90.


Soal C — Challenging

Waktu proses setiap klaim di sebuah perusahaan asuransi berdistribusi Exp(β=4)\text{Exp}(\beta = 4) (rata-rata 4 hari per klaim, parametrisasi skala). Ada n=36n = 36 klaim independen yang harus diproses.

(a) Nyatakan distribusi eksak dari total waktu proses S36=i=136XiS_{36} = \sum_{i=1}^{36} X_i dan hitung E[S36]E[S_{36}] serta Var(S36)\text{Var}(S_{36}). (b) Gunakan CLT untuk mengaproksimasi P(130S36160)P(130 \leq S_{36} \leq 160) dan bandingkan dengan nilai dari distribusi Gamma eksak. (c) Hitung P(Xˉ36>5)P(\bar{X}_{36} > 5) menggunakan CLT dan interpretasikan hasilnya dalam konteks aktuaria. (d) Tentukan nilai t0t_0 sehingga P(S36t0)=0,95P(S_{36} \leq t_0) = 0{,}95 menggunakan aproksimasi CLT. (e) Untuk ukuran sampel nn berapakah aproksimasi Normal untuk Xˉ\bar{X} dari distribusi Exp(β)\text{Exp}(\beta) dianggap “cukup baik”? Diskusikan faktor yang memengaruhi laju konvergensi CLT untuk distribusi Eksponensial.

Solusi Soal C

1. Identifikasi Variabel

  • Xii.i.d.Exp(β=4)X_i \overset{\text{i.i.d.}}{\sim} \text{Exp}(\beta=4): μ=β=4\mu = \beta = 4, σ2=β2=16\sigma^2 = \beta^2 = 16, σ=4\sigma = 4
  • n=36n = 36; SE(Xˉ)=σ/n=4/6=2/3\text{SE}(\bar{X}) = \sigma/\sqrt{n} = 4/6 = 2/3

2. Identifikasi Distribusi / Model Distribusi eksak S36S_{36}: penjumlahan 36 Eksponensial i.i.d. Γ(36,β=4)\to \Gamma(36, \beta=4).

Aproksimasi CLT: S36N(nμ,nσ2)=N(144,576)S_{36} \approx N(n\mu, n\sigma^2) = N(144, 576); σS=24\sigma_{S} = 24.

3. Setup Persamaan

Standarisasi S36S_{36}: Z=(S36144)/24Z = (S_{36} - 144)/24

4. Eksekusi Aljabar

(a) Distribusi eksak, E[S36]E[S_{36}], Var(S36)\text{Var}(S_{36}):

Penjumlahan 36 Eksponensial i.i.d. Γ(36,β=4)\to \Gamma(36, \beta=4): S36Γ(α=36,  β=4)S_{36} \sim \Gamma(\alpha=36,\;\beta=4) E[S36]=αβ=36×4=144 hariE[S_{36}] = \alpha\beta = 36 \times 4 = 144 \text{ hari} Var(S36)=αβ2=36×16=576,σS=24 hari\text{Var}(S_{36}) = \alpha\beta^2 = 36 \times 16 = 576, \quad \sigma_{S} = 24 \text{ hari}

(b) P(130S36160)P(130 \leq S_{36} \leq 160) — CLT vs Gamma eksak:

Via CLT: z1=13014424=1424=0,583z_1 = \frac{130 - 144}{24} = \frac{-14}{24} = -0{,}583 z2=16014424=1624=0,667z_2 = \frac{160 - 144}{24} = \frac{16}{24} = 0{,}667

P(130S36160)Φ(0,667)Φ(0,583)P(130 \leq S_{36} \leq 160) \approx \Phi(0{,}667) - \Phi(-0{,}583) =0,7476(10,7202)=0,74760,2798=0,4678= 0{,}7476 - (1 - 0{,}7202) = 0{,}7476 - 0{,}2798 = 0{,}4678

Via Gamma eksak (hubungan Gamma–Poisson, α=36Z+\alpha=36 \in \mathbb{Z}^+, λ=1/β=1/4\lambda = 1/\beta = 1/4):

P(S36s)=P ⁣(Poisson ⁣(sβ)α1)=P(Poisson(s/4)35)P(S_{36} \leq s) = P\!\left(\text{Poisson}\!\left(\frac{s}{\beta}\right) \leq \alpha - 1\right) = P(\text{Poisson}(s/4) \leq 35)

P(130S36160)=P(S36160)P(S36130)P(130 \leq S_{36} \leq 160) = P(S_{36}\leq 160) - P(S_{36} \leq 130) =P(Poisson(40)35)P(Poisson(32,5)35)= P(\text{Poisson}(40) \leq 35) - P(\text{Poisson}(32{,}5) \leq 35)

Untuk Poisson dengan λ\lambda besar, via CLT Poisson: P(Poisson(40)35)Φ ⁣(35,54040)=Φ(0,711)0,239P(\text{Poisson}(40) \leq 35) \approx \Phi\!\left(\frac{35{,}5-40}{\sqrt{40}}\right) = \Phi(-0{,}711) \approx 0{,}239 P(Poisson(32,5)35)Φ ⁣(35,532,532,5)=Φ(0,526)0,701P(\text{Poisson}(32{,}5) \leq 35) \approx \Phi\!\left(\frac{35{,}5-32{,}5}{\sqrt{32{,}5}}\right) = \Phi(0{,}526) \approx 0{,}701

P(130S36160)0,7010,239=0,462P(130 \leq S_{36} \leq 160) \approx 0{,}701 - 0{,}239 = 0{,}462

Perbandingan: CLT (0,4680{,}468) vs Gamma eksak via Poisson (0,4620{,}462) — perbedaan kecil, menunjukkan CLT cukup akurat untuk n=36n=36 dari Eksponensial.

(c) P(Xˉ36>5)P(\bar{X}_{36} > 5):

Xˉ36approxN ⁣(4,  1636)=N ⁣(4,  49),SE=23\bar{X}_{36} \overset{\text{approx}}{\sim} N\!\left(4,\; \frac{16}{36}\right) = N\!\left(4,\; \frac{4}{9}\right), \quad \text{SE} = \frac{2}{3}

P(Xˉ>5)P ⁣(Z>542/3)=P(Z>1,5)=1Φ(1,5)=10,9332=0,0668P(\bar{X} > 5) \approx P\!\left(Z > \frac{5-4}{2/3}\right) = P(Z > 1{,}5) = 1 - \Phi(1{,}5) = 1 - 0{,}9332 = 0{,}0668

Interpretasi aktuaria: Hanya sekitar 6,7% kemungkinan bahwa rata-rata waktu proses dari 36 klaim melebihi 5 hari (padahal rata-rata populasi hanya 4 hari). Ini menunjukkan bahwa dengan 36 klaim, rata-rata waktu proses cukup stabil di sekitar mean populasi — risiko keterlambatan sistemik relatif kecil.

(d) t0t_0 sehingga P(S36t0)=0,95P(S_{36} \leq t_0) = 0{,}95:

P ⁣(Zt014424)=0,95    t014424=z0,05=1,645P\!\left(Z \leq \frac{t_0 - 144}{24}\right) = 0{,}95 \implies \frac{t_0 - 144}{24} = z_{0{,}05} = 1{,}645

t0=144+24×1,645=144+39,48=183,48 harit_0 = 144 + 24 \times 1{,}645 = 144 + 39{,}48 = 183{,}48 \text{ hari}

Interpretasi: dengan probabilitas 95%, 36 klaim akan selesai diproses dalam 183,5 hari.

(e) Ukuran sampel minimal dan laju konvergensi:

Distribusi Eksponensial memiliki koefisien kemiringan (skewness) yang tinggi: γ1=2\gamma_1 = 2 (bandingkan dengan Normal: γ1=0\gamma_1 = 0). Berry-Esseen Theorem menyatakan bahwa kecepatan konvergensi CLT bergantung pada ρ=E[Xμ3]/σ3\rho = E[|X-\mu|^3]/\sigma^3. Untuk Eksponensial: ρ=2σ3/σ3=2\rho = 2\sigma^3/\sigma^3 = 2, mengimplikasikan error aproksimasi O(1/n)O(1/\sqrt{n}).

Panduan praktis untuk Eksponensial:

  • n30n \geq 30: aproksimasi Normal sudah cukup baik untuk sebagian besar kebutuhan
  • n50n \geq 50: aproksimasi sangat baik, error <1%< 1\% untuk probabilitas di sekitar mean
  • Untuk ekor ekstrem (z>2z > 2): butuh nn lebih besar karena ekor kanan Eksponensial lebih tebal dari Normal

Faktor yang memengaruhi laju konvergensi:

  1. Kemiringan (skewness) distribusi asal — semakin miring, konvergensi lebih lambat
  2. Kurtosis (kurtosis) — ekor lebih tebal → konvergensi lebih lambat
  3. Probabilitas yang dihitung — aproksimasi lebih baik di sekitar mean daripada di ekor
  4. Apakah nn cukup untuk np5np \geq 5 (untuk Binomial) atau λn\lambda n cukup besar (untuk Poisson)

5. Verification

  • E[S36]=144E[S_{36}] = 144, σS=24\sigma_S = 24: konsisten dengan Γ(36,4)\Gamma(36,4) via formula E=αβE = \alpha\beta dan SD=αβ=6×4=24\text{SD} = \sqrt{\alpha}\beta = 6\times4=24
  • CLT (0,4680{,}468) vs Gamma eksak (0,4620{,}462): perbedaan <1,5%< 1{,}5\%, aproksimasi baik untuk n=36n=36
  • P(Xˉ>5)=6,7%P(\bar{X} > 5) = 6{,}7\%: 5 hari adalah (μ+σXˉ1,5)=4+1=5(\mu + \sigma_{\bar{X}} \cdot 1{,}5) = 4 + 1 = 5 — berada 1,5 SE di atas mean, probabilitas 6,7% sesuai ✓
Exam Tips — Soal C

Target waktu: 18–22 menit Common trap 1: Untuk Sn=XiS_n = \sum X_i: standar deviasi adalah σn\sigma\sqrt{n}, bukan σ/n\sigma/\sqrt{n}. Keduanya =24= 24 untuk kasus ini karena σn=4×6=24\sigma\sqrt{n} = 4\times6 = 24 — kebetulan numeriknya sama dengan σ/n\sigma/\sqrt{n} untuk parameter berbeda, sehingga ini adalah soal yang perlu waspada. Common trap 2: Jangan bingung antara standarisasi Xˉ\bar{X} (bagi dengan σ/n\sigma/\sqrt{n}) dan standarisasi SnS_n (bagi dengan σn\sigma\sqrt{n}). Keduanya berbeda arah perpangkatan nn. Shortcut: Untuk persentil t0t_0 pada bagian (d): t0=nμ+zασnt_0 = n\mu + z_\alpha \cdot \sigma\sqrt{n} — rumus langsung untuk persentil ke-(1α)(1-\alpha) dari distribusi SnS_n.

Section 5 — Verifikasi & Sanity Check

Validasi Penerapan CLT

Sebelum menggunakan CLT:

  1. Distribusi asal: E[X]<E[X] < \infty dan Var(X)<\text{Var}(X) < \infty — wajib diperiksa ✓
  2. nn cukup besar: n30n \geq 30 untuk distribusi simetris ringan; n50n \geq 50100100 untuk distribusi skewed ✓
  3. Variabel i.i.d.: independen dan identik terdistribusi ✓
  4. Untuk Binomial: np5np \geq 5 dan n(1p)5n(1-p) \geq 5
Validasi Standarisasi

Dua kesalahan paling sering dalam standarisasi:

  1. Untuk Xˉ\bar{X}: standar deviasi adalah σ/n\sigma/\sqrt{n} (dibagi akar nn) ✓
  2. Untuk SnS_n: standar deviasi adalah σn\sigma\sqrt{n} (dikali akar nn) ✓
  3. Kedua rumus menghasilkan statistik yang sama: (Xˉμ)/(σ/n)=(Snnμ)/(σn)(\bar{X}-\mu)/(\sigma/\sqrt{n}) = (S_n - n\mu)/(\sigma\sqrt{n})
Validasi Koreksi Kontinuitas

Untuk distribusi diskrit:

  1. P(Xk)P(X \leq k): gunakan k+0,5k + 0{,}5 di pembilang ✓
  2. P(Xk)P(X \geq k): gunakan k0,5k - 0{,}5 di pembilang ✓
  3. P(jXk)P(j \leq X \leq k): gunakan j0,5j - 0{,}5 (bawah) dan k+0,5k + 0{,}5 (atas) ✓
  4. P(X=k)P(X = k): gunakan interval [k0,5,  k+0,5][k - 0{,}5,\; k + 0{,}5]

Metode Alternatif

CLT via MGF (untuk verifikasi distribusi penjumlahan): Jika distribusi XiX_i memiliki MGF yang diketahui, ekspansi Taylor MGF di t/nt/\sqrt{n} memberikan konvergensi eksplisit ke et2/2e^{t^2/2}. Lebih rigorous dari pendekatan intuitif namun memberikan insight mendalam tentang laju konvergensi.

Menggunakan distribusi eksak sebagai benchmark: Untuk distribusi yang distribusi penjumlahannya diketahui (ExpΓ\text{Exp} \to \Gamma; BernBinomial\text{Bern} \to \text{Binomial}; Poisson\text{Poisson} individual Poisson\to \text{Poisson} total), selalu bandingkan aproksimasi CLT dengan nilai eksak untuk memverifikasi akurasi.

Section 6 — Visualisasi Mental

CLT sebagai “Perataan Distribusi”:

Bayangkan satu variabel acak XX dengan distribusi miring kanan (seperti Eksponensial). Ambil rata-rata dari 2 variabel — distribusi mulai lebih simetris. Ambil rata-rata dari 10 — sudah tampak seperti lonceng kasar. Ambil rata-rata dari 30 — hampir tidak bisa dibedakan dari Normal. Ini bukan keajaiban: fluktuasi positif di satu variabel cenderung diimbangi oleh fluktuasi negatif di variabel lain; semakin banyak variabel, semakin sempurna penyeimbangan ini.

Koreksi Kontinuitas sebagai “Pikselasi”:

Distribusi diskrit seperti Binomial adalah “piksel” di integer. Distribusi Normal adalah “kurva halus”. Koreksi kontinuitas adalah cara mengonversi antara keduanya: setiap piksel integer kk direpresentasikan sebagai interval [k0,5,k+0,5][k-0{,}5, k+0{,}5] dalam kurva halus. Tanpa koreksi, kita memotong kurva Normal tepat di titik integer; dengan koreksi, kita mengambil seluruh “pixel” yang sesuai.

Lebar Distribusi Xˉ\bar{X} vs SnS_n:

Distribusi Xˉ\bar{X} semakin sempit saat nn bertambah (σ/n0\sigma/\sqrt{n} \to 0): rata-rata semakin terkonsentrasi di μ\mu — ini adalah manifestasi LLN. Distribusi SnS_n semakin lebar saat nn bertambah (σn\sigma\sqrt{n} \to \infty): total klaim semakin tersebar. Namun keduanya semakin Normal-shaped — ini adalah CLT.

Hubungan Visual ↔ Rumus

Penyempitan distribusi Xˉ\bar{X} berkorespondensi dengan:

SE(Xˉ)=σn0 saat ndistribusi semakin terkonsentrasi di μ\text{SE}(\bar{X}) = \frac{\sigma}{\sqrt{n}} \to 0 \text{ saat } n \to \infty \longleftrightarrow \text{distribusi semakin terkonsentrasi di } \mu

Koreksi kontinuitas +0,5+0{,}5 berkorespondensi dengan:

P(Xk)=P(Normalk+0,5)memasukkan seluruh "piksel" ke-kP(X \leq k) = P(\text{Normal} \leq k+0{,}5) \longleftrightarrow \text{memasukkan seluruh "piksel" ke-}k

Konvergensi MGF ke Normal berkorespondensi dengan:

[1+t22n+O(n3/2)]net2/2MGF Normal standar\left[1 + \frac{t^2}{2n} + O(n^{-3/2})\right]^n \to e^{t^2/2} \longleftrightarrow \text{MGF Normal standar}

Section 7 — Jebakan Umum

Kesalahan Parametrisasi

Jebakan utama — Mencampur SE untuk Xˉ\bar{X} dan SD untuk SnS_n:

Xˉ\bar{X}Sn=XiS_n = \sum X_i
Meanμ\munμn\mu
Standar deviasiσ/n\sigma/\sqrt{n}σn\sigma\sqrt{n}
Standarisasi(Xˉμ)/(σ/n)({\bar{X}-\mu})/(\sigma/\sqrt{n})(Snnμ)/(σn)(S_n - n\mu)/(\sigma\sqrt{n})

Keduanya menghasilkan statistik yang identik secara aljabar: (Xˉμ)/(σ/n)=(Snnμ)/(σn)(\bar{X}-\mu)/(\sigma/\sqrt{n}) = (S_n-n\mu)/(\sigma\sqrt{n}) karena Xˉ=Sn/n\bar{X} = S_n/n. Kesalahan adalah menggunakan σ/n\sigma/\sqrt{n} sebagai SD untuk SnS_n, atau σn\sigma\sqrt{n} sebagai SE untuk Xˉ\bar{X}.

Kesalahan Konseptual
  1. Mengira CLT menyatakan distribusi XiX_i mendekati Normal. CLT berbicara tentang distribusi Xˉn\bar{X}_n atau SnS_nbukan distribusi populasi XiX_i. Setiap XiX_i tetap terdistribusi seperti populasinya; hanya rata-ratanya yang mendekati Normal.
  2. Mengaplikasikan CLT tanpa memeriksa syarat variansi terbatas. Untuk distribusi berat ekor (heavy-tailed) dengan variansi tak terbatas, CLT tidak berlaku. Di konteks aktuaria, distribusi seperti Pareto dengan α2\alpha \leq 2 tidak memiliki variansi terbatas.
  3. Mengira n30n \geq 30 adalah batas absolut. Ini adalah aturan praktis, bukan matematis. Untuk distribusi simetris ringan (Uniform), n=10n = 10 sudah cukup. Untuk distribusi sangat skewed atau heavy-tailed, n=30n = 30 mungkin tidak cukup.
  4. Melupakan koreksi kontinuitas untuk distribusi diskrit. Untuk Binomial dan Poisson, koreksi kontinuitas secara signifikan meningkatkan akurasi aproksimasi, terutama saat menghitung probabilitas ekor atau probabilitas titik.
Kesalahan Interpretasi Soal
  • “Gunakan CLT untuk mengaproksimasi”: Ini secara implisit meminta menggunakan XˉN(μ,σ2/n)\bar{X} \approx N(\mu, \sigma^2/n) atau SnN(nμ,nσ2)S_n \approx N(n\mu, n\sigma^2) — pilih sesuai dengan statistik yang ditanya.
  • XX adalah jumlah” (bukan rata-rata): Jika soal menyatakan X=XiX = \sum X_i, gunakan CLT untuk SnS_n (standar deviasi σn\sigma\sqrt{n}), bukan untuk Xˉ\bar{X} (standar deviasi σ/n\sigma/\sqrt{n}).
  • Persentil dari distribusi aproksimasi: Untuk mencari cc sehingga P(Snc)=pP(S_n \leq c) = p: gunakan c=nμ+zpσnc = n\mu + z_p \cdot \sigma\sqrt{n} di mana zp=Φ1(p)z_p = \Phi^{-1}(p) — ingat standar deviasi SnS_n adalah σn\sigma\sqrt{n}, bukan σ/n\sigma/\sqrt{n}.
Red Flags
  • Distribusi asal tidak diketahui atau non-Normal + nn besar: Ini adalah sinyal klasik untuk menggunakan CLT — tanpa CLT tidak mungkin menghitung probabilitas tentang Xˉ\bar{X} atau SnS_n.
  • Soal menyebut “Binomial dengan nn besar” atau “Poisson dengan λ\lambda besar”: Kemungkinan besar aproksimasi Normal + koreksi kontinuitas diminta.
  • Soal meminta P(Xˉ>c)P(\bar{X} > c) atau P(Snc)P(S_n \leq c) dari distribusi non-Normal: Standarisasi ke ZZ menggunakan SE=σ/n\text{SE} = \sigma/\sqrt{n} atau σn\sigma\sqrt{n} sesuai statistik.
  • Soal menyebutkan “total” atau “jumlah”: Gunakan CLT untuk SnS_n — mean nμn\mu, SD σn\sigma\sqrt{n}.
  • Soal menyebutkan “rata-rata”: Gunakan CLT untuk Xˉ\bar{X} — mean μ\mu, SD σ/n\sigma/\sqrt{n}.
  • Soal tentang distribusi Cauchy atau distribusi “berat ekor” tanpa variansi terbatas: CLT tidak berlaku — sebutkan ini secara eksplisit.

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. CLT — pernyataan formal: Xˉnμσ/ndN(0,1)(n),syarat: μ<,  σ2<,  i.i.d.\frac{\bar{X}_n - \mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1) \quad (n \to \infty), \quad \text{syarat: } \mu < \infty,\; \sigma^2 < \infty,\; \text{i.i.d.}
  2. Aproksimasi praktis — mean dan jumlah: XˉnapproxN ⁣(μ,  σ2n),SnapproxN(nμ,  nσ2)\bar{X}_n \overset{\text{approx}}{\sim} N\!\left(\mu,\; \frac{\sigma^2}{n}\right), \qquad S_n \overset{\text{approx}}{\sim} N(n\mu,\; n\sigma^2)
  3. Standar deviasi — arah n\sqrt{n} berbeda! SD(Xˉ)=σn(bagi),SD(Sn)=σn(kali)\text{SD}(\bar{X}) = \frac{\sigma}{\sqrt{n}} \quad (\text{bagi}), \qquad \text{SD}(S_n) = \sigma\sqrt{n} \quad (\text{kali})
  4. Koreksi kontinuitas untuk distribusi diskrit: P(Xk)Φ ⁣(k+0,5μσ),P(Xk)1Φ ⁣(k0,5μσ)P(X \leq k) \approx \Phi\!\left(\frac{k+0{,}5-\mu}{\sigma}\right), \quad P(X \geq k) \approx 1 - \Phi\!\left(\frac{k-0{,}5-\mu}{\sigma}\right)
  5. Aturan validitas — Binomial: XB(n,p):XN(np,np(1p))jika np5 dan n(1p)5X \sim B(n,p): \quad X \approx N(np, np(1-p)) \quad \text{jika } np \geq 5 \text{ dan } n(1-p) \geq 5

Kapan Digunakan

  • Trigger keywords: “aproksimasi Normal”, “CLT”, “distribusi populasi tidak diketahui tapi nn besar”, “Binomial nn besar”, “Poisson λ\lambda besar”, “total klaim dari banyak polis”, “rata-rata sampel besar”.
  • Tipe skenario soal:
    • Hitung P(Xˉ[a,b])P(\bar{X} \in [a,b]) atau P(Snc)P(S_n \leq c) dari distribusi asal non-Normal.
    • Aproksimasi Binomial atau Poisson menggunakan Normal.
    • Tentukan ukuran sampel minimal untuk probabilitas tertentu.
    • Tentukan persentil dari distribusi sampel menggunakan tabel Normal standar.

Kapan TIDAK Boleh Digunakan

  • Jika σ2\sigma^2 tidak terbatas: CLT tidak berlaku — sebutkan syarat dilanggar.
  • Jika nn kecil dan distribusi asal non-Normal: Gunakan distribusi eksak jika tersedia, atau simulasi.
  • Jika populasi Normal: Distribusi Xˉ\bar{X} eksak Normal untuk nn berapapun — CLT tidak diperlukan, langsung gunakan XˉN(μ,σ2/n)\bar{X} \sim N(\mu, \sigma^2/n).
  • Jika σ2\sigma^2 tidak diketahui: Distribusi tt (bukan CLT langsung) saat nn kecil; untuk nn besar CLT + SS sebagai estimasi σ\sigma valid (lihat 4.2 Distribusi Sampel).
  • Jika diperlukan probabilitas eksak: Gunakan PMF/PDF atau CDF eksak dari distribusi yang diketahui.

Quick Decision Tree

graph TD
    A["Hitung probabilitas tentang<br>X-bar atau S_n dari populasi non-Normal"] --> B["Apakah sigma^2 terbatas dan n cukup besar?"]
    B -->|"Tidak: sigma^2 tak terbatas"| C["CLT TIDAK berlaku<br>Sebutkan syarat dilanggar<br>Contoh: distribusi Cauchy"]
    B -->|"Ya"| D["Statistik apa yang ditanya?"]
    D --> E["X-bar: rata-rata"]
    D --> F["S_n: jumlah / total"]
    E --> G["X-bar ~approx N(mu, sigma^2/n)<br>SE = sigma/sqrt(n)<br>Z = (X-bar - mu) / (sigma/sqrt(n))"]
    F --> H["S_n ~approx N(n*mu, n*sigma^2)<br>SD_S = sigma*sqrt(n)<br>Z = (S_n - n*mu) / (sigma*sqrt(n))"]
    G --> I["Apakah distribusi asal diskrit?<br>Binomial atau Poisson?"]
    H --> I
    I -->|"Ya"| J["Terapkan koreksi kontinuitas:<br>P(X <= k) -> pakai k + 0.5<br>P(X >= k) -> pakai k - 0.5"]
    I -->|"Tidak"| K["Gunakan aproksimasi Normal langsung<br>Standarisasi ke Z<br>Baca tabel Phi"]
    J --> L["Standarisasi dan baca tabel Phi"]
    K --> L
    L --> M["Verifikasi: apakah n cukup besar?<br>n >= 30 untuk simetris<br>n >= 50-100 untuk sangat skewed<br>np >= 5 dan nq >= 5 untuk Binomial"]

Follow-up Options
  1. “Berikan soal variasi: aproksimasi Normal untuk total klaim n=50n = 50 polis dengan klaim individual berdistribusi Gamma, termasuk perbandingan dengan Gamma eksak”
  2. “Jelaskan hubungan 4.3 Teorema Limit Pusat (CLT) dengan 4.4 Hukum Bilangan Besar (LLN) — perbedaan formal dan implikasi masing-masing”
  3. “Buat flashcard 1-halaman untuk topik ini”

📖 Ref: Hogg-Tanis-Zimm (2015) Bab 5.3–5.4; Hogg-McKean-Craig (2019) Bab 4.1–4.2; Miller et al. (2014) Bab 8.6–8.7; Walpole et al. (2012) Bab 8.3 | 🗓️ 2026-02-21 | #CF2 #InferensStatistik #CLT #TeoremaLimitPusat #NormalAproksimasi #Konvergensi #DistribusiSampel