PAI · AAMAI · 2026
Aktuaria
Indonesia
CF2 · Materi 4.7

Selang Kepercayaan

2026-02-21 Calculation-Intensive Bobot: 20–30% Miller et al. (2014) Bab 11.1–11.5; Hogg-Tanis-Zimm (2015) Bab 5.5–5.8; Walpole et al. (2012) Bab 8.1, 8.4, 8.5
CF2InferensiStatistikaSelangKepercayaanConfidenceIntervalDistribusiSampelNormalDistribusitDistribusiChiKuadratFDistribusiPivotal

📊 4.7 — Selang Kepercayaan

Ringkasan Cepat

Topik: Selang Kepercayaan | Bobot: ~20–30% | Difficulty: Calculation-Intensive Ref: Miller et al. (2014) Bab 11.1–11.5; Hogg-Tanis-Zimm (2015) Bab 5.5–5.8; Walpole et al. (2012) Bab 8.1, 8.4, 8.5 | Prereq: 4.2 Distribusi Sampel, 4.3 Teorema Limit Pusat (CLT), 4.5 Estimasi Parameter, 4.6 Sifat-Sifat Estimator

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 4: Inferensi Statistik4.7Mengonstruksi CI untuk mean satu populasi (σ2\sigma^2 diketahui dan tidak diketahui); CI untuk selisih dua mean (sampel bebas dan berpasangan); CI untuk proporsi dan selisih dua proporsi; CI untuk variansi satu populasi; CI untuk rasio dua variansi; menentukan ukuran sampel minimum; menginterpretasikan level kepercayaan20–30%Calculation-Intensive4.2 Distribusi Sampel, 4.3 Teorema Limit Pusat (CLT), 4.5 Estimasi Parameter, 4.6 Sifat-Sifat Estimator4.8 Uji Hipotesis, 4.3 Teorema Limit Pusat (CLT), 2.6 Distribusi Kontinu UmumMiller et al. (2014) Bab 11.1–11.5; Hogg-Tanis-Zimm (2015) Bab 5.5–5.8; Walpole et al. (2012) Bab 8.1, 8.4, 8.5

Section 1 — Intuisi

Bayangkan seorang aktuaris yang diminta mengestimasi rata-rata klaim kesehatan tahunan per nasabah dari sampel 50 nasabah. Dia bisa menghitung rata-rata sampel, katakanlah Rp 8.500.000. Tetapi angka tunggal ini terasa tidak memuaskan — pasti ada ketidakpastian di sekitarnya. Berapa “margin error”-nya? Inilah motivasi selang kepercayaan (confidence interval, CI): alih-alih satu titik, kita memberikan sebuah interval yang dengan tingkat kepercayaan tertentu (biasanya 95%) mencakup nilai parameter yang sesungguhnya. Jawaban yang lebih jujur: “Kami 95% yakin bahwa rata-rata klaim sesungguhnya berada antara Rp 7.900.000 dan Rp 9.100.000.”

Kunci untuk membangun CI adalah menemukan sebuah kuantitas pivot (pivotal quantity): fungsi dari data dan parameter yang distribusinya diketahui dan tidak bergantung pada parameter apapun yang tidak diketahui. Misalnya, jika populasi Normal dengan σ2\sigma^2 diketahui, maka Z=(Xˉμ)/(σ/n)Z = (\bar{X} - \mu)/(\sigma/\sqrt{n}) mengikuti distribusi N(0,1)N(0,1) — distribusinya diketahui sepenuhnya tanpa perlu tahu μ\mu. Dari sini, kita “balikkan” ketidaksamaan probabilitas untuk mengisolasi μ\mu di tengah dan mendapatkan interval acak [Xˉzα/2σ/n,  Xˉ+zα/2σ/n][\bar{X} - z_{\alpha/2}\sigma/\sqrt{n},\; \bar{X} + z_{\alpha/2}\sigma/\sqrt{n}] yang mencakup μ\mu dengan probabilitas 1α1-\alpha.

Penting untuk memahami interpretasi yang benar: setelah data diamati dan interval dihitung, kita tidak bisa lagi berbicara tentang “probabilitas bahwa μ\mu ada di dalam interval ini” — μ\mu adalah konstanta, bukan variabel acak. Yang tepat adalah: prosedur yang kita gunakan akan menghasilkan interval yang mencakup μ\mu sesungguhnya dalam (1α)×100%(1-\alpha) \times 100\% dari semua pengulangan sampling. Level kepercayaan 1α1-\alpha adalah properti dari prosedur, bukan dari satu interval yang spesifik.

Section 2 — Definisi Formal

Definisi Matematis

Selang Kepercayaan (1α)×100%(1-\alpha) \times 100\% untuk θ\theta:

Sebuah interval acak [L(X),U(X)][L(\mathbf{X}),\, U(\mathbf{X})] adalah selang kepercayaan (1α)×100%(1-\alpha)\times100\% untuk θ\theta jika:

P ⁣(L(X)θU(X))=1αuntuk semua θΘP\!\left(L(\mathbf{X}) \leq \theta \leq U(\mathbf{X})\right) = 1 - \alpha \quad \text{untuk semua } \theta \in \Theta

Kuantitas Pivot (Pivotal Quantity): Fungsi Q(X,θ)Q(\mathbf{X}, \theta) yang distribusinya sepenuhnya diketahui (tidak bergantung pada θ\theta atau parameter lain yang tidak diketahui).

CI untuk μ\mu, σ2\sigma^2 diketahui (ZZ-interval):

Xˉ±zα/2σn\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

CI untuk μ\mu, σ2\sigma^2 tidak diketahui (tt-interval):

Xˉ±tα/2,n1Sn\bar{X} \pm t_{\alpha/2,\, n-1} \cdot \frac{S}{\sqrt{n}}

CI untuk σ2\sigma^2 (χ2\chi^2-interval):

[(n1)S2χα/2,n12,    (n1)S2χ1α/2,n12]\left[\frac{(n-1)S^2}{\chi^2_{\alpha/2,\, n-1}},\;\; \frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\, n-1}}\right]

Variabel & Parameter

SimbolMaknaCatatan
1α1 - \alphaLevel kepercayaan (confidence level)Nilai umum: 0.90, 0.95, 0.99
α\alphaTingkat signifikansi; probabilitas interval tidak mencakup θ\thetaα=1(level kepercayaan)\alpha = 1 - \text{(level kepercayaan)}
zα/2z_{\alpha/2}Nilai kritis distribusi N(0,1)N(0,1): P(Z>zα/2)=α/2P(Z > z_{\alpha/2}) = \alpha/2z0.025=1.96z_{0.025} = 1.96, z0.005=2.576z_{0.005} = 2.576
tα/2,νt_{\alpha/2,\,\nu}Nilai kritis distribusi t(ν)t(\nu): P(T>tα/2,ν)=α/2P(T > t_{\alpha/2,\nu}) = \alpha/2Bertambah saat ν\nu berkurang; mendekati zα/2z_{\alpha/2} saat ν\nu \to \infty
χα,ν2\chi^2_{\alpha,\,\nu}Nilai kritis χ2(ν)\chi^2(\nu): P(χ2>χα,ν2)=αP(\chi^2 > \chi^2_{\alpha,\nu}) = \alphaTidak simetris; butuh dua nilai kritis untuk CI
Fα,ν1,ν2F_{\alpha,\,\nu_1,\nu_2}Nilai kritis F(ν1,ν2)F(\nu_1,\nu_2): P(F>Fα,ν1,ν2)=αP(F > F_{\alpha,\nu_1,\nu_2}) = \alphaF1α,ν1,ν2=1/Fα,ν2,ν1F_{1-\alpha,\nu_1,\nu_2} = 1/F_{\alpha,\nu_2,\nu_1}
Xˉ\bar{X}Mean sampel: 1nXi\frac{1}{n}\sum X_iEstimator titik untuk μ\mu
S2S^2Variansi sampel: 1n1(XiXˉ)2\frac{1}{n-1}\sum(X_i-\bar{X})^2Estimator tak-bias untuk σ2\sigma^2
nnUkuran sampelMenentukan derajat bebas dan lebar interval
ν\nuDerajat bebas (degrees of freedom)Untuk tt: ν=n1\nu = n-1; untuk χ2\chi^2: ν=n1\nu = n-1
EEMargin of error (setengah lebar CI)E=zα/2σ/nE = z_{\alpha/2} \cdot \sigma/\sqrt{n} untuk ZZ-interval
p^\hat{p}Proporsi sampel: X/nX/n di mana XB(n,p)X \sim B(n,p)Estimator titik untuk proporsi populasi pp
Sp2S_p^2Variansi gabungan (pooled variance) untuk dua sampelSp2=(n11)S12+(n21)S22n1+n22S_p^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1+n_2-2}

Rumus Utama

Xˉ±zα/2σn\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

Label: CI untuk μ\mu, σ2\sigma^2 diketahui (ZZ-interval) — pivot: Z=(Xˉμ)/(σ/n)N(0,1)Z = (\bar{X}-\mu)/(\sigma/\sqrt{n}) \sim N(0,1). Berlaku tepat untuk populasi Normal; berlaku aproksimasi untuk n30n \geq 30 (CLT) tanpa asumsi Normal.

Xˉ±tα/2,n1Sn\bar{X} \pm t_{\alpha/2,\, n-1} \cdot \frac{S}{\sqrt{n}}

Label: CI untuk μ\mu, σ2\sigma^2 tidak diketahui (tt-interval) — pivot: T=(Xˉμ)/(S/n)t(n1)T = (\bar{X}-\mu)/(S/\sqrt{n}) \sim t(n-1). Berlaku tepat untuk populasi Normal; nilai kritis tt lebih besar dari zz, menghasilkan interval lebih lebar.

[(n1)S2χα/2,n12,    (n1)S2χ1α/2,n12]\left[\frac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}},\;\; \frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}}\right]

Label: CI untuk σ2\sigma^2 — pivot: χ2=(n1)S2/σ2χ2(n1)\chi^2 = (n-1)S^2/\sigma^2 \sim \chi^2(n-1). Interval tidak simetris di sekitar S2S^2 karena distribusi χ2\chi^2 menjulur ke kanan.

(Xˉ1Xˉ2)±tα/2,n1+n22Sp1n1+1n2,Sp2=(n11)S12+(n21)S22n1+n22(\bar{X}_1 - \bar{X}_2) \pm t_{\alpha/2,\,n_1+n_2-2} \cdot S_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}, \qquad S_p^2 = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}

Label: CI untuk μ1μ2\mu_1 - \mu_2, variansi sama tidak diketahui (pooled tt) — asumsi kritis: σ12=σ22\sigma_1^2 = \sigma_2^2. Derajat bebas: n1+n22n_1 + n_2 - 2.

(Xˉ1Xˉ2)±tα/2,νS12n1+S22n2(\bar{X}_1 - \bar{X}_2) \pm t_{\alpha/2,\,\nu^*} \cdot \sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}

Label: CI untuk μ1μ2\mu_1 - \mu_2, variansi berbeda tidak diketahui (Welch/Satterthwaite) — derajat bebas Satterthwaite:

ν=(S12/n1+S22/n2)2(S12/n1)2n11+(S22/n2)2n21\nu^* = \frac{(S_1^2/n_1 + S_2^2/n_2)^2}{\frac{(S_1^2/n_1)^2}{n_1-1}+\frac{(S_2^2/n_2)^2}{n_2-1}} Dˉ±tα/2,n1SDn,Di=X1iX2i\bar{D} \pm t_{\alpha/2,\,n-1} \cdot \frac{S_D}{\sqrt{n}}, \qquad D_i = X_{1i} - X_{2i}

Label: CI untuk μD=μ1μ2\mu_D = \mu_1 - \mu_2, sampel berpasangan — reduksi ke CI satu sampel pada selisih DiD_i; lebih presisi dari dua sampel bebas jika ada korelasi positif antara pasangan.

p^±zα/2p^(1p^)n\hat{p} \pm z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}

Label: CI untuk proporsi pp (aproksimasi Normal besar) — berlaku jika np^5n\hat{p} \geq 5 dan n(1p^)5n(1-\hat{p}) \geq 5. Pivot: CLT pada p^\hat{p}.

[S12/S22Fα/2,n11,n21,    S12/S22F1α/2,n11,n21]\left[\frac{S_1^2/S_2^2}{F_{\alpha/2,\,n_1-1,\,n_2-1}},\;\; \frac{S_1^2/S_2^2}{F_{1-\alpha/2,\,n_1-1,\,n_2-1}}\right]

Label: CI untuk σ12/σ22\sigma_1^2/\sigma_2^2 — pivot: F=(S12/σ12)/(S22/σ22)F(n11,n21)F = (S_1^2/\sigma_1^2)/(S_2^2/\sigma_2^2) \sim F(n_1-1, n_2-1).

n(zα/2σE)2n \geq \left(\frac{z_{\alpha/2} \cdot \sigma}{E}\right)^2

Label: Ukuran sampel minimum untuk margin error EE — berlaku untuk ZZ-interval; bulatkan ke atas (ceiling) untuk memastikan margin error tidak melebihi EE.

Asumsi Eksplisit

  • ZZ-interval tepat: Populasi Normal, σ2\sigma^2 diketahui. Atau: n30n \geq 30 dan CLT (aproksimasi).
  • tt-interval tepat: Populasi Normal, σ2\sigma^2 tidak diketahui. Robust terhadap penyimpangan normalitas untuk nn cukup besar.
  • Pooled tt: Dua populasi Normal independen dengan σ12=σ22\sigma_1^2 = \sigma_2^2 (homoskedastisitas).
  • CI untuk σ2\sigma^2 dan FF: Asumsi normalitas sangat sensitif — tidak robust; distribusi χ2\chi^2 dan FF hanya tepat jika populasi betul-betul Normal.
  • CI proporsi (aproksimasi Normal): np^5n\hat{p} \geq 5 dan n(1p^)5n(1-\hat{p}) \geq 5; tidak berlaku untuk pp sangat kecil atau besar dengan nn kecil.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Semua CI dibangun dengan tiga langkah yang sama:

Langkah 1 — Identifikasi kuantitas pivot Q(X,θ)Q(\mathbf{X}, \theta): Fungsi yang distribusinya sepenuhnya diketahui (ZZ, tt, χ2\chi^2, atau FF).

Langkah 2 — Tulis ketidaksamaan probabilitas: P(qLQqU)=1αP(q_{L} \leq Q \leq q_{U}) = 1-\alpha, di mana qLq_L dan qUq_U adalah nilai kritis dari tabel.

Langkah 3 — Isolasi θ\theta: Manipulasi aljabar ketidaksamaan untuk mendapatkan P(L(X)θU(X))=1αP(L(\mathbf{X}) \leq \theta \leq U(\mathbf{X})) = 1-\alpha.

Contoh derivasi CI untuk μ\mu dengan σ2\sigma^2 diketahui:

  • Pivot: Z=Xˉμσ/nN(0,1)Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)
  • Ketidaksamaan: P ⁣(zα/2Xˉμσ/nzα/2)=1αP\!\left(-z_{\alpha/2} \leq \frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \leq z_{\alpha/2}\right) = 1-\alpha
  • Kalikan dengan σ/n\sigma/\sqrt{n} dan balikkan: P ⁣(Xˉzα/2σnμXˉ+zα/2σn)=1αP\!\left(\bar{X} - z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right) = 1-\alpha
Support dan Domain — Sifat Distribusi yang Menentukan Bentuk CI
  • N(0,1)N(0,1) dan t(ν)t(\nu): Simetris di sekitar nol → nilai kritis ±zα/2\pm z_{\alpha/2} atau ±tα/2,ν\pm t_{\alpha/2,\nu} → CI simetris di sekitar estimator titik Xˉ\bar{X}.
  • χ2(ν)\chi^2(\nu): Tidak simetris, support [0,)[0,\infty), menjulur ke kanan → butuh dua nilai kritis berbeda χ1α/2,ν2\chi^2_{1-\alpha/2,\nu} (sisi kiri) dan χα/2,ν2\chi^2_{\alpha/2,\nu} (sisi kanan) → CI tidak simetris di sekitar S2S^2.
  • F(ν1,ν2)F(\nu_1,\nu_2): Tidak simetris, support [0,)[0,\infty) → sama seperti χ2\chi^2; gunakan relasi F1α,ν1,ν2=1/Fα,ν2,ν1F_{1-\alpha,\nu_1,\nu_2} = 1/F_{\alpha,\nu_2,\nu_1} untuk menghemat tabel.
  • Semakin besar nn: interval semakin sempit (proporsional 1/n1/\sqrt{n}); nilai tn1t_{n-1} mendekati zz.

Derivasi CI untuk σ2\sigma^2 dari pivot χ2\chi^2:

Untuk XiiidN(μ,σ2)X_i \overset{\text{iid}}{\sim} N(\mu, \sigma^2) (kedua parameter tidak diketahui):

(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

Tulis ketidaksamaan probabilitas dengan dua nilai kritis (karena χ2\chi^2 tidak simetris):

P ⁣(χ1α/2,n12(n1)S2σ2χα/2,n12)=1αP\!\left(\chi^2_{1-\alpha/2,\,n-1} \leq \frac{(n-1)S^2}{\sigma^2} \leq \chi^2_{\alpha/2,\,n-1}\right) = 1 - \alpha

Balikkan dan isolasi σ2\sigma^2 (ingat: membalikkan pertidaksamaan saat dibagi):

P ⁣((n1)S2χα/2,n12σ2(n1)S2χ1α/2,n12)=1αP\!\left(\frac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}} \leq \sigma^2 \leq \frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}}\right) = 1-\alpha

Derivasi ukuran sampel minimum:

Dari ZZ-interval, margin of error:

E=zα/2σnE = z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

Isolasi nn:

n=zα/2σE    n=(zα/2σE)2\sqrt{n} = \frac{z_{\alpha/2}\cdot\sigma}{E} \implies n = \left(\frac{z_{\alpha/2}\cdot\sigma}{E}\right)^2

Karena nn harus bilangan bulat, gunakan n=(zα/2σE)2n = \left\lceil\left(\frac{z_{\alpha/2}\cdot\sigma}{E}\right)^2\right\rceil (ceiling function).

Hubungan sifat FF — nilai kritis ekor kiri:

F1α/2,ν1,ν2=1Fα/2,ν2,ν1F_{1-\alpha/2,\,\nu_1,\nu_2} = \frac{1}{F_{\alpha/2,\,\nu_2,\nu_1}}

Relasi ini memungkinkan kita hanya menggunakan tabel ekor kanan (nilai besar FF) untuk mendapatkan nilai kritis ekor kiri.

Dilarang
  1. Dilarang menginterpretasikan CI (L,U)(L, U) yang sudah dihitung dari data sebagai “probabilitas μ\mu berada dalam (L,U)(L, U) adalah 95%”. Setelah interval dihitung, μ\mu adalah konstanta tetap — ia ada atau tidak ada dalam interval yang tetap. Interpretasi yang benar: prosedur ini menghasilkan interval yang mencakup μ\mu dalam 95% pengulangan sampling jangka panjang.
  2. Dilarang menggunakan ZZ-interval (dengan σ\sigma diketahui atau SS menggantikan σ\sigma) ketika n<30n < 30 dan populasi tidak Normal — distribusi pivot tidak N(0,1)N(0,1); gunakan tt-interval dengan asumsi normalitas populasi.
  3. Dilarang menukar posisi nilai kritis χ2\chi^2 dalam CI untuk σ2\sigma^2: batas bawah CI menggunakan χα/22\chi^2_{\alpha/2} (nilai besar) di penyebut, batas atas menggunakan χ1α/22\chi^2_{1-\alpha/2} (nilai kecil) di penyebut — karena σ2\sigma^2 berbanding terbalik dengan pivot χ2\chi^2.

Section 4 — Contoh Soal

Soal A — Fundamental

Seorang aktuaris mengambil sampel acak n=25n = 25 polis asuransi kendaraan dan mencatat besaran klaim (dalam juta rupiah). Diperoleh xˉ=12.4\bar{x} = 12.4 dan s=3.2s = 3.2. Asumsikan besaran klaim terdistribusi Normal.

(a) Konstruksi CI 95% untuk rata-rata klaim populasi μ\mu (gunakan tt-interval karena σ2\sigma^2 tidak diketahui). (b) Konstruksi CI 90% untuk μ\mu. (c) Konstruksi CI 95% untuk variansi populasi σ2\sigma^2. (d) Jika σ\sigma sebenarnya diketahui =3.0= 3.0, berapa ukuran sampel minimum agar margin of error tidak melebihi E=1.0E = 1.0 pada CI 95%?

Solusi Soal A

1. Identifikasi Variabel

  • n=25n = 25, xˉ=12.4\bar{x} = 12.4, s=3.2s = 3.2, s2=10.24s^2 = 10.24
  • Populasi: Normal, σ2\sigma^2 tidak diketahui
  • Level: 95% → α=0.05\alpha = 0.05; 90% → α=0.10\alpha = 0.10
  • Derajat bebas untuk tt dan χ2\chi^2: ν=n1=24\nu = n - 1 = 24

2. Identifikasi Distribusi / Model

  • (a) & (b): Pivot T=(Xˉμ)/(S/n)t(24)T = (\bar{X}-\mu)/(S/\sqrt{n}) \sim t(24)
  • (c): Pivot χ2=(n1)S2/σ2χ2(24)\chi^2 = (n-1)S^2/\sigma^2 \sim \chi^2(24)
  • (d): Formula ukuran sampel minimum dari ZZ-interval

3. Setup Persamaan

(a): xˉ±tα/2,24sn\bar{x} \pm t_{\alpha/2,\,24} \cdot \dfrac{s}{\sqrt{n}}

(c): [(n1)s2χα/2,242,  (n1)s2χ1α/2,242]\left[\dfrac{(n-1)s^2}{\chi^2_{\alpha/2,\,24}},\; \dfrac{(n-1)s^2}{\chi^2_{1-\alpha/2,\,24}}\right]

(d): n(zα/2σE)2n \geq \left(\dfrac{z_{\alpha/2}\cdot\sigma}{E}\right)^2

4. Eksekusi Aljabar

(a) CI 95% untuk μ\mu (t-interval, ν=24\nu = 24):

Nilai kritis: t0.025,24=2.064t_{0.025,\,24} = 2.064 (dari tabel tt)

Margin of error: E=2.064×3.225=2.064×3.25=2.064×0.64=1.321E = 2.064 \times \dfrac{3.2}{\sqrt{25}} = 2.064 \times \dfrac{3.2}{5} = 2.064 \times 0.64 = 1.321

CI 95%:12.4±1.321(11.079,  13.721)\text{CI 95\%}: \quad 12.4 \pm 1.321 \quad \Rightarrow \quad (11.079,\; 13.721)

(b) CI 90% untuk μ\mu (t-interval, ν=24\nu = 24):

Nilai kritis: t0.05,24=1.711t_{0.05,\,24} = 1.711

Margin of error: E=1.711×0.64=1.095E = 1.711 \times 0.64 = 1.095

CI 90%:12.4±1.095(11.305,  13.495)\text{CI 90\%}: \quad 12.4 \pm 1.095 \quad \Rightarrow \quad (11.305,\; 13.495)

Konfirmasi: CI 90% lebih sempit dari CI 95% ✓

(c) CI 95% untuk σ2\sigma^2 (χ2\chi^2-interval, ν=24\nu = 24):

Nilai kritis:

  • χ0.025,242=39.364\chi^2_{0.025,\,24} = 39.364 (ekor kanan, nilai besar)
  • χ0.975,242=12.401\chi^2_{0.975,\,24} = 12.401 (ekor kiri, nilai kecil)

(n1)s2=24×10.24=245.76(n-1)s^2 = 24 \times 10.24 = 245.76

Batas bawah: 245.7639.364=6.244\dfrac{245.76}{39.364} = 6.244

Batas atas: 245.7612.401=19.818\dfrac{245.76}{12.401} = 19.818

CI 95% untuk σ2:(6.244,  19.818)\text{CI 95\% untuk } \sigma^2: \quad (6.244,\; 19.818)

CI untuk σ\sigma: (6.244,  19.818)=(2.499,  4.452)(\sqrt{6.244},\; \sqrt{19.818}) = (2.499,\; 4.452)

(d) Ukuran sampel minimum:

σ=3.0\sigma = 3.0, E=1.0E = 1.0, z0.025=1.96z_{0.025} = 1.96:

n(1.96×3.01.0)2=(5.88)2=34.574n \geq \left(\frac{1.96 \times 3.0}{1.0}\right)^2 = (5.88)^2 = 34.574

Karena nn harus bulat ke atas: nmin=35n_{\min} = 35

5. Verification

  • CI 95% lebih lebar dari CI 90% ✓ (lebih percaya diri → interval lebih lebar)
  • CI untuk σ2\sigma^2 tidak simetris di sekitar s2=10.24s^2 = 10.24: (10.246.244)=3.996(10.24 - 6.244) = 3.996 vs (19.81810.24)=9.578(19.818 - 10.24) = 9.578 — asimetri ke kanan khas untuk χ2\chi^2
  • n=35>25n = 35 > 25: untuk memperketat margin error dari 1.18\approx1.18 (dengan n=25n=25, σ=3\sigma=3) menjadi 1.01.0, butuh lebih banyak sampel ✓
Exam Tips — Soal A
  • Target waktu: 8–10 menit
  • Common trap 1 — Urutan nilai kritis χ2\chi^2: Batas bawah CI menggunakan nilai kritis χ2\chi^2 yang besar (ekor kanan α/2\alpha/2) di penyebut, bukan yang kecil. Logikanya: semakin besar nilai χ2\chi^2, semakin kecil σ2=(n1)s2/χ2\sigma^2 = (n-1)s^2/\chi^2. Tuliskan χα/22\chi^2_{\alpha/2} > χ1α/22\chi^2_{1-\alpha/2} selalu untuk verifikasi urutan.
  • Common trap 2 — Derajat bebas: Untuk tt dan χ2\chi^2 dari satu sampel Normal, ν=n1=24\nu = n - 1 = 24, bukan n=25n = 25.
  • Shortcut ukuran sampel: Jika soal meminta nn dengan margin error setengah dari semula, nn harus dikali 4 (karena n1/E2n \propto 1/E^2).

Soal B — Exam-Typical

Sebuah perusahaan reasuransi ingin membandingkan rata-rata klaim dua kelompok nasabah: Kelompok A (industri manufaktur) dan Kelompok B (industri jasa). Sampel independen menghasilkan:

  • Kelompok A: n1=16n_1 = 16, xˉ1=85.2\bar{x}_1 = 85.2 juta, s1=12.6s_1 = 12.6 juta
  • Kelompok B: n2=21n_2 = 21, xˉ2=78.5\bar{x}_2 = 78.5 juta, s2=11.8s_2 = 11.8 juta

Asumsikan kedua populasi Normal dan variansi populasi sama (tetapi tidak diketahui nilainya).

(a) Hitung variansi gabungan (pooled variance) Sp2S_p^2. (b) Konstruksi CI 95% untuk selisih rata-rata μ1μ2\mu_1 - \mu_2 menggunakan pooled t-interval. (c) Berdasarkan CI yang diperoleh, apakah ada bukti bahwa rata-rata klaim kedua kelompok berbeda? Jelaskan. (d) Konstruksi CI 95% untuk rasio variansi σ12/σ22\sigma_1^2/\sigma_2^2 dan periksa apakah asumsi σ12=σ22\sigma_1^2 = \sigma_2^2 yang digunakan di bagian (b) terdukung.

Solusi Soal B

1. Identifikasi Variabel

  • Kelompok A: n1=16n_1 = 16, xˉ1=85.2\bar{x}_1 = 85.2, s1=12.6s_1 = 12.6, s12=158.76s_1^2 = 158.76
  • Kelompok B: n2=21n_2 = 21, xˉ2=78.5\bar{x}_2 = 78.5, s2=11.8s_2 = 11.8, s22=139.24s_2^2 = 139.24
  • xˉ1xˉ2=85.278.5=6.7\bar{x}_1 - \bar{x}_2 = 85.2 - 78.5 = 6.7
  • Asumsi: kedua populasi Normal, σ12=σ22\sigma_1^2 = \sigma_2^2 (tidak diketahui)
  • α=0.05\alpha = 0.05, level 95%

2. Identifikasi Distribusi / Model

  • (a)–(b): Pivot pooled t: T=(Xˉ1Xˉ2)(μ1μ2)Sp1/n1+1/n2t(n1+n22)=t(35)T = \dfrac{(\bar{X}_1-\bar{X}_2)-(\mu_1-\mu_2)}{S_p\sqrt{1/n_1+1/n_2}} \sim t(n_1+n_2-2) = t(35)
  • (d): Pivot FF: F=S12/σ12S22/σ22F(n11,n21)=F(15,20)F = \dfrac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1) = F(15, 20)

3. Setup Persamaan

Sp2=(n11)s12+(n21)s22n1+n22S_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} (xˉ1xˉ2)±tα/2,n1+n22Sp1n1+1n2(\bar{x}_1-\bar{x}_2) \pm t_{\alpha/2,\,n_1+n_2-2} \cdot S_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}

4. Eksekusi Aljabar

(a) Variansi gabungan:

Sp2=(161)(158.76)+(211)(139.24)16+212=15×158.76+20×139.2435S_p^2 = \frac{(16-1)(158.76) + (21-1)(139.24)}{16+21-2} = \frac{15 \times 158.76 + 20 \times 139.24}{35} =2381.4+2784.835=5166.235=147.606= \frac{2381.4 + 2784.8}{35} = \frac{5166.2}{35} = 147.606 Sp=147.606=12.149S_p = \sqrt{147.606} = 12.149

(b) CI 95% untuk μ1μ2\mu_1 - \mu_2 (pooled t, ν=35\nu = 35):

Nilai kritis: t0.025,35=2.030t_{0.025,\,35} = 2.030

Margin of error:

E=2.030×12.149×116+121=2.030×12.149×0.0625+0.04762E = 2.030 \times 12.149 \times \sqrt{\frac{1}{16}+\frac{1}{21}} = 2.030 \times 12.149 \times \sqrt{0.0625 + 0.04762} =2.030×12.149×0.11012=2.030×12.149×0.33184=8.181= 2.030 \times 12.149 \times \sqrt{0.11012} = 2.030 \times 12.149 \times 0.33184 = 8.181 CI 95%:6.7±8.181(1.481,  14.881)\text{CI 95\%}: \quad 6.7 \pm 8.181 \quad \Rightarrow \quad (-1.481,\; 14.881)

(c) Interpretasi:

CI 95% untuk μ1μ2\mu_1 - \mu_2 adalah (1.481,  14.881)(-1.481,\; 14.881).

Interval ini mencakup nol. Oleh karena itu, pada level kepercayaan 95%, tidak ada bukti yang cukup bahwa rata-rata klaim kedua kelompok berbeda secara statistik. Perbedaan yang diamati (6.76.7 juta) bisa saja terjadi secara kebetulan saat sampling.

(d) CI 95% untuk σ12/σ22\sigma_1^2/\sigma_2^2 (FF-interval, ν1=15\nu_1=15, ν2=20\nu_2=20):

Rasio variansi sampel: s12/s22=158.76/139.24=1.140s_1^2/s_2^2 = 158.76/139.24 = 1.140

Nilai kritis:

  • F0.025,15,20=2.57F_{0.025,\,15,\,20} = 2.57 (ekor kanan)
  • F0.975,15,20=1/F0.025,20,15=1/2.76=0.362F_{0.975,\,15,\,20} = 1/F_{0.025,\,20,\,15} = 1/2.76 = 0.362 (ekor kiri, menggunakan relasi timbal-balik)

Batas bawah: s12/s22F0.025,15,20=1.1402.57=0.444\dfrac{s_1^2/s_2^2}{F_{0.025,\,15,20}} = \dfrac{1.140}{2.57} = 0.444

Batas atas: s12/s22F0.975,15,20=1.1400.362=3.149\dfrac{s_1^2/s_2^2}{F_{0.975,\,15,20}} = \dfrac{1.140}{0.362} = 3.149

CI 95% untuk σ12σ22:(0.444,  3.149)\text{CI 95\% untuk } \frac{\sigma_1^2}{\sigma_2^2}: \quad (0.444,\; 3.149)

CI ini mencakup 1, sehingga asumsi σ12=σ22\sigma_1^2 = \sigma_2^2 yang digunakan di bagian (b) terdukung oleh data pada level kepercayaan 95%.

5. Verification

  • Sp2=147.606S_p^2 = 147.606 berada di antara s12=158.76s_1^2 = 158.76 dan s22=139.24s_2^2 = 139.24 ✓ (rata-rata tertimbang harus berada di antara keduanya)
  • CI untuk μ1μ2\mu_1-\mu_2 mencakup 0 ✓ (konsisten dengan tidak ada perbedaan signifikan)
  • CI untuk σ12/σ22\sigma_1^2/\sigma_2^2 mencakup 1 ✓ (konsisten dengan asumsi variansi sama)
  • F0.975,15,20=1/F0.025,20,15F_{0.975,15,20} = 1/F_{0.025,20,15}: perhatikan derajat bebas terbalik saat menggunakan relasi timbal-balik ✓
Exam Tips — Soal B
  • Target waktu: 12–15 menit
  • Common trap 1 — Relasi nilai kritis FF: F1α/2,ν1,ν2=1/Fα/2,ν2,ν1F_{1-\alpha/2,\nu_1,\nu_2} = 1/F_{\alpha/2,\nu_2,\nu_1} — perhatikan derajat bebas (ν1\nu_1 dan ν2\nu_2) bertukar saat menggunakan relasi timbal-balik. Kesalahan paling umum: menggunakan 1/Fα/2,ν1,ν21/F_{\alpha/2,\nu_1,\nu_2} (derajat bebas tidak bertukar) yang memberikan jawaban salah.
  • Common trap 2 — Derajat bebas pooled tt: ν=n1+n22=16+212=35\nu = n_1 + n_2 - 2 = 16 + 21 - 2 = 35, bukan n1+n21n_1 + n_2 - 1 atau n1+n2n_1 + n_2.
  • Common trap 3 — Interpretasi CI yang mencakup nol: CI untuk selisih yang mencakup 0 berarti tidak ada bukti perbedaan yang signifikan — jangan klaim “terbukti sama”; cukup “tidak ada bukti berbeda”.
  • Shortcut Sp2S_p^2: Ketika n1=n2=nn_1 = n_2 = n, Sp2=(S12+S22)/2S_p^2 = (S_1^2 + S_2^2)/2 — rata-rata sederhana. Cek apakah kondisi ini berlaku sebelum menggunakan rumus umum.

Soal C — Challenging

Seorang peneliti aktuaria menyelidiki efek program pencegahan klaim pada 12 nasabah korporat. Klaim sebelum dan sesudah program dicatat (dalam ratus juta rupiah):

Nasabah123456789101112
Sebelum (X1iX_{1i})8.26.59.17.310.45.88.76.29.57.88.06.9
Sesudah (X2iX_{2i})7.56.18.26.89.65.57.95.88.77.17.46.4

(a) Hitung selisih Di=X1iX2iD_i = X_{1i} - X_{2i} untuk setiap nasabah, kemudian hitung dˉ\bar{d} dan sDs_D. (b) Konstruksi CI 95% untuk rata-rata selisih μD=μsebelumμsesudah\mu_D = \mu_{\text{sebelum}} - \mu_{\text{sesudah}} menggunakan sampel berpasangan. (c) Apakah program pencegahan terbukti efektif menurunkan klaim? Jelaskan berdasarkan CI. (d) Jelaskan mengapa pendekatan sampel berpasangan lebih tepat daripada dua sampel bebas dalam konteks ini, dan apa konsekuensi statistiknya.

Solusi Soal C

1. Identifikasi Variabel

  • n=12n = 12 pasang (nasabah yang sama diukur dua kali)
  • Selisih Di=X1iX2iD_i = X_{1i} - X_{2i}: pengurangan klaim setelah program
  • Parameter yang diminati: μD=μ1μ2\mu_D = \mu_1 - \mu_2 (rata-rata pengurangan klaim)
  • α=0.05\alpha = 0.05, ν=n1=11\nu = n - 1 = 11

2. Identifikasi Distribusi / Model

  • Sampel berpasangan → reduksi ke satu sampel D1,,D12D_1, \ldots, D_{12}
  • Pivot: T=(DˉμD)/(SD/n)t(11)T = (\bar{D} - \mu_D)/(S_D/\sqrt{n}) \sim t(11) (asumsi DiiidN(μD,σD2)D_i \overset{\text{iid}}{\sim} N(\mu_D, \sigma_D^2))

3. Setup Persamaan

dˉ±t0.025,11sD12\bar{d} \pm t_{0.025,\,11} \cdot \frac{s_D}{\sqrt{12}}

4. Eksekusi Aljabar

(a) Hitung DiD_i, dˉ\bar{d}, dan sDs_D:

NasabahX1iX_{1i}X2iX_{2i}DiD_iDidˉD_i - \bar{d}(Didˉ)2(D_i-\bar{d})^2
18.27.50.70.00830.0001
26.56.10.40.2917-0.29170.0851
39.18.20.90.20830.0434
47.36.80.50.1917-0.19170.0367
510.49.60.80.10830.0117
65.85.50.30.3917-0.39170.1534
78.77.90.80.10830.0117
86.25.80.40.2917-0.29170.0851
99.58.70.80.10830.0117
107.87.10.70.00830.0001
118.07.40.60.0917-0.09170.0084
126.96.40.50.1917-0.19170.0367
Total8.40.4841
dˉ=8.412=0.700\bar{d} = \frac{8.4}{12} = 0.700 sD2=(Didˉ)2n1=0.484111=0.04401s_D^2 = \frac{\sum(D_i - \bar{d})^2}{n-1} = \frac{0.4841}{11} = 0.04401 sD=0.04401=0.2098s_D = \sqrt{0.04401} = 0.2098

(b) CI 95% untuk μD\mu_D (sampel berpasangan, ν=11\nu = 11):

Nilai kritis: t0.025,11=2.201t_{0.025,\,11} = 2.201

Margin of error:

E=2.201×0.209812=2.201×0.20983.4641=2.201×0.06056=0.1333E = 2.201 \times \frac{0.2098}{\sqrt{12}} = 2.201 \times \frac{0.2098}{3.4641} = 2.201 \times 0.06056 = 0.1333 CI 95%:0.700±0.133(0.567,  0.833)\text{CI 95\%}: \quad 0.700 \pm 0.133 \quad \Rightarrow \quad (0.567,\; 0.833)

(c) Interpretasi dan kesimpulan:

CI 95% untuk μD=μsebelumμsesudah\mu_D = \mu_{\text{sebelum}} - \mu_{\text{sesudah}} adalah (0.567,  0.833)(0.567,\; 0.833) (dalam ratus juta rupiah).

Seluruh interval berada di atas nol. Ini berarti, pada level kepercayaan 95%, terdapat bukti yang kuat bahwa program pencegahan klaim efektif menurunkan rata-rata klaim. Estimasi terbaik adalah rata-rata klaim turun sebesar Rp 70 juta per nasabah korporat, dengan rentang kepercayaan 95% antara Rp 56,7 juta hingga Rp 83,3 juta.

(d) Keunggulan sampel berpasangan:

Nasabah yang sama diobservasi sebelum dan sesudah program — artinya X1iX_{1i} dan X2iX_{2i} dari nasabah yang sama berkorelasi positif (nasabah dengan klaim historis tinggi cenderung tetap lebih tinggi). Jika dianalisis sebagai dua sampel bebas, korelasi ini diabaikan dan variansi estimasi Xˉ1Xˉ2\bar{X}_1 - \bar{X}_2 dihitung terlalu besar:

Var(Xˉ1Xˉ2)bebas=σ12n1+σ22n2>σ12+σ222ρσ1σ2n=Var(Dˉ)\text{Var}(\bar{X}_1 - \bar{X}_2)_{\text{bebas}} = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} > \frac{\sigma_1^2 + \sigma_2^2 - 2\rho\sigma_1\sigma_2}{n} = \text{Var}(\bar{D})

(untuk ρ>0\rho > 0). Dengan sampel berpasangan, selisih DiD_i mengeliminasi variabilitas antarindividu (heterogenitas nasabah), sehingga sDs_D lebih kecil dan CI lebih sempit — menghasilkan kesimpulan yang lebih presisi.

5. Verification

  • dˉ=0.700>0\bar{d} = 0.700 > 0: rata-rata klaim turun setelah program ✓
  • sD=0.2098s1,s2s_D = 0.2098 \ll s_1, s_2 (jauh lebih kecil dari variansi dalam kelompok): menunjukkan eliminasi variabilitas antarindividu berhasil ✓
  • CI seluruhnya positif → bukti efektivitas program pada α=0.05\alpha = 0.05
Exam Tips — Soal C
  • Target waktu: 15–18 menit
  • Common trap 1 — Arah selisih DiD_i: Definisikan Di=XsebelumXsesudahD_i = X_{\text{sebelum}} - X_{\text{sesudah}}. Jika program efektif, Di>0D_i > 0 dan CI seluruhnya positif. Jika didefinisikan terbalik (Di=XsesudahXsebelumD_i = X_{\text{sesudah}} - X_{\text{sebelum}}), CI seluruhnya negatif — kesimpulan tetap sama tetapi arah numerik berbeda.
  • Common trap 2 — Derajat bebas sampel berpasangan: ν=n1=11\nu = n - 1 = 11 (berdasarkan jumlah pasang), bukan n1+n22=22n_1 + n_2 - 2 = 22 (yang berlaku untuk dua sampel bebas).
  • Shortcut komputasi sDs_D: Gunakan sD2=di2ndˉ2n1s_D^2 = \frac{\sum d_i^2 - n\bar{d}^2}{n-1} untuk menghindari tabel panjang. di2=0.49+0.16+0.81+0.25+0.64+0.09+0.64+0.16+0.64+0.49+0.36+0.25=4.98\sum d_i^2 = 0.49+0.16+0.81+0.25+0.64+0.09+0.64+0.16+0.64+0.49+0.36+0.25 = 4.98; sD2=(4.9812×0.49)/11=(4.985.88)/11s_D^2 = (4.98 - 12\times0.49)/11 = (4.98-5.88)/11… gunakan kolom (Didˉ)2(D_i - \bar{d})^2 yang lebih akurat.

Section 5 — Verifikasi & Sanity Check

Validasi Konstruksi CI Secara Umum
  1. Level kepercayaan vs α\alpha: 1α=0.951-\alpha = 0.95 berarti α=0.05\alpha = 0.05, nilai kritis menggunakan α/2=0.025\alpha/2 = 0.025 di setiap ekor (untuk CI dua sisi). Jangan campurkan α\alpha dan α/2\alpha/2.
  2. Lebar CI proporsional 1/n1/\sqrt{n}: Untuk mengurangi margin error setengahnya, ukuran sampel harus dikali 4. Kuadratkan faktor pengurangan untuk mendapat faktor nn.
  3. Cek urutan batas: Pastikan L<UL < U selalu. Untuk CI χ2\chi^2: (n1)s2/χα/22<(n1)s2/χ1α/22(n-1)s^2/\chi^2_{\alpha/2} < (n-1)s^2/\chi^2_{1-\alpha/2} iff χα/22>χ1α/22\chi^2_{\alpha/2} > \chi^2_{1-\alpha/2}, yang benar karena α/2<1α/2\alpha/2 < 1-\alpha/2 untuk α<1\alpha < 1.
Validasi Nilai Kritis Distribusi
  1. tt vs zz: tα/2,ν>zα/2t_{\alpha/2,\nu} > z_{\alpha/2} untuk semua ν\nu finite; tα/2,νzα/2t_{\alpha/2,\nu} \to z_{\alpha/2} saat ν\nu \to \infty. Jika t<zt < z untuk ν\nu kecil, ada kesalahan pencarian tabel.
  2. χ2\chi^2 tidak simetris: χα/2,ν2>ν>χ1α/2,ν2\chi^2_{\alpha/2,\nu} > \nu > \chi^2_{1-\alpha/2,\nu} untuk α\alpha kecil (misal 0.05). Konfirmasi bahwa nilai kritis kanan selalu lebih besar dari nilai kritis kiri.
  3. Relasi FF: F1α,ν1,ν2=1/Fα,ν2,ν1F_{1-\alpha,\nu_1,\nu_2} = 1/F_{\alpha,\nu_2,\nu_1} — derajat bebas bertukar. Untuk ν1=ν2\nu_1 = \nu_2: F1α,ν,ν=1/Fα,ν,νF_{1-\alpha,\nu,\nu} = 1/F_{\alpha,\nu,\nu}.
  4. Nilai kritis umum yang perlu dihafalkan:
    • z0.025=1.960z_{0.025} = 1.960, z0.005=2.576z_{0.005} = 2.576, z0.05=1.645z_{0.05} = 1.645
    • t0.025,=1.960=z0.025t_{0.025,\infty} = 1.960 = z_{0.025}; t0.025,302.042t_{0.025,30} \approx 2.042; t0.025,102.228t_{0.025,10} \approx 2.228
Validasi Pemilihan Prosedur CI
  1. σ2\sigma^2 diketahui? Ya → ZZ-interval. Tidak → tt-interval (asumsi Normal).
  2. Dua sampel — variansi sama? Ya (diasumsikan) → pooled tt, ν=n1+n22\nu = n_1+n_2-2. Tidak → Welch, ν=ν\nu = \nu^* Satterthwaite.
  3. Sampel berpasangan atau bebas? Berpasangan (unit yang sama diukur dua kali) → tt-interval pada DiD_i, ν=n1\nu = n-1. Bebas → prosedur dua sampel.
  4. CI proporsi: Cek np^5n\hat{p} \geq 5 DAN n(1p^)5n(1-\hat{p}) \geq 5. Jika tidak, aproksimasi Normal tidak valid.

Metode Alternatif

CI Satu Sisi (One-Sided CI): Untuk CI batas bawah satu sisi pada level 1α1-\alpha:

μ>Xˉtα,n1Sn\mu > \bar{X} - t_{\alpha,\,n-1} \cdot \frac{S}{\sqrt{n}}

Perbedaan dengan CI dua sisi: gunakan tα,νt_{\alpha,\nu} (bukan tα/2,νt_{\alpha/2,\nu}) — nilai kritisnya lebih kecil, sehingga batas bawah lebih ketat. Gunakan CI satu sisi ketika pertanyaan hanya tentang satu arah (misal: “apakah rata-rata klaim lebih dari X?”).

Metode Bootstrap (konseptual) [BEYOND CF2]: Untuk distribusi yang tidak Normal dengan nn kecil, interval dapat dikonstruksi melalui resampling. Tidak diuji di CF2, tetapi berguna untuk memahami prinsip dasar CI.

Section 6 — Visualisasi Mental

Simulasi Pengulangan Sampling — Makna Level Kepercayaan 95%:

Bayangkan 100 peneliti berbeda, masing-masing mengambil sampel acak n=25n=25 dari populasi yang sama dan menghitung CI 95%. Gambarlah 100 interval horizontal yang sejajar, dengan populasi mean μ\mu (diketahui dalam simulasi) sebagai garis vertikal. Sekitar 95 dari 100 interval akan memotong garis μ\mu, dan 5 interval akan meleset sama sekali. Setiap interval berbeda panjang dan posisinya (karena setiap sampel berbeda), tetapi prosedur secara kolektif berhasil 95% waktu.

Inilah makna sesungguhnya dari “95% confidence” — bukan probabilitas tentang μ\mu yang sudah tetap, melainkan coverage probability prosedur.

Hubungan Lebar CI dengan nn dan σ\sigma:

Gambarkan grafik dengan sumbu X = nn (1 sampai 500) dan sumbu Y = lebar CI. Kurva turun seperti 1/n1/\sqrt{n} — menurun cepat di nn kecil, semakin datar di nn besar. Pada n=4n = 4: lebar 1/2\propto 1/2; pada n=16n = 16: 1/41/4; pada n=100n = 100: 1/101/10. Menggandakan presisi butuh 4×4\times ukuran sampel.

Asimetri CI untuk σ2\sigma^2:

Gambarkan distribusi χ2(ν)\chi^2(\nu) — menjulur ke kanan. Potong α/2=0.025\alpha/2 = 0.025 di setiap ekor: nilai kritis kiri χ0.975,ν2\chi^2_{0.975,\nu} (kecil) dan kanan χ0.025,ν2\chi^2_{0.025,\nu} (besar). Karena σ21/χ2\sigma^2 \propto 1/\chi^2, batas bawah CI (menggunakan χ2\chi^2 besar) dekat ke nol, dan batas atas (menggunakan χ2\chi^2 kecil) jauh ke kanan — menghasilkan interval yang asimetris, condong jauh ke kanan dari s2s^2.

Hubungan Visual ↔ Rumus

Cakupan probabilitas CI sebagai daerah di bawah kurva distribusi pivot:

P ⁣(zα/2Zzα/2)=1αdaerah tengah di bawah kurva N(0,1)P\!\left(-z_{\alpha/2} \leq Z \leq z_{\alpha/2}\right) = 1-\alpha \longleftrightarrow \text{daerah tengah di bawah kurva } N(0,1)

Lebar CI sebagai fungsi dari komponen rumus:

Lebar=2×zα/2×σn2×(nilai kritis)×(standar error estimator)\text{Lebar} = 2 \times z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} \longleftrightarrow 2 \times (\text{nilai kritis}) \times (\text{standar error estimator})

Section 7 — Jebakan Umum

Kesalahan Parametrisasi

Kesalahan 1 — Penempatan nilai kritis χ2\chi^2 dalam CI σ2\sigma^2: Batas bawah CI menggunakan χα/2,ν2\chi^2_{\alpha/2,\nu} (nilai besar, ekor kanan) di penyebut; batas atas menggunakan χ1α/2,ν2\chi^2_{1-\alpha/2,\nu} (nilai kecil, ekor kiri) di penyebut. Ini berlawanan intuisi dan merupakan jebakan nomor satu untuk topik CI variansi. Ingat: σ2=(n1)s2/χ2\sigma^2 = (n-1)s^2/\chi^2 — semakin besar χ2\chi^2, semakin kecil σ2\sigma^2.

Kesalahan 2 — Relasi FF timbal-balik dengan derajat bebas terbalik: F1α,ν1,ν2=1/Fα,ν2,ν1F_{1-\alpha,\nu_1,\nu_2} = 1/F_{\alpha,\nu_2,\nu_1}derajat bebas harus bertukar (ν1ν2\nu_1 \leftrightarrow \nu_2). Menggunakan 1/Fα,ν1,ν21/F_{\alpha,\nu_1,\nu_2} (tanpa menukar ν\nu) adalah kesalahan kritis yang menghasilkan batas kiri CI yang salah.

Kesalahan Konseptual
  1. Interpretasi salah: “Probabilitas 95% bahwa μ\mu ada di dalam (L,U)(L,U)”. Setelah interval dihitung dari data, LL dan UU adalah konstanta; μ\mu juga konstanta. Tidak ada lagi probabilitas yang bisa dikaitkan. Yang tepat: “Prosedur ini menghasilkan interval yang mencakup μ\mu dalam 95% pengulangan jangka panjang.”
  2. Menggunakan zz alih-alih tt saat σ2\sigma^2 tidak diketahui dan nn kecil. Bahkan untuk n=30n = 30, jika distribusi diketahui Normal dan σ2\sigma^2 tidak diketahui, secara formal harus menggunakan t29t_{29}. Menggunakan z0.025=1.96z_{0.025} = 1.96 alih-alih t0.025,29=2.045t_{0.025,29} = 2.045 meremehkan ketidakpastian.
  3. CI mencakup 0 bukan berarti “terbukti tidak ada perbedaan”. CI mencakup 0 hanya berarti “tidak ada bukti yang cukup untuk menyimpulkan perbedaan pada level α\alpha”. Tidak terbukti berbeda ≠ terbukti sama.
  4. Sampel berpasangan dianalisis sebagai dua sampel bebas. Jika data berpasangan (unit sama diukur dua kali), menggunakan prosedur dua sampel bebas mengabaikan korelasi positif antarobservasi dan menghasilkan CI yang terlalu lebar dan tidak valid.
Kesalahan Interpretasi Soal
  • “Interval kepercayaan 95%” vs “interval kepercayaan 5%”: Level kepercayaan =1α= 1-\alpha, bukan α\alpha. Soal yang menyebut “level signifikansi 5%” berarti α=0.05\alpha = 0.05 → CI 95%.
  • “Variansi diketahui” vs “standar deviasi diketahui”: Jika soal memberikan σ\sigma (bukan SS), gunakan ZZ-interval. Jika soal memberikan ss (dari data), gunakan tt-interval.
  • “Sampel besar” sebagai justifikasi ZZ-interval: Beberapa soal secara eksplisit meminta tt-interval meski nn besar; ikuti instruksi soal. Secara asimtotik tzt \approx z, tetapi kalau diminta tt harus menggunakan tt.
  • Margin of error vs setengah lebar CI: “Margin of error EE” adalah setengah lebar CI dua sisi (E=zα/2σ/nE = z_{\alpha/2}\sigma/\sqrt{n}). Soal yang meminta “lebar CI” mengacu pada 2E2E.
Red Flags
  • Soal menyebut ”σ\sigma diketahui”: Gunakan zα/2z_{\alpha/2} dan ZZ-interval. Jangan gunakan tt.
  • Soal menyebut “dua sampel independen dengan variansi sama”: Gunakan pooled tt dengan ν=n1+n22\nu = n_1+n_2-2.
  • Soal menyebut “data berpasangan” atau “pengukuran sebelum-sesudah”: Hitung DiD_i terlebih dahulu, kemudian terapkan tt-interval satu sampel pada DiD_i.
  • Nilai kritis χ1α/22\chi^2_{1-\alpha/2} kecil padahal ν\nu besar: Periksa kembali tabel — untuk ν=24\nu = 24, χ0.975,242=12.401\chi^2_{0.975,24} = 12.401 (memang kecil, bukan kesalahan).
  • Soal meminta “ukuran sampel minimum”: Gunakan formula n(zα/2σ/E)2n \geq (z_{\alpha/2}\sigma/E)^2 dan bulatkan ke atas (ceiling), bukan ke bawah. Membulatkan ke bawah membuat margin error melebihi EE.
  • CI untuk rasio variansi: Pivot adalah F=(S12/σ12)/(S22/σ22)F = (S_1^2/\sigma_1^2)/(S_2^2/\sigma_2^2); batas CI diperoleh dari S12/S22S_1^2/S_2^2 dibagi nilai kritis FF — bukan dikurangi atau ditambah.

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. CI untuk μ\mu, σ2\sigma^2 diketahui (ZZ): Xˉ±zα/2σn,nmin=(zα/2σE)2\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}, \qquad n_{\min} = \left\lceil\left(\frac{z_{\alpha/2}\,\sigma}{E}\right)^2\right\rceil
  2. CI untuk μ\mu, σ2\sigma^2 tidak diketahui (tt): Xˉ±tα/2,n1Sn\bar{X} \pm t_{\alpha/2,\,n-1} \cdot \frac{S}{\sqrt{n}}
  3. CI untuk σ2\sigma^2 (χ2\chi^2, tidak simetris): [(n1)S2χα/2,n12,  (n1)S2χ1α/2,n12]\left[\frac{(n-1)S^2}{\chi^2_{\alpha/2,\,n-1}},\;\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\,n-1}}\right]
  4. CI untuk μ1μ2\mu_1-\mu_2, variansi sama (pooled tt): (Xˉ1Xˉ2)±tα/2,n1+n22Sp1n1+1n2,Sp2=(n11)S12+(n21)S22n1+n22(\bar{X}_1-\bar{X}_2) \pm t_{\alpha/2,\,n_1+n_2-2}\cdot S_p\sqrt{\tfrac{1}{n_1}+\tfrac{1}{n_2}}, \quad S_p^2 = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}
  5. CI untuk σ12/σ22\sigma_1^2/\sigma_2^2 (FF, gunakan relasi timbal-balik): [S12/S22Fα/2,n11,n21,  S12/S22F1α/2,n11,n21],F1α/2,ν1,ν2=1Fα/2,ν2,ν1\left[\frac{S_1^2/S_2^2}{F_{\alpha/2,\,n_1-1,\,n_2-1}},\;\frac{S_1^2/S_2^2}{F_{1-\alpha/2,\,n_1-1,\,n_2-1}}\right], \quad F_{1-\alpha/2,\nu_1,\nu_2} = \frac{1}{F_{\alpha/2,\nu_2,\nu_1}}

Kapan Digunakan

  • Trigger keywords: “selang kepercayaan”, “confidence interval”, “CI”, “margin of error”, “interval estimasi”, “tingkat kepercayaan X%”, “ukuran sampel minimum”, “seberapa presisi estimasi”.
  • Tipe skenario soal:
    • Diberikan data sampel → hitung CI untuk μ\mu, σ2\sigma^2, atau proporsi.
    • Diberikan dua sampel independen → CI untuk μ1μ2\mu_1-\mu_2 atau σ12/σ22\sigma_1^2/\sigma_2^2.
    • Diberikan data berpasangan → CI untuk μD\mu_D menggunakan selisih.
    • Diberikan lebar CI atau margin error yang diinginkan → tentukan nminn_{\min}.
    • Diberikan CI → interpretasikan dalam konteks permasalahan.

Kapan TIDAK Boleh Digunakan

  • ZZ-interval tidak berlaku jika σ2\sigma^2 tidak diketahui dan nn kecil (gunakan tt-interval).
  • CI χ2\chi^2 dan FF tidak robust — tidak berlaku jika populasi jelas tidak Normal, bahkan untuk nn besar.
  • Pooled tt tidak berlaku jika variansi dua populasi jelas berbeda (gunakan Welch/Satterthwaite).
  • CI proporsi (Normal aproksimasi) tidak berlaku jika np^<5n\hat{p} < 5 atau n(1p^)<5n(1-\hat{p}) < 5.

Quick Decision Tree

graph TD
    A["Konstruksi Selang Kepercayaan"] --> B["Berapa banyak populasi?"]
    B -->|"Satu"| C["Parameter apa yang diminati?"]
    B -->|"Dua"| D["Sampel berpasangan atau bebas?"]
    C -->|"Mean mu"| E["Apakah sigma^2 diketahui?"]
    C -->|"Variansi sigma^2"| F["Gunakan chi-kuadrat interval<br>Pivot: (n-1)S^2/sigma^2 ~ chi^2(n-1)<br>CI tidak simetris"]
    C -->|"Proporsi p"| G["Cek n*p-hat >= 5<br>DAN n*(1-p-hat) >= 5<br>Gunakan Z-interval proporsi"]
    E -->|"Ya"| H["Z-interval<br>x-bar +/- z * sigma/sqrt(n)"]
    E -->|"Tidak"| I["t-interval<br>x-bar +/- t_(alpha/2, n-1) * S/sqrt(n)"]
    D -->|"Berpasangan<br>(unit sama)"| J["Hitung D_i = X1i - X2i<br>t-interval pada D<br>df = n - 1"]
    D -->|"Bebas<br>(unit berbeda)"| K["Asumsi sigma1^2 = sigma2^2?"]
    K -->|"Ya"| L["Pooled t-interval<br>df = n1 + n2 - 2"]
    K -->|"Tidak"| M["Welch t-interval<br>df = Satterthwaite nu*"]
    B -->|"Dua (variansi)"| N["F-interval untuk sigma1^2/sigma2^2<br>Pivot: F(n1-1, n2-1)<br>Gunakan relasi timbal-balik F"]

Follow-up Options
  1. “Berikan contoh soal CI untuk proporsi dan selisih dua proporsi dengan uji kondisi normalitas”
  2. “Jelaskan hubungan 4.7 Selang Kepercayaan dengan 4.8 Uji Hipotesis (dualitas CI dan uji dua sisi)”
  3. “Buat flashcard 1-halaman: tabel pivot, nilai kritis, dan derajat bebas untuk semua jenis CI di CF2”

📖 Ref: Miller et al. (2014) Bab 11.1–11.5; Hogg-Tanis-Zimm (2015) Bab 5.5–5.8; Walpole et al. (2012) Bab 8.1, 8.4, 8.5 | 🗓️ 2026-02-21 | #CF2 #Inferensi #SelangKepercayaan #ConfidenceInterval #tDistribusi #ChiKuadrat #FDistribusi #Pivotal