PAI · AAMAI · 2026
Aktuaria
Indonesia
CF2 · Materi 4.8

Uji Hipotesis

2026-02-21 Hard Bobot: 25–35% Hogg-Tanis-Zimmerman (2015) Bab 6.1–6.5; Hogg-McKean-Craig (2019) Bab 4.4–4.6; Miller et al. (2014) Bab 9.1–9.5; Walpole et al. (2012) Bab 10.1–10.5
CF2InferensStatistikUjiHipotesisHypothesisTestingZTestTTestChiKuadratFTestPValueErrorTipeIErrorTipeIIPowerTopikEmpat

📊 4.8 — Uji Hipotesis

Ringkasan Cepat

Topik: Uji Hipotesis — Kerangka Umum, Z-test, t-test, χ2\chi^2-test, F-test | Bobot: ~25–35% | Difficulty: Hard Ref: Hogg-Tanis-Zimm (2015) Bab 6.1–6.5; Hogg-McKean-Craig (2019) Bab 4.4–4.6; Miller et al. (2014) Bab 9.1–9.5; Walpole et al. (2012) Bab 10.1–10.5 | Prereq: 4.1 Penarikan Sampel Acak, 4.2 Distribusi Sampel, 4.3 Teorema Limit Pusat (CLT), 4.7 Interval Kepercayaan

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 4: Inferensi Statistik4.8Merumuskan H0H_0 dan H1H_1 (satu sisi & dua sisi); mendefinisikan dan menghitung statistik uji ZZ, tt, χ2\chi^2, FF; menentukan wilayah penolakan (rejection region) dari level signifikansi α\alpha; menghitung dan menginterpretasikan pp-value; membedakan Tipe I error (α\alpha), Tipe II error (β\beta), dan daya uji (power =1β= 1-\beta); melaksanakan uji satu sampel untuk μ\mu (σ2\sigma^2 diketahui/tidak), untuk σ2\sigma^2, uji dua sampel untuk μ1μ2\mu_1-\mu_2 (independen & berpasangan), dan uji FF untuk σ12/σ22\sigma_1^2/\sigma_2^2; mengaitkan uji hipotesis dengan interval kepercayaan25–35%Hard4.1 Penarikan Sampel Acak, 4.2 Distribusi Sampel, 4.3 Teorema Limit Pusat (CLT), 4.7 Interval Kepercayaan4.7 Interval Kepercayaan, 4.9 Uji Goodness-of-Fit, 4.10 Regresi Linear SederhanaHogg-Tanis-Zimm (2015) Bab 6.1–6.5; Hogg-McKean-Craig (2019) Bab 4.4–4.6; Miller et al. (2014) Bab 9.1–9.5; Walpole et al. (2012) Bab 10.1–10.5

Section 1 — Intuisi

Seorang aktuaris menduga bahwa rata-rata klaim dari polis asuransi jiwa baru lebih rendah dari Rp 150 juta — nilai historis perusahaan. Ia mengambil sampel 40 polis, menghitung xˉ=143\bar{x} = 143 juta, dan bertanya: “Apakah perbedaan ini cukup besar untuk menyimpulkan bahwa mean populasi benar-benar berubah, ataukah hanya fluktuasi acak sampel?” Inilah pertanyaan inti uji hipotesis (hypothesis testing): membedakan sinyal nyata dari kebisingan acak (noise).

Kerangka uji hipotesis bekerja dengan logika bukti ex contrario — mirip dengan pembuktian dalam hukum. Kita mulai dengan hipotesis nol H0H_0 yang menyatakan “tidak ada perubahan” atau “tidak ada efek” — anggap ini sebagai “praduga tak bersalah”. Kemudian data memberikan bukti berupa statistik uji. Jika bukti cukup ekstrem (probabilitasnya kecil di bawah H0H_0), kita tolak H0H_0 dan menerima hipotesis alternatif H1H_1. Jika tidak cukup ekstrem, kita gagal menolak H0H_0 — bukan berarti H0H_0 terbukti benar, hanya saja bukti tidak cukup kuat untuk menolaknya.

Dua jenis kesalahan bisa terjadi: Tipe I (menolak H0H_0 yang sebenarnya benar — false positive) dan Tipe II (gagal menolak H0H_0 yang sebenarnya salah — false negative). Level signifikansi α\alpha adalah batas maksimum yang kita toleransi untuk Tipe I — biasanya 0,01, 0,05, atau 0,10. Daya uji (power) =1β= 1 - \beta mengukur kemampuan mendeteksi efek nyata. Ada trade-off inheren: untuk ukuran sampel tetap, memperkecil α\alpha (lebih ketat) akan memperbesar β\beta (lebih sering gagal mendeteksi efek nyata). Satu-satunya cara memperkecil keduanya sekaligus adalah memperbesar nn.

pp-value adalah probabilitas mendapat statistik uji se-ekstrem atau lebih ekstrem dari yang terobservasi, jika H0H_0 benar. pp-value kecil berarti data sangat tidak konsisten dengan H0H_0 — semakin kecil pp-value, semakin kuat bukti melawan H0H_0. Keputusan: tolak H0H_0 jika pαp \leq \alpha.

Section 2 — Definisi Formal

Definisi Matematis

Hipotesis Statistik: Pernyataan tentang parameter populasi θ\theta: H0:θΘ0(hipotesis nol),H1:θΘ1(hipotesis alternatif)H_0: \theta \in \Theta_0 \quad \text{(hipotesis nol)}, \qquad H_1: \theta \in \Theta_1 \quad \text{(hipotesis alternatif)} di mana Θ0Θ1=\Theta_0 \cap \Theta_1 = \emptyset dan Θ0Θ1=Θ\Theta_0 \cup \Theta_1 = \Theta (semua nilai yang mungkin).

Tipe Hipotesis Alternatif: H1:θθ0(dua sisi),H1:θ>θ0(satu sisi kanan),H1:θ<θ0(satu sisi kiri)H_1: \theta \neq \theta_0 \quad \text{(dua sisi)}, \quad H_1: \theta > \theta_0 \quad \text{(satu sisi kanan)}, \quad H_1: \theta < \theta_0 \quad \text{(satu sisi kiri)}

Statistik Uji (Test Statistic): Fungsi dari data sampel T=T(X1,,Xn)T = T(X_1,\ldots,X_n) yang digunakan untuk mengambil keputusan. Distribusi TT di bawah H0H_0 diketahui dan digunakan untuk menentukan wilayah penolakan.

pp-value: p-value=P(T se-ekstrem atau lebihH0 benar)p\text{-value} = P(T \text{ se-ekstrem atau lebih} \mid H_0 \text{ benar})

  • Dua sisi: p=P(TtobsH0)p = P(|T| \geq |t_{\text{obs}}| \mid H_0)
  • Satu sisi kanan: p=P(TtobsH0)p = P(T \geq t_{\text{obs}} \mid H_0)
  • Satu sisi kiri: p=P(TtobsH0)p = P(T \leq t_{\text{obs}} \mid H_0)

Variabel & Parameter

SimbolMaknaCatatan
H0H_0Hipotesis nolPernyataan “status quo”; ditolak atau gagal ditolak (tidak pernah “diterima”)
H1H_1 (atau HaH_a)Hipotesis alternatifYang ingin dibuktikan; satu sisi atau dua sisi
α\alphaLevel signifikansi=P(Tipe I error)=P(tolak H0H0 benar)= P(\text{Tipe I error}) = P(\text{tolak }H_0 \mid H_0 \text{ benar}); dipilih sebelum uji
β\betaProbabilitas Tipe II error=P(gagal tolak H0H1 benar)= P(\text{gagal tolak }H_0 \mid H_1 \text{ benar}); bergantung pada nilai θ\theta di bawah H1H_1
1β1-\betaDaya uji (power)Probabilitas mendeteksi efek nyata; idealnya mendekati 1
tobst_{\text{obs}}Nilai statistik uji terobservasiBilangan tetap dihitung dari data; dibandingkan dengan nilai kritis
zαz_\alphaNilai kritis N(0,1)N(0,1) ekor kanan α\alphaP(Z>zα)=αP(Z > z_\alpha) = \alpha; contoh: z0,05=1,645z_{0{,}05} = 1{,}645, z0,025=1,96z_{0{,}025} = 1{,}96
tα(ν)t_\alpha(\nu)Nilai kritis t(ν)t(\nu) ekor kanan α\alphaP(t(ν)>tα(ν))=αP(t(\nu) > t_\alpha(\nu)) = \alpha
χα2(ν)\chi^2_\alpha(\nu)Nilai kritis χ2(ν)\chi^2(\nu) ekor kanan α\alphaP(χ2(ν)>χα2(ν))=αP(\chi^2(\nu) > \chi^2_\alpha(\nu)) = \alpha
Fα(ν1,ν2)F_\alpha(\nu_1,\nu_2)Nilai kritis F(ν1,ν2)F(\nu_1,\nu_2) ekor kanan α\alphaP(F(ν1,ν2)>Fα(ν1,ν2))=αP(F(\nu_1,\nu_2) > F_\alpha(\nu_1,\nu_2)) = \alpha
Sp2S_p^2Variansi pooledSp2=(n11)S12+(n21)S22n1+n22S_p^2 = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}; digunakan saat σ12=σ22\sigma_1^2 = \sigma_2^2 diasumsikan

Tabel Master: Semua Uji Hipotesis Utama

UjiParameterH0H_0Statistik UjiDistribusi di bawah H0H_0Asumsi
Z-test satu sampelμ\muμ=μ0\mu = \mu_0Z=Xˉμ0σ/nZ = \dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}N(0,1)N(0,1)σ2\sigma^2 diketahui; Normal atau nn besar
t-test satu sampelμ\muμ=μ0\mu = \mu_0T=Xˉμ0S/nT = \dfrac{\bar{X}-\mu_0}{S/\sqrt{n}}t(n1)t(n-1)σ2\sigma^2 tidak diketahui; populasi Normal
χ2\chi^2-test variansiσ2\sigma^2σ2=σ02\sigma^2 = \sigma_0^2χ2=(n1)S2σ02\chi^2 = \dfrac{(n-1)S^2}{\sigma_0^2}χ2(n1)\chi^2(n-1)Populasi Normal
t-test dua sampel independen (variansi sama)μ1μ2\mu_1-\mu_2μ1=μ2\mu_1=\mu_2T=Xˉ1Xˉ2Sp1/n1+1/n2T = \dfrac{\bar{X}_1-\bar{X}_2}{S_p\sqrt{1/n_1+1/n_2}}t(n1+n22)t(n_1+n_2-2)Populasi Normal, σ12=σ22\sigma_1^2=\sigma_2^2, independen
t-test dua sampel independen (variansi beda)μ1μ2\mu_1-\mu_2μ1=μ2\mu_1=\mu_2T=Xˉ1Xˉ2S12/n1+S22/n2T = \dfrac{\bar{X}_1-\bar{X}_2}{\sqrt{S_1^2/n_1+S_2^2/n_2}}t(ν)t(\nu^*) WelchPopulasi Normal, σ12σ22\sigma_1^2\neq\sigma_2^2
t-test berpasanganμD=μ1μ2\mu_D = \mu_1-\mu_2μD=0\mu_D=0T=DˉSD/nT = \dfrac{\bar{D}}{S_D/\sqrt{n}}t(n1)t(n-1)Di=X1iX2iD_i = X_{1i}-X_{2i} Normal; data berpasangan
F-test variansiσ12/σ22\sigma_1^2/\sigma_2^2σ12=σ22\sigma_1^2=\sigma_2^2F=S12/S22F = S_1^2/S_2^2F(n11,n21)F(n_1-1,n_2-1)Populasi Normal, dua sampel independen

Wilayah Penolakan per Tipe Alternatif

H1H_1Wilayah Penolakanpp-value
θθ0\theta \neq \theta_0 (dua sisi)T>cα/2\|T\| > c_{\alpha/2}2P(Ttobs)2P(T \geq \|t_{\text{obs}}\|)
θ>θ0\theta > \theta_0 (satu sisi kanan)T>cαT > c_\alphaP(Ttobs)P(T \geq t_{\text{obs}})
θ<θ0\theta < \theta_0 (satu sisi kiri)T<cαT < -c_\alphaP(Ttobs)P(T \leq t_{\text{obs}})

di mana cαc_\alpha adalah nilai kritis distribusi yang sesuai pada level α\alpha.

Rumus Utama — Kerangka Pengambilan Keputusan

Tolak H0    p-valueα    Tobs>cα/2 (dua sisi)\text{Tolak } H_0 \iff p\text{-value} \leq \alpha \iff |T_{\text{obs}}| > c_{\alpha/2} \text{ (dua sisi)}

Label: Kesetaraan Keputusan — tiga cara pengambilan keputusan yang selalu konsisten: via pp-value, via wilayah penolakan, dan via interval kepercayaan.

α=P(Tipe I)=P(tolak H0H0 benar),β=P(Tipe II)=P(gagal tolak H0H1 benar)\alpha = P(\text{Tipe I}) = P(\text{tolak } H_0 \mid H_0 \text{ benar}), \qquad \beta = P(\text{Tipe II}) = P(\text{gagal tolak } H_0 \mid H_1 \text{ benar})

Label: Dua Jenis Kesalahanα\alpha dikendalikan oleh pemilihan level signifikansi; β\beta bergantung pada nilai θ\theta yang sebenarnya di bawah H1H_1.

Power(θ)=1β(θ)=P(tolak H0θ adalah nilai sebenarnya)\text{Power}(\theta) = 1 - \beta(\theta) = P(\text{tolak } H_0 \mid \theta \text{ adalah nilai sebenarnya})

Label: Fungsi Daya Uji — probabilitas mendeteksi bahwa H0H_0 salah ketika nilai parameter sesungguhnya adalah θ\theta; fungsi dari θ\theta, nn, α\alpha, dan statistik uji.

df Welch=ν=(S12/n1+S22/n2)2(S12/n1)2n11+(S22/n2)2n21\text{df Welch} = \nu^* = \frac{(S_1^2/n_1 + S_2^2/n_2)^2}{\dfrac{(S_1^2/n_1)^2}{n_1-1} + \dfrac{(S_2^2/n_2)^2}{n_2-1}}

Label: Derajat Kebebasan Welch (t-test Dua Sampel Variansi Berbeda) — aproksimasi df untuk uji Welch-Satterthwaite; selalu dibulatkan ke bawah ke integer.

Hubungan IC dan Uji:θ0IC1α(θ)    tolak H0:θ=θ0 pada level α\text{Hubungan IC dan Uji}: \quad \theta_0 \notin \text{IC}_{1-\alpha}(\theta) \iff \text{tolak } H_0: \theta = \theta_0 \text{ pada level } \alpha

Label: Dualitas Interval Kepercayaan dan Uji Hipotesis — IC dua sisi 1α1-\alpha dan uji dua sisi pada level α\alpha selalu menghasilkan keputusan yang sama; interval kepercayaan memberikan informasi lebih kaya daripada keputusan biner.

Asumsi Eksplisit

  • Z-test: σ2\sigma^2 diketahui dan populasi Normal (eksak) atau n30n \geq 30 (aproksimasi CLT). Dalam praktik sangat jarang karena σ2\sigma^2 hampir tidak pernah diketahui.
  • t-test satu sampel: Populasi Normal dengan σ2\sigma^2 tidak diketahui. Robust terhadap deviasi ringan dari normalitas untuk n15n \geq 15.
  • t-test dua sampel pooled: Kedua populasi Normal dengan variansi sama (σ12=σ22\sigma_1^2 = \sigma_2^2); dua sampel independen. Sebaiknya lakukan F-test terlebih dahulu untuk memeriksa asumsi variansi sama.
  • t-test berpasangan: Perbedaan Di=X1iX2iD_i = X_{1i} - X_{2i} harus Normal (atau nn cukup besar); data harus berpasangan secara natural (pengukuran sebelum-sesudah, atau pasangan yang cocok).
  • χ2\chi^2-test variansi: Populasi Normal — uji ini sangat tidak robust terhadap deviasi normalitas; bahkan deviasi ringan dapat memengaruhi validitasnya secara signifikan.
  • F-test variansi: Kedua populasi Normal, dua sampel independen — seperti χ2\chi^2-test, sangat sensitif terhadap asumsi normalitas.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Mengapa statistik uji terdistribusi seperti yang dinyatakan di bawah H0H_0?

Untuk Z-test: jika H0:μ=μ0H_0: \mu = \mu_0 benar dan Xii.i.d.N(μ0,σ2)X_i \overset{\text{i.i.d.}}{\sim} N(\mu_0, \sigma^2), maka: XˉN ⁣(μ0,σ2n)    Z=Xˉμ0σ/nN(0,1)\bar{X} \sim N\!\left(\mu_0, \frac{\sigma^2}{n}\right) \implies Z = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1)

Untuk t-test: mengganti σ\sigma dengan SS menghasilkan T=(Xˉμ0)/(S/n)t(n1)T = (\bar{X}-\mu_0)/(S/\sqrt{n}) \sim t(n-1) (Fisher’s Theorem). Distribusi-tt berlaku eksak untuk populasi Normal; untuk populasi non-Normal dengan nn besar, CLT memastikan TT mendekati N(0,1)N(0,1).

Untuk χ2\chi^2-test: dari Fisher’s Theorem, (n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2 \sim \chi^2(n-1). Jika H0:σ2=σ02H_0: \sigma^2 = \sigma_0^2 benar: (n1)S2/σ02χ2(n1)(n-1)S^2/\sigma_0^2 \sim \chi^2(n-1).

Untuk F-test: F=S12/S22=[(n11)S12/σ12/(n11)]/[(n21)S22/σ22/(n21)]F = S_1^2/S_2^2 = [(n_1-1)S_1^2/\sigma_1^2/(n_1-1)] / [(n_2-1)S_2^2/\sigma_2^2/(n_2-1)]. Jika H0:σ12=σ22H_0: \sigma_1^2 = \sigma_2^2 benar, faktor σ2\sigma^2 hilang dan FF(n11,n21)F \sim F(n_1-1, n_2-1).

Lima Langkah Baku Uji Hipotesis

Setiap soal uji hipotesis harus diselesaikan dengan urutan langkah yang sama:

Langkah 1 — Rumuskan Hipotesis: Nyatakan H0H_0 dan H1H_1 secara eksplisit dalam bentuk parameter (μ\mu, σ2\sigma^2, dsb.), bukan dalam kata-kata saja. Tentukan apakah uji satu sisi atau dua sisi berdasarkan konteks soal.

Langkah 2 — Pilih Statistik Uji dan Distribusinya di bawah H0H_0: Identifikasi uji yang sesuai dari tabel master (Z, tt, χ2\chi^2, FF). Sebutkan distribusi di bawah H0H_0 beserta derajat kebebasannya.

Langkah 3 — Tentukan Wilayah Penolakan atau Nilai Kritis: Dari level signifikansi α\alpha dan distribusi di langkah 2, tentukan nilai kritis cαc_\alpha atau cα/2c_{\alpha/2}. Wilayah penolakan bergantung pada arah H1H_1.

Langkah 4 — Hitung Statistik Uji dari Data: Substitusikan nilai sampel (xˉ\bar{x}, ss, nn, dsb.) ke formula statistik uji. Ini menghasilkan satu bilangan tobst_{\text{obs}}.

Langkah 5 — Ambil Keputusan dan Interpretasikan: Bandingkan tobst_{\text{obs}} dengan nilai kritis (atau hitung pp-value). Nyatakan keputusan dalam konteks masalah asli — bukan hanya “tolak” atau “gagal tolak” secara abstrak.

Derivasi Daya Uji untuk Z-test Satu Sisi:

Untuk uji satu sisi kanan H1:μ>μ0H_1: \mu > \mu_0 dengan statistik Z=(Xˉμ0)/(σ/n)Z = (\bar{X}-\mu_0)/(\sigma/\sqrt{n}):

Wilayah penolakan: Z>zαZ > z_\alpha, ekuivalen dengan Xˉ>μ0+zασ/n:=c\bar{X} > \mu_0 + z_\alpha \cdot \sigma/\sqrt{n} := c.

Daya pada nilai alternatif μ1>μ0\mu_1 > \mu_0:

Power(μ1)=P(Xˉ>cμ=μ1)=P ⁣(Z>cμ1σ/n)=1Φ ⁣(cμ1σ/n)\text{Power}(\mu_1) = P(\bar{X} > c \mid \mu = \mu_1) = P\!\left(Z > \frac{c - \mu_1}{\sigma/\sqrt{n}}\right) = 1 - \Phi\!\left(\frac{c - \mu_1}{\sigma/\sqrt{n}}\right)

Substitusi c=μ0+zασ/nc = \mu_0 + z_\alpha \cdot \sigma/\sqrt{n}:

Power(μ1)=1Φ ⁣(zα(μ1μ0)nσ)=Φ ⁣((μ1μ0)nσzα)\text{Power}(\mu_1) = 1 - \Phi\!\left(z_\alpha - \frac{(\mu_1-\mu_0)\sqrt{n}}{\sigma}\right) = \Phi\!\left(\frac{(\mu_1-\mu_0)\sqrt{n}}{\sigma} - z_\alpha\right)

Untuk dua sisi (H1:μμ0H_1: \mu \neq \mu_0), aproksimasi yang biasa digunakan: Power(μ1)Φ ⁣(μ1μ0nσzα/2)\text{Power}(\mu_1) \approx \Phi\!\left(\frac{|\mu_1-\mu_0|\sqrt{n}}{\sigma} - z_{\alpha/2}\right)

Ukuran Sampel untuk Daya Target:

Untuk mencapai Power(μ1)1β\text{Power}(\mu_1) \geq 1-\beta pada uji satu sisi:

n((zα+zβ)σμ1μ0)2n \geq \left(\frac{(z_\alpha + z_\beta)\,\sigma}{\mu_1 - \mu_0}\right)^2

Untuk uji dua sisi, ganti zαz_\alpha dengan zα/2z_{\alpha/2}.

Hubungan IC dengan Uji Hipotesis (Dualitas):

IC dua sisi 1α1-\alpha untuk μ\mu: xˉ±tα/2(n1)s/n\bar{x} \pm t_{\alpha/2}(n-1) \cdot s/\sqrt{n}.

Tolak H0:μ=μ0H_0: \mu = \mu_0 pada level α\alpha     \iff μ0\mu_0 berada di luar IC 1α1-\alpha     \iff tobs>tα/2(n1)|t_{\text{obs}}| > t_{\alpha/2}(n-1).

Dualitas ini berarti IC memberikan semua informasi yang diberikan uji hipotesis ditambah ukuran efek — IC selalu lebih informatif dari sekadar keputusan biner.

Dilarang
  1. Dilarang menyimpulkan ”H0H_0 terbukti benar” atau ”H0H_0 diterima” ketika gagal menolak H0H_0. Ketidakmampuan menolak H0H_0 tidak berarti H0H_0 benar — hanya berarti bukti tidak cukup kuat. Frasa yang benar: “gagal menolak H0H_0” atau “tidak cukup bukti untuk menolak H0H_0”.
  2. Dilarang mengubah level signifikansi α\alpha setelah melihat data. α\alpha harus dipilih sebelum pengumpulan data. Menyesuaikan α\alpha agar keputusan sesuai harapan adalah manipulasi statistik (p-hacking).
  3. Dilarang menginterpretasikan pp-value sebagai probabilitas bahwa H0H_0 benar. pp-value adalah P(data se-ekstremH0 benar)P(\text{data se-ekstrem} \mid H_0 \text{ benar}) — bukan P(H0 benardata)P(H_0 \text{ benar} \mid \text{data}). Keduanya sangat berbeda (Teorema Bayes diperlukan untuk yang kedua).

Section 4 — Contoh Soal

Soal A — Fundamental

Sebuah perusahaan asuransi mengklaim bahwa rata-rata waktu penyelesaian klaim adalah μ0=14\mu_0 = 14 hari. Seorang regulator mengambil sampel acak n=25n = 25 klaim dan memperoleh xˉ=15,8\bar{x} = 15{,}8 hari dan s=4,5s = 4{,}5 hari. Asumsikan waktu penyelesaian berdistribusi Normal.

(a) Rumuskan H0H_0 dan H1H_1 untuk menguji apakah rata-rata berbeda dari 14 hari. Tentukan level signifikansi α=0,05\alpha = 0{,}05. (b) Identifikasi statistik uji yang sesuai beserta distribusinya di bawah H0H_0. Jelaskan mengapa tt-test, bukan ZZ-test. (c) Hitung nilai statistik uji tobst_{\text{obs}} dan tentukan wilayah penolakan. (d) Hitung pp-value dan ambil keputusan. (e) Bangun IC 95%95\% untuk μ\mu dan verifikasi konsistensinya dengan keputusan uji hipotesis.

Solusi Soal A

1. Identifikasi Variabel

  • n=25n = 25; xˉ=15,8\bar{x} = 15{,}8; s=4,5s = 4{,}5; μ0=14\mu_0 = 14
  • σ2\sigma^2 tidak diketahui; populasi Normal
  • df =n1=24= n-1 = 24

2. Identifikasi Distribusi / Model σ2\sigma^2 tidak diketahui → t-test satu sampel. Statistik T=(Xˉμ0)/(S/n)t(24)T = (\bar{X}-\mu_0)/(S/\sqrt{n}) \sim t(24) di bawah H0H_0.

3. Setup Persamaan

Lima langkah baku:

4. Eksekusi Aljabar

(a) Hipotesis: H0:μ=14vsH1:μ14(dua sisi),α=0,05H_0: \mu = 14 \quad \text{vs} \quad H_1: \mu \neq 14 \quad (\text{dua sisi}), \quad \alpha = 0{,}05

(b) Statistik uji dan justifikasi:

Gunakan t-test karena σ2\sigma^2 tidak diketahui dan diestimasi dengan s2s^2. Jika digunakan Z-test, kita perlu σ\sigma (diketahui), yang tidak diberikan dalam soal. Substitusi ss ke formula Z-test menghasilkan distribusi tt, bukan Normal standar (Fisher’s Theorem).

T=Xˉμ0S/nt(24)di bawah H0T = \frac{\bar{X} - \mu_0}{S/\sqrt{n}} \sim t(24) \quad \text{di bawah } H_0

(c) Nilai kritis, wilayah penolakan, dan tobst_{\text{obs}}:

Nilai kritis (dua sisi, α=0,05\alpha = 0{,}05, df =24= 24): tα/2(24)=t0,025(24)=2,064t_{\alpha/2}(24) = t_{0{,}025}(24) = 2{,}064

Wilayah penolakan: T>2,064|T| > 2{,}064, yaitu T<2,064T < -2{,}064 atau T>2,064T > 2{,}064.

Hitung tobst_{\text{obs}}: tobs=15,8144,5/25=1,84,5/5=1,80,9=2,00t_{\text{obs}} = \frac{15{,}8 - 14}{4{,}5/\sqrt{25}} = \frac{1{,}8}{4{,}5/5} = \frac{1{,}8}{0{,}9} = 2{,}00

(d) pp-value dan keputusan:

Karena uji dua sisi dan tobs=2,00t_{\text{obs}} = 2{,}00: p-value=2P(t(24)2,00)=2×P(t(24)>2,00)p\text{-value} = 2\,P(t(24) \geq 2{,}00) = 2 \times P(t(24) > 2{,}00)

Dari tabel t(24)t(24): P(t(24)>2,064)=0,025P(t(24) > 2{,}064) = 0{,}025 dan P(t(24)>1,711)=0,05P(t(24) > 1{,}711) = 0{,}05. Karena tobs=2,00t_{\text{obs}} = 2{,}00 berada di antara keduanya: 0,05<p-value<0,100{,}05 < p\text{-value} < 0{,}10

Lebih tepatnya: p-value2×0,029=0,058p\text{-value} \approx 2 \times 0{,}029 = 0{,}058.

Keputusan: Karena p-value0,058>α=0,05p\text{-value} \approx 0{,}058 > \alpha = 0{,}05, gagal menolak H0H_0.

Juga: tobs=2,00<2,064=t0,025(24)|t_{\text{obs}}| = 2{,}00 < 2{,}064 = t_{0{,}025}(24) — tidak masuk wilayah penolakan.

Interpretasi: Pada level signifikansi 5%, tidak terdapat cukup bukti statistik bahwa rata-rata waktu penyelesaian klaim berbeda dari 14 hari. Namun, pp-value 0,058\approx 0{,}058 cukup dekat dengan 0,05 — hasil ini bersifat marginal dan mungkin signifikan pada α=0,10\alpha = 0{,}10.

(e) IC 95% dan dualitas:

IC95%(μ)=xˉ±t0,025(24)sn=15,8±2,064×0,9=15,8±1,858=(13,942;  17,658)\text{IC}_{95\%}(\mu) = \bar{x} \pm t_{0{,}025}(24) \cdot \frac{s}{\sqrt{n}} = 15{,}8 \pm 2{,}064 \times 0{,}9 = 15{,}8 \pm 1{,}858 = (13{,}942;\; 17{,}658)

Verifikasi dualitas: μ0=14\mu_0 = 14 berada di dalam interval (13,942;  17,658)(13{,}942;\; 17{,}658) → gagal menolak H0H_0 ✓. Konsisten dengan keputusan via pp-value.

5. Verification

  • tobs=2,00t_{\text{obs}} = 2{,}00: hitung ulang (15,814)/(4,5/5)=1,8/0,9=2,00(15{,}8 - 14)/(4{,}5/5) = 1{,}8/0{,}9 = 2{,}00
  • pp-value >α> \alpha: gagal tolak H0H_0; μ0\mu_0 \in IC: gagal tolak H0H_0 — kedua metode konsisten ✓
  • IC mencakup 14: (13,94;17,66)(13{,}94; 17{,}66) — 14 berada sangat dekat batas bawah, menjelaskan hasil marginal ✓
Exam Tips — Soal A

Target waktu: 10–12 menit Common trap 1: tobs=2,00<t0,025(24)=2,064t_{\text{obs}} = 2{,}00 < t_{0{,}025}(24) = 2{,}064gagal tolak. Banyak kandidat salah karena membandingkan tobst_{\text{obs}} dengan z0,025=1,96z_{0{,}025} = 1{,}96 (menggunakan nilai kritis Normal, bukan tt). Untuk n=25n=25 dengan σ\sigma tidak diketahui, selalu gunakan nilai kritis tt, bukan zz. Common trap 2: pp-value untuk uji dua sisi = dua kali probabilitas ekor satu sisi. Jangan lupa faktor 2. Shortcut: IC dan uji hipotesis selalu konsisten — jika IC dua sisi 1α1-\alpha sudah dihitung, cukup periksa apakah μ0\mu_0 ada di dalam IC untuk keputusan tanpa perlu menghitung statistik uji secara terpisah.


Soal B — Exam-Typical

Sebuah perusahaan re-asuransi mengklaim bahwa variansi kerugian klaim dari dua lini bisnis (Lini A: n1=16n_1=16 sampel, s12=120s_1^2 = 120; Lini B: n2=21n_2=21 sampel, s22=45s_2^2 = 45) adalah sama. Diasumsikan kerugian berdistribusi Normal secara independen.

(a) Lakukan F-test untuk menguji H0:σ12=σ22H_0: \sigma_1^2 = \sigma_2^2 vs H1:σ12σ22H_1: \sigma_1^2 \neq \sigma_2^2 pada α=0,10\alpha = 0{,}10. (b) Hitung pp-value (pendekatan via tabel FF). (c) Jika kesimpulan dari (a) adalah variansi berbeda, lakukan uji H0:μ1=μ2H_0: \mu_1 = \mu_2 menggunakan t-test Welch. Data tambahan: xˉ1=85\bar{x}_1 = 85, xˉ2=72\bar{x}_2 = 72. Hitung df Welch ν\nu^* (pembulatan ke bawah). (d) Jika sebaliknya variansi sama, hitung statistik uji tt pooled dan tentukan distribusinya. (e) Sebuah auditor mengambil sampel n=20n=20 klaim dari Lini A dan menguji H0:σ12=100H_0: \sigma_1^2 = 100 vs H1:σ12>100H_1: \sigma_1^2 > 100 pada α=0,05\alpha = 0{,}05. Data: s2=147s^2 = 147. Lakukan uji χ2\chi^2 lengkap.

Solusi Soal B

1. Identifikasi Variabel

  • Lini A: n1=16n_1=16, xˉ1=85\bar{x}_1=85, s12=120s_1^2=120; df1=15_1 = 15
  • Lini B: n2=21n_2=21, xˉ2=72\bar{x}_2=72, s22=45s_2^2=45; df2=20_2 = 20
  • Kedua populasi Normal, independen

2. Identifikasi Distribusi / Model F-test untuk variansi; t-test (pooled atau Welch) untuk mean tergantung hasil F-test; χ2\chi^2-test untuk variansi satu sampel.

3. Setup Persamaan

F-test: F=S12/S22F = S_1^2/S_2^2 (peletakan numerator: variansi lebih besar di atas untuk kemudahan)

4. Eksekusi Aljabar

(a) F-test H0:σ12=σ22H_0: \sigma_1^2 = \sigma_2^2:

H0:σ12=σ22H_0: \sigma_1^2 = \sigma_2^2 vs H1:σ12σ22H_1: \sigma_1^2 \neq \sigma_2^2, α=0,10\alpha = 0{,}10.

Letakkan variansi lebih besar di numerator (konvensi umum untuk uji dua sisi): Fobs=s12s22=12045=832,667,FF(15,20) di bawah H0F_{\text{obs}} = \frac{s_1^2}{s_2^2} = \frac{120}{45} = \frac{8}{3} \approx 2{,}667, \quad F \sim F(15, 20) \text{ di bawah } H_0

Nilai kritis (dua sisi, α/2=0,05\alpha/2 = 0{,}05 untuk ekor kanan karena s12>s22s_1^2 > s_2^2): F0,05(15,20)2,20F_{0{,}05}(15, 20) \approx 2{,}20

Wilayah penolakan (ekor kanan karena s12>s22s_1^2 > s_2^2 diletakkan di numerator): F>F0,05(15,20)=2,20F > F_{0{,}05}(15,20) = 2{,}20.

Keputusan: Fobs=2,667>2,20F_{\text{obs}} = 2{,}667 > 2{,}20Tolak H0H_0.

Kesimpulan: Cukup bukti bahwa variansi kedua lini bisnis berbeda pada α=0,10\alpha = 0{,}10.

(b) pp-value F-test:

p-value=2×P(F(15,20)2,667)p\text{-value} = 2 \times P(F(15,20) \geq 2{,}667) (karena dua sisi).

Dari tabel: F0,05(15,20)=2,20F_{0{,}05}(15,20) = 2{,}20 dan F0,025(15,20)2,57F_{0{,}025}(15,20) \approx 2{,}57. Karena Fobs=2,667>2,57F_{\text{obs}} = 2{,}667 > 2{,}57: P(F(15,20)2,667)<0,025P(F(15,20) \geq 2{,}667) < 0{,}025

Maka p-value=2×P()<0,05p\text{-value} = 2 \times P(\ldots) < 0{,}05. Lebih tepatnya: pp-value 2×0,020=0,040\approx 2 \times 0{,}020 = 0{,}040.

(c) t-test Welch (σ12σ22\sigma_1^2 \neq \sigma_2^2):

Statistik uji: Tobs=xˉ1xˉ2s12/n1+s22/n2=8572120/16+45/21=137,5+2,143=139,643=133,105=4,187T_{\text{obs}} = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_1^2/n_1 + s_2^2/n_2}} = \frac{85 - 72}{\sqrt{120/16 + 45/21}} = \frac{13}{\sqrt{7{,}5 + 2{,}143}} = \frac{13}{\sqrt{9{,}643}} = \frac{13}{3{,}105} = 4{,}187

Derajat kebebasan Welch: ν=(s12/n1+s22/n2)2(s12/n1)2n11+(s22/n2)2n21=(7,5+2,143)2(7,5)215+(2,143)220\nu^* = \frac{(s_1^2/n_1 + s_2^2/n_2)^2}{\dfrac{(s_1^2/n_1)^2}{n_1-1} + \dfrac{(s_2^2/n_2)^2}{n_2-1}} = \frac{(7{,}5 + 2{,}143)^2}{\dfrac{(7{,}5)^2}{15} + \dfrac{(2{,}143)^2}{20}}

=(9,643)256,2515+4,59220=92,993,75+0,230=92,993,980=23,37ν=23= \frac{(9{,}643)^2}{\dfrac{56{,}25}{15} + \dfrac{4{,}592}{20}} = \frac{92{,}99}{3{,}75 + 0{,}230} = \frac{92{,}99}{3{,}980} = 23{,}37 \to \nu^* = 23

Distribusi: Tt(23)T \sim t(23) di bawah H0:μ1=μ2H_0: \mu_1 = \mu_2.

Nilai kritis dua sisi α=0,05\alpha = 0{,}05: t0,025(23)=2,069t_{0{,}025}(23) = 2{,}069.

Tobs=4,187>2,069T_{\text{obs}} = 4{,}187 > 2{,}069Tolak H0H_0. Cukup bukti μ1μ2\mu_1 \neq \mu_2.

(d) t-test Pooled (σ12=σ22\sigma_1^2 = \sigma_2^2 — skenario alternatif):

sp2=(n11)s12+(n21)s22n1+n22=15×120+20×4535=1800+90035=270035=77,14s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} = \frac{15 \times 120 + 20 \times 45}{35} = \frac{1800 + 900}{35} = \frac{2700}{35} = 77{,}14

Tobs=xˉ1xˉ2sp1/n1+1/n2=1377,141/16+1/21=138,7830,1101=138,783×0,3318=132,915=4,461T_{\text{obs}} = \frac{\bar{x}_1-\bar{x}_2}{s_p\sqrt{1/n_1+1/n_2}} = \frac{13}{\sqrt{77{,}14}\sqrt{1/16+1/21}} = \frac{13}{8{,}783\sqrt{0{,}1101}} = \frac{13}{8{,}783 \times 0{,}3318} = \frac{13}{2{,}915} = 4{,}461

Distribusi di bawah H0H_0: Tt(n1+n22)=t(35)T \sim t(n_1+n_2-2) = t(35).

(e) χ2\chi^2-test untuk σ12\sigma_1^2:

H0:σ12=100H_0: \sigma_1^2 = 100 vs H1:σ12>100H_1: \sigma_1^2 > 100, α=0,05\alpha = 0{,}05, n=20n=20, s2=147s^2=147.

Langkah 1: H0:σ2=100H_0: \sigma^2 = 100, H1:σ2>100H_1: \sigma^2 > 100 (satu sisi kanan).

Langkah 2: χ2=(n1)s2/σ02χ2(n1)=χ2(19)\chi^2 = (n-1)s^2/\sigma_0^2 \sim \chi^2(n-1) = \chi^2(19) di bawah H0H_0.

Langkah 3: Nilai kritis (satu sisi kanan): χ0,052(19)=30,144\chi^2_{0{,}05}(19) = 30{,}144. Wilayah penolakan: χ2>30,144\chi^2 > 30{,}144.

Langkah 4: χobs2=(201)×147100=19×147100=2793100=27,93\chi^2_{\text{obs}} = \dfrac{(20-1) \times 147}{100} = \dfrac{19 \times 147}{100} = \dfrac{2793}{100} = 27{,}93.

Langkah 5: χobs2=27,93<30,144\chi^2_{\text{obs}} = 27{,}93 < 30{,}144Gagal menolak H0H_0.

Interpretasi: Tidak cukup bukti bahwa variansi kerugian Lini A melebihi 100 pada level signifikansi 5%.

5. Verification

  • Fobs=120/45=8/3F_{\text{obs}} = 120/45 = 8/3 — pastikan pembilang adalah variansi lebih besar ✓
  • df Welch ν=23\nu^* = 23 (dibulatkan dari 23,37 ke bawah) — bukan 24 ✓
  • χobs2=19×147/100=27,93\chi^2_{\text{obs}} = 19 \times 147/100 = 27{,}93: antara χ0,102(19)=27,20\chi^2_{0{,}10}(19)=27{,}20 dan χ0,052(19)=30,14\chi^2_{0{,}05}(19)=30{,}14pp-value 0,065\approx 0{,}065 → tidak tolak pada α=0,05\alpha=0{,}05
Exam Tips — Soal B

Target waktu: 16–19 menit Common trap 1 (F-test): Untuk uji dua sisi, nilai kritis adalah Fα/2(ν1,ν2)F_{\alpha/2}(\nu_1,\nu_2) (bukan FαF_\alpha). Dengan α=0,10\alpha=0{,}10, gunakan F0,05(15,20)F_{0{,}05}(15,20). Konvensi meletakkan variansi lebih besar di numerator memungkinkan kita hanya memeriksa ekor kanan. Common trap 2 (Welch df): Selalu bulatkan ν\nu^* ke bawah, tidak ke atas dan tidak ke nearest integer. 23,372323{,}37 \to 23, bukan 24. Common trap 3 (χ2\chi^2-test): Statistik uji menggunakan σ02\sigma_0^2 (dari H0H_0), bukan s2s^2 yang tidak diketahui. Formula: (n1)s2/σ02(n-1)s^2/\sigma_0^2 — bagi dengan nilai hipotesis, bukan variansi sampel.


Soal C — Challenging

Suatu studi membandingkan besarnya klaim sebelum dan sesudah implementasi program manajemen risiko baru. Sampel n=12n = 12 polis yang sama diukur sebelum (X1iX_{1i}) dan sesudah (X2iX_{2i}) program, dengan data perbedaan Di=X1iX2iD_i = X_{1i} - X_{2i} (positif = klaim berkurang):

d1,,d12:3,1,5,2,8,2,4,6,1,3,2,5d_1,\ldots,d_{12}: \quad 3, -1, 5, 2, 8, -2, 4, 6, 1, 3, 2, 5

(a) Jelaskan mengapa harus menggunakan t-test berpasangan bukan t-test dua sampel independen. (b) Hitung dˉ\bar{d} dan sDs_D, lalu lakukan uji H0:μD=0H_0: \mu_D = 0 vs H1:μD>0H_1: \mu_D > 0 pada α=0,05\alpha = 0{,}05. (c) Hitung pp-value dan buat kesimpulan dalam konteks aktuaria. (d) Bangun IC 95%95\% satu sisi (batas bawah) untuk μD\mu_D. (e) Hitung daya uji (power) jika nilai sebenarnya μD=2\mu_D = 2 dengan σDsD\sigma_D \approx s_D yang dihitung di bagian (b). Gunakan aproksimasi Normal.

Solusi Soal C

1. Identifikasi Variabel

  • n=12n = 12 pasangan; Di=X1iX2iD_i = X_{1i} - X_{2i}
  • Data: 3,1,5,2,8,2,4,6,1,3,2,53, -1, 5, 2, 8, -2, 4, 6, 1, 3, 2, 5
  • df =n1=11= n - 1 = 11

2. Identifikasi Distribusi / Model t-test berpasangan: perlakukan DiD_i sebagai satu sampel i.i.d. N(μD,σD2)\sim N(\mu_D, \sigma_D^2).

3. Setup Persamaan

T=(Dˉ0)/(SD/n)t(11)T = (\bar{D} - 0)/(S_D/\sqrt{n}) \sim t(11) di bawah H0:μD=0H_0: \mu_D = 0.

4. Eksekusi Aljabar

(a) Justifikasi t-test berpasangan:

Data tidak independen: pengukuran sebelum dan sesudah diambil dari polis yang sama. Setiap pasangan (X1i,X2i)(X_{1i}, X_{2i}) berkorelasi — karakteristik risiko polis memengaruhi keduanya. T-test dua sampel independen mengasumsikan X1iX2iX_{1i} \perp X_{2i}, yang dilanggar di sini. T-test berpasangan menghilangkan variasi antar-polis dengan menganalisis perbedaan DiD_i, menghasilkan uji yang lebih kuat (powerful).

(b) Hitung dˉ\bar{d}, sDs_D, dan statistik uji:

dˉ=3+(1)+5+2+8+(2)+4+6+1+3+2+512=3612=3,00\bar{d} = \frac{3+(-1)+5+2+8+(-2)+4+6+1+3+2+5}{12} = \frac{36}{12} = 3{,}00

Hitung di2\sum d_i^2: 32+12+52+22+82+22+42+62+12+32+22+52=9+1+25+4+64+4+16+36+1+9+4+25=1983^2+1^2+5^2+2^2+8^2+2^2+4^2+6^2+1^2+3^2+2^2+5^2 = 9+1+25+4+64+4+16+36+1+9+4+25 = 198

sD2=di2ndˉ2n1=19812×911=19810811=9011=8,182s_D^2 = \frac{\sum d_i^2 - n\bar{d}^2}{n-1} = \frac{198 - 12 \times 9}{11} = \frac{198 - 108}{11} = \frac{90}{11} = 8{,}182

sD=8,182=2,860s_D = \sqrt{8{,}182} = 2{,}860

Statistik uji: tobs=dˉsD/n=3,002,860/12=3,002,860/3,464=3,000,826=3,632t_{\text{obs}} = \frac{\bar{d}}{s_D/\sqrt{n}} = \frac{3{,}00}{2{,}860/\sqrt{12}} = \frac{3{,}00}{2{,}860/3{,}464} = \frac{3{,}00}{0{,}826} = 3{,}632

Nilai kritis satu sisi kanan, α=0,05\alpha = 0{,}05, df =11= 11: t0,05(11)=1,796t_{0{,}05}(11) = 1{,}796

tobs=3,632>1,796t_{\text{obs}} = 3{,}632 > 1{,}796Tolak H0H_0.

(c) pp-value dan kesimpulan:

Satu sisi kanan: p-value=P(t(11)3,632)p\text{-value} = P(t(11) \geq 3{,}632).

Dari tabel: t0,005(11)=3,106t_{0{,}005}(11) = 3{,}106 dan t0,0025(11)3,497t_{0{,}0025}(11) \approx 3{,}497. Karena tobs=3,632>3,497t_{\text{obs}} = 3{,}632 > 3{,}497: p-value<0,005p\text{-value} < 0{,}005

Lebih tepatnya: pp-value 0,002\approx 0{,}002.

Kesimpulan aktuaria: Pada level signifikansi 5% (bahkan 0,5%), terdapat bukti statistik yang sangat kuat bahwa program manajemen risiko baru berhasil mengurangi besarnya klaim secara rata-rata. Rata-rata pengurangan klaim yang diestimasi adalah Rp 3 juta per polis (dˉ=3\bar{d} = 3).

(d) IC 95% satu sisi (batas bawah) untuk μD\mu_D:

IC satu sisi kanan (memberikan batas bawah): μD>dˉt0,05(11)sDn=3,001,796×0,826=3,001,484=1,516\mu_D > \bar{d} - t_{0{,}05}(11) \cdot \frac{s_D}{\sqrt{n}} = 3{,}00 - 1{,}796 \times 0{,}826 = 3{,}00 - 1{,}484 = 1{,}516

IC: μD>1,516\mu_D > 1{,}516 juta rupiah dengan kepercayaan 95%.

Interpretasi: Rata-rata pengurangan klaim akibat program manajemen risiko adalah setidaknya Rp 1,516 juta per polis dengan kepercayaan 95%.

(e) Daya uji pada μD=2\mu_D = 2:

Gunakan aproksimasi Normal untuk daya uji satu sisi kanan.

Dengan σDsD=2,860\sigma_D \approx s_D = 2{,}860 dan n=12n = 12, standar error 2,860/12=0,826\approx 2{,}860/\sqrt{12} = 0{,}826.

Nilai kritis dalam skala Dˉ\bar{D}: c=μ0+t0,05(11)SE=0+1,796×0,826=1,483c = \mu_0 + t_{0{,}05}(11) \cdot \text{SE} = 0 + 1{,}796 \times 0{,}826 = 1{,}483.

Daya pada μD=2\mu_D = 2: Power(2)=P(Dˉ>1,483μD=2)=P ⁣(Z>1,48320,826)=P(Z>0,626)\text{Power}(2) = P(\bar{D} > 1{,}483 \mid \mu_D = 2) = P\!\left(Z > \frac{1{,}483 - 2}{0{,}826}\right) = P(Z > -0{,}626) =1Φ(0,626)=Φ(0,626)0,734= 1 - \Phi(-0{,}626) = \Phi(0{,}626) \approx 0{,}734

Interpretasi: Jika pengurangan rata-rata sesungguhnya adalah Rp 2 juta, uji ini memiliki daya 73,4% untuk mendeteksinya — artinya 26,6% kemungkinan gagal mendeteksi efek nyata (Tipe II error) dengan n=12n=12.

5. Verification

  • dˉ=36/12=3,00\bar{d} = 36/12 = 3{,}00; cek: di=31+5+2+82+4+6+1+3+2+5=36\sum d_i = 3-1+5+2+8-2+4+6+1+3+2+5 = 36
  • sD2=90/11=8,182s_D^2 = 90/11 = 8{,}182: selalu non-negatif; sD=2,86s_D = 2{,}86 lebih kecil dari range data (8(2)=108-(-2)=10) ✓
  • Daya 73,4% untuk efek μD=2\mu_D = 2 dengan n=12n=12: wajar — efek relatif kecil (2/2,860,72/2{,}86 \approx 0{,}7 SD) dan nn tidak besar ✓
  • IC batas bawah >1,516> 1{,}516: secara praktis bermakna (pengurangan setidaknya Rp 1,5 juta) ✓
Exam Tips — Soal C

Target waktu: 18–22 menit Common trap 1: Menggunakan t-test dua sampel independen untuk data berpasangan adalah kesalahan konseptual serius. Kunci identifikasi: “polis yang sama diukur dua kali”, “sebelum-sesudah”, “pasangan yang cocok” (matched pairs) → selalu t-test berpasangan. Common trap 2: Formula sD2=(di2ndˉ2)/(n1)s_D^2 = (\sum d_i^2 - n\bar{d}^2)/(n-1) lebih cepat dari menghitung (didˉ)2(d_i - \bar{d})^2 satu per satu untuk nn besar. Hafalkan bentuk komputasi ini. Common trap 3: IC satu sisi memberikan batas bawah (untuk H1:μD>0H_1: \mu_D > 0), bukan interval dua sisi. Gunakan tαt_\alpha (bukan tα/2t_{\alpha/2}) untuk IC satu sisi. Common trap 4: Untuk daya uji, aproksimasi Normal menggunakan σDsD\sigma_D \approx s_D — ini menghasilkan aproksimasi, bukan nilai eksak. Nilai eksak memerlukan distribusi non-central tt yang di luar cakupan CF2.

Section 5 — Verifikasi & Sanity Check

Validasi Pemilihan Uji

Sebelum menghitung statistik uji apapun, jawab empat pertanyaan ini berurutan:

  1. Parameter apa yang diuji? μ\mu, σ2\sigma^2, atau μ1μ2\mu_1-\mu_2, atau σ12/σ22\sigma_1^2/\sigma_2^2? ✓
  2. Berapa sampel? Satu, dua independen, atau dua berpasangan? ✓
  3. Apakah σ2\sigma^2 diketahui? Ya → ZZ; Tidak → tt (untuk μ\mu) ✓
  4. Apakah populasi Normal atau nn cukup besar? Ini menentukan apakah distribusi berlaku eksak atau hanya aproksimasi ✓
Validasi Arah Wilayah Penolakan
  • Dua sisi (H1:θθ0H_1: \theta \neq \theta_0): tolak jika T>cα/2|T| > c_{\alpha/2}; gunakan zα/2z_{\alpha/2} atau tα/2(ν)t_{\alpha/2}(\nu)
  • Satu sisi kanan (H1:θ>θ0H_1: \theta > \theta_0): tolak jika T>cαT > c_\alpha; gunakan zαz_\alpha atau tα(ν)t_\alpha(\nu)
  • Satu sisi kiri (H1:θ<θ0H_1: \theta < \theta_0): tolak jika T<cαT < -c_\alpha; gunakan zα-z_\alpha atau tα(ν)-t_\alpha(\nu)
  • pp-value untuk dua sisi = dua kali ekor satu sisi ✓
Validasi Derajat Kebebasan
Ujidf
t satu sampeln1n-1
t dua sampel pooledn1+n22n_1+n_2-2
t Welchν\nu^* (hitung dan bulatkan ke bawah)
t berpasangann1n-1 (bukan 2n22n-2!)
χ2\chi^2 variansin1n-1
FF dua sampel(n11,n21)(n_1-1, n_2-1)
Validasi Keputusan via Dua Metode

Selalu verifikasi menggunakan minimal dua cara berbeda:

  1. Metode wilayah penolakan: Tobs|T_{\text{obs}}| vs nilai kritis cc
  2. Metode pp-value: pp vs α\alpha
  3. Metode IC (untuk uji dua sisi): apakah θ0\theta_0 \in IC 1α_{1-\alpha}? ✓

Ketiga metode harus menghasilkan keputusan yang sama — jika tidak, ada kesalahan perhitungan.

Metode Alternatif

Menggunakan IC untuk keputusan uji hipotesis: Bangun IC 1α1-\alpha untuk parameter. Tolak H0:θ=θ0H_0: \theta = \theta_0 jika θ0\theta_0 berada di luar IC. Lebih informatif dari keputusan biner karena menunjukkan range nilai yang kompatibel dengan data.

Menentukan pp-value dari tabel: Untuk tobst_{\text{obs}} dan df diketahui, lokasikan tobst_{\text{obs}} di antara dua nilai kritis tabel untuk mendapat batas atas dan bawah pp-value. Contoh: jika tobs=2,50t_{\text{obs}} = 2{,}50 dan df =15= 15, dan t0,025(15)=2,131t_{0{,}025}(15) = 2{,}131 serta t0,01(15)=2,602t_{0{,}01}(15) = 2{,}602, maka 0,01<p/2<0,0250{,}01 < p/2 < 0{,}0250,02<p<0,050{,}02 < p < 0{,}05.

Section 6 — Visualisasi Mental

Distribusi Sampling di bawah H0H_0 — Kurva Standar:

Bayangkan distribusi TT di bawah H0H_0 sebagai kurva simetris berpusat di nol (untuk ZZ dan tt) atau kurva right-skewed berpusat di df (untuk χ2\chi^2). Wilayah penolakan adalah ekor-ekor yang diarsir — area total = α\alpha. Nilai terobservasi tobst_{\text{obs}} adalah satu titik pada kurva ini. Jika titik ini jatuh di wilayah yang diarsir, kita tolak H0H_0. pp-value adalah luas area dari tobst_{\text{obs}} ke ekor — semakin kecil area ini, semakin tidak kompatibel data dengan H0H_0.

Trade-off α\alpha dan β\beta — Dua Kurva:

Bayangkan dua kurva distribusi: satu di bawah H0H_0 (berpusat di μ0\mu_0) dan satu di bawah H1H_1 (berpusat di μ1>μ0\mu_1 > \mu_0). Nilai kritis cc memisahkan dua wilayah. Area di bawah H0H_0 di kanan cc adalah α\alpha (Tipe I). Area di bawah H1H_1 di kiri cc adalah β\beta (Tipe II). Menggeser cc ke kanan (perketat α\alpha) otomatis memperbesar area β\beta — trade-off ini hanya bisa dipecahkan dengan memperbesar nn (memisahkan kedua kurva lebih jauh).

Daya Uji sebagai Fungsi dari μ1\mu_1:

Kurva daya (power curve) dimulai dari α\alpha saat μ1=μ0\mu_1 = \mu_0 (daya minimal), meningkat monoton saat μ1μ0|\mu_1 - \mu_0| bertambah, dan mendekati 1 saat efek sangat besar. Memperbesar nn mengangkat seluruh kurva ke atas — daya lebih tinggi untuk semua nilai μ1\mu_1.

Hubungan Visual ↔ Rumus

Wilayah penolakan dua sisi berkorespondensi dengan:

Tobs>tα/2(ν)nilai terobservasi jatuh di ekor yang diarsir|T_{\text{obs}}| > t_{\alpha/2}(\nu) \longleftrightarrow \text{nilai terobservasi jatuh di ekor yang diarsir}

Dualitas IC–uji hipotesis berkorespondensi dengan:

θ0(xˉ±tα/2(n1)s/n)xˉθ0>tα/2(n1)s/nT>tα/2(n1)\theta_0 \notin (\bar{x} \pm t_{\alpha/2}(n-1) \cdot s/\sqrt{n}) \longleftrightarrow |\bar{x} - \theta_0| > t_{\alpha/2}(n-1) \cdot s/\sqrt{n} \longleftrightarrow |T| > t_{\alpha/2}(n-1)

Trade-off α\alpha-β\beta berkorespondensi dengan:

Perkecil α    geser c ke kanan    perbesar β    kurangi power\text{Perkecil } \alpha \implies \text{geser } c \text{ ke kanan} \implies \text{perbesar } \beta \implies \text{kurangi power}

Section 7 — Jebakan Umum

Kesalahan Konseptual
  1. “Gagal tolak H0H_0” ≠ ”H0H_0 terbukti benar”. Ini adalah kesalahan interpretasi paling fundamental. Kegagalan menolak hanya berarti bukti tidak cukup kuat — bukan konfirmasi H0H_0. Contoh: uji yang memiliki daya rendah (nn kecil) akan sering gagal menolak bahkan ketika H0H_0 salah.
  2. pp-value = probabilitas H0H_0 benar”. pp-value adalah kondisional: P(dataH0)P(\text{data} \mid H_0), bukan P(H0data)P(H_0 \mid \text{data}). Yang kedua memerlukan prior Bayesian — di luar cakupan CF2 tetapi sering disalahpahami.
  3. Mengubah H1H_1 setelah melihat data (HARKing). H0H_0 dan H1H_1 harus dirumuskan sebelum melihat data. Merumuskan hipotesis setelah melihat hasil (Hypothesizing After Results are Known) menghasilkan inflasi Tipe I error yang serius.
  4. Menggunakan Z-test saat σ2\sigma^2 tidak diketahui. Mensubstitusikan ss ke formula Z-test tidak menghasilkan distribusi Normal standar — hasilnya adalah distribusi tt. Untuk nn besar (100\geq 100), tt dan ZZ hampir identik, tetapi untuk nn kecil perbedaannya signifikan.
Kesalahan Parametrisasi

Tabel Kesalahan Derajat Kebebasan:

Ujidf BENARKesalahan Umum
t berpasangan, nn pasangann1n-12n22n-2 (salah anggap dua sampel bebas)
t pooled, n1n_1 dan n2n_2n1+n22n_1+n_2-2n1+n21n_1+n_2-1 atau n1+n2n_1+n_2
χ2\chi^2 variansin1n-1nn
F-test(n11,n21)(n_1-1, n_2-1)(n1,n2)(n_1, n_2)
Welchν\nu^* dibulatkan ke bawahDibulatkan ke atas atau ke nearest

Nilai kritis F-test dua sisi:

  • α=0,10\alpha = 0{,}10 → gunakan F0,05(ν1,ν2)F_{0{,}05}(\nu_1,\nu_2) (bukan F0,10F_{0{,}10}) karena dua sisi α/2=0,05\alpha/2 = 0{,}05
  • Menempatkan variansi lebih besar di numerator → hanya perlu memeriksa ekor kanan
Kesalahan Interpretasi Soal
  • “Apakah ada perbedaan”: uji dua sisi (H1:μμ0H_1: \mu \neq \mu_0).
  • “Apakah lebih besar/lebih kecil dari”: uji satu sisi (H1:μ>μ0H_1: \mu > \mu_0 atau H1:μ<μ0H_1: \mu < \mu_0). Identifikasi arah dari konteks soal.
  • “Data berpasangan”: t-test berpasangan. Kunci identifikasi: “sebelum-sesudah”, “polis yang sama”, “pasangan yang cocok”, “pengukuran ganda pada unit yang sama”.
  • “Apakah variansi sama”: lakukan F-test terlebih dahulu sebelum t-test dua sampel. Hasil F-test menentukan apakah menggunakan t-pooled atau t-Welch.
  • “Level 5%” untuk uji dua sisi: gunakan z0,025=1,96z_{0{,}025} = 1{,}96 atau t0,025(ν)t_{0{,}025}(\nu) — bukan z0,05=1,645z_{0{,}05} = 1{,}645.
Red Flags
  • σ2\sigma^2 tidak diketahui”: wajib t-test, bukan Z-test.
  • “Sebelum-sesudah” atau “polis yang sama diukur dua kali”: wajib t-test berpasangan; df =npasangan1= n_{\text{pasangan}}-1.
  • Soal meminta uji dua variansi: F-test dengan df (n11,n21)(n_1-1, n_2-1); untuk dua sisi gunakan α/2\alpha/2 di tabel.
  • Soal meminta uji variansi satu sampel: χ2\chi^2-test dengan (n1)s2/σ02(n-1)s^2/\sigma_0^2.
  • pp-value <α< \alpha tetapi “sangat sedikit”: pertimbangkan kekuatan uji — keputusan statistis tidak selalu bermakna praktis. Ukuran efek penting di samping signifikansi.
  • Soal menyebutkan “dua populasi Normal independen”: periksa asumsi σ12=σ22\sigma_1^2 = \sigma_2^2 terlebih dahulu via F-test sebelum memilih antara t-pooled dan t-Welch.
  • Soal tentang nn yang diperlukan untuk daya tertentu: gunakan formula n(zα+zβ)2σ2/(μ1μ0)2n \geq (z_\alpha + z_\beta)^2\sigma^2/(\mu_1-\mu_0)^2 (satu sisi) atau ganti zαz_\alpha dengan zα/2z_{\alpha/2} (dua sisi).

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Lima langkah baku — selalu ikuti urutan ini: Rumuskan H0H_0/H1H_1 → Pilih statistik uji dan distribusinya → Tentukan nilai kritis → Hitung statistik uji dari data → Keputusan dan interpretasi konteks.

  2. Empat uji utama dan statistiknya: Z=Xˉμ0σ/nN(0,1);T=Xˉμ0S/nt(n1);χ2=(n1)S2σ02χ2(n1);F=S12S22F(n11,n21)Z = \frac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \sim N(0,1); \quad T = \frac{\bar{X}-\mu_0}{S/\sqrt{n}} \sim t(n-1); \quad \chi^2 = \frac{(n-1)S^2}{\sigma_0^2} \sim \chi^2(n-1); \quad F = \frac{S_1^2}{S_2^2} \sim F(n_1-1,n_2-1)

  3. Tiga jenis keputusan — selalu konsisten: Tolak H0    p-valueα    Tobs>cα/2    θ0IC1α\text{Tolak } H_0 \iff p\text{-value} \leq \alpha \iff |T_{\text{obs}}| > c_{\alpha/2} \iff \theta_0 \notin \text{IC}_{1-\alpha}

  4. Error dan daya — trade-off fundamental: α=P(Tipe I),β=P(Tipe II),Power=1β;n    α dan β bersamaan\alpha = P(\text{Tipe I}),\quad \beta = P(\text{Tipe II}),\quad \text{Power} = 1-\beta; \quad n\uparrow \implies \alpha\downarrow \text{ dan } \beta\downarrow \text{ bersamaan}

  5. Variansi pooled dan derajat kebebasan kritis: Sp2=(n11)S12+(n21)S22n1+n22;νWelch=bulatkan ke bawah;νpasangan=n1 (bukan 2n2)S_p^2 = \frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2};\quad \nu_{\text{Welch}}^* = \text{bulatkan ke bawah};\quad \nu_{\text{pasangan}} = n-1\text{ (bukan }2n-2\text{)}

Kapan Digunakan

  • Z-test: σ2\sigma^2 diketahui (sangat jarang dalam praktik) atau nn sangat besar (100\geq 100) sehingga sσs \approx \sigma.
  • t-test satu sampel: σ2\sigma^2 tidak diketahui; inferensi tentang μ\mu satu populasi Normal.
  • t-test dua sampel (pooled): Dua sampel independen dari populasi Normal dengan variansi sama yang terlebih dahulu diverifikasi via F-test.
  • t-test Welch: Dua sampel independen dari populasi Normal dengan variansi berbeda (setelah F-test signifikan).
  • t-test berpasangan: Data berpasangan (sebelum-sesudah, atau pasangan yang cocok) — bukan dua sampel independen.
  • χ2\chi^2-test: Inferensi tentang σ2\sigma^2 satu populasi Normal.
  • F-test: Perbandingan σ12\sigma_1^2 dan σ22\sigma_2^2 dari dua populasi Normal independen; atau sebagai prasyarat sebelum memilih t-pooled vs t-Welch.

Kapan TIDAK Boleh Digunakan

  • Jangan Z-test jika σ2\sigma^2 tidak diketahui — gunakan t-test.
  • Jangan t-pooled tanpa memeriksa asumsi σ12=σ22\sigma_1^2 = \sigma_2^2 — lakukan F-test terlebih dahulu; jika F-test signifikan, gunakan Welch.
  • Jangan t-test dua sampel independen untuk data berpasangan — gunakan t-test berpasangan.
  • Jangan χ2\chi^2 atau F-test untuk populasi non-Normal — kedua uji sangat sensitif terhadap asumsi normalitas; bahkan deviasi ringan dapat membuat hasil tidak valid.
  • Jangan menyimpulkan “H_0 terbukti” dari kegagalan tolak — kegagalan tolak bukan konfirmasi H0H_0.

Quick Decision Tree

graph TD
    A["Uji Hipotesis — Identifikasi Uji yang Tepat"] --> B["Parameter apa yang diuji?"]
    B --> C["Mean mu"]
    B --> D["Variansi sigma^2"]
    B --> E["Perbandingan dua mean mu1-mu2"]
    B --> F["Perbandingan dua variansi sigma1^2/sigma2^2"]
    C --> G["Apakah sigma^2 diketahui?"]
    G -->|"Ya"| H["Z-test: Z = (X-bar - mu0) / (sigma/sqrt(n))\ndistribusi N(0,1)"]
    G -->|"Tidak"| I["t-test: T = (X-bar - mu0) / (S/sqrt(n))\ndistribusi t(n-1)"]
    D --> J["Chi-kuadrat test:\nchi^2 = (n-1)S^2/sigma0^2\ndistribusi chi^2(n-1)"]
    E --> K["Apakah data berpasangan?"]
    K -->|"Ya: sebelum-sesudah\natau matched pairs"| L["t-test berpasangan:\nT = D-bar / (SD/sqrt(n))\ndistribusi t(n-1)"]
    K -->|"Tidak: dua sampel independen"| M["Lakukan F-test terlebih dahulu:\napakah sigma1^2 = sigma2^2?"]
    M -->|"Gagal tolak H0 F-test:\nsigma1^2 = sigma2^2"| N["t-test pooled:\ndf = n1+n2-2"]
    M -->|"Tolak H0 F-test:\nsigma1^2 != sigma2^2"| O["t-test Welch:\ndf = nu* (bulatkan ke bawah)"]
    F --> P["F-test:\nF = S1^2/S2^2\ndistribusi F(n1-1, n2-1)\nUji dua sisi: gunakan F_{alpha/2}"]
    H --> Q["Arah H1?"]
    I --> Q
    J --> Q
    L --> Q
    N --> Q
    O --> Q
    P --> Q
    Q -->|"mu != mu0"| R["Dua sisi:\ntolak jika |T| > c_{alpha/2}\np-value = 2P(T >= |t_obs|)"]
    Q -->|"mu > mu0"| S["Satu sisi kanan:\ntolak jika T > c_alpha\np-value = P(T >= t_obs)"]
    Q -->|"mu < mu0"| T["Satu sisi kiri:\ntolak jika T < -c_alpha\np-value = P(T <= t_obs)"]

Follow-up Options
  1. “Berikan soal variasi: uji hipotesis lengkap dari data mentah — hitung statistik uji, p-value, dan bangun IC untuk kasus t-test dua sampel independen dengan asumsi variansi sama”
  2. “Jelaskan hubungan 4.8 Uji Hipotesis dengan 4.7 Interval Kepercayaan — turunkan IC dari prosedur inversi uji hipotesis dan tunjukkan dualitas secara matematis”
  3. “Buat flashcard 1-halaman untuk topik ini — semua formula, nilai kritis standar, dan decision tree dalam satu halaman”

📖 Ref: Hogg-Tanis-Zimm (2015) Bab 6.1–6.5; Hogg-McKean-Craig (2019) Bab 4.4–4.6; Miller et al. (2014) Bab 9.1–9.5; Walpole et al. (2012) Bab 10.1–10.5 | 🗓️ 2026-02-21 | #CF2 #InferensStatistik #UjiHipotesis #ZTest #TTest #ChiKuadrat #FTest #PValue #ErrorTipeI #ErrorTipeII #Power