2026-02-21HardBobot: 20–30%Hogg-Tanis-Zimmerman (2015) Bab 5.3–5.5; Hogg-McKean-Craig (2019) Bab 3.3–3.6; Miller et al. (2014) Bab 8.3–8.5; Walpole et al. (2012) Bab 8.2–8.5
Menurunkan dan menggunakan distribusi Chi-Kuadrat χ2(ν), distribusi-t Student t(ν), dan distribusi-FF(ν1,ν2); menghubungkan distribusi-distribusi ini dengan sampel dari populasi Normal; menghitung probabilitas menggunakan sifat dan tabel distribusi sampel; membuktikan distribusi (n−1)S2/σ2∼χ2(n−1); mengidentifikasi kebebasan Xˉ dari S2 untuk populasi Normal; menggunakan relasi antar-distribusi (t2∼F, χ2 sebagai Gamma khusus)
Hogg-Tanis-Zimm (2015) Bab 5.3–5.5; Hogg-McKean-Craig (2019) Bab 3.3–3.6; Miller et al. (2014) Bab 8.3–8.5; Walpole et al. (2012) Bab 8.2–8.5
Section 1 — Intuisi
Saat bekerja dengan sampel dari populasi Normal, tiga distribusi baru muncul secara alami dari statistik sampel yang paling fundamental — mean sampel Xˉ, variansi sampel S2, dan rasio keduanya. Distribusi-distribusi ini bukan sekadar kurva matematis abstrak: masing-masing adalah jawaban atas satu pertanyaan aktuaria yang konkret.
Distribusi Chi-Kuadratχ2(ν) menjawab: “Bagaimana distribusi jumlah kuadrat dari ν variabel Normal standar independen?” Ia muncul secara alami dari (n−1)S2/σ2 — rasio yang mengukur seberapa jauh variansi sampel dari variansi populasi. Jika σ2 diketahui, χ2 digunakan langsung; jika tidak, ia adalah fondasi untuk interval kepercayaan variansi dan uji kecocokan distribusi.
Distribusi-t Studentt(ν) menjawab: “Bagaimana mendistribusikan Xˉ jika σ2 tidak diketahui dan harus diestimasi dari data?” Dalam praktik, σ2 populasi hampir tidak pernah diketahui — kita hanya punya S2. Maka daripada Z=(Xˉ−μ)/(σ/n) (yang memerlukan σ diketahui), kita gunakan T=(Xˉ−μ)/(S/n). Distribusi ini memiliki ekor lebih tebal dari Normal standar, mencerminkan ketidakpastian tambahan karena estimasi σ2.
Distribusi-FF(ν1,ν2) menjawab: “Bagaimana membandingkan variansi dari dua populasi Normal yang berbeda?” Ia adalah rasio dua Chi-Kuadrat independen yang dibagi derajat kebebasannya masing-masing — alat statistik untuk uji homogenitas variansi antara dua kelompok, misalnya membandingkan risiko dua portofolio asuransi.
Ketiga distribusi ini saling terhubung erat: t2(ν)=F(1,ν); χ2(ν)=Γ(ν/2,2); F(ν1,ν2) diturunkan dari dua χ2 independen. Memahami jaring hubungan ini memungkinkan penyelesaian soal dari berbagai arah — dan kerap menjadi shortcut paling efisien di ujian.
Section 2 — Definisi Formal
ℹDefinisi Matematis›
Misalkan Z,Z1,Z2,… adalah variabel acak N(0,1) independen, dan X1,…,Xn∼i.i.d.N(μ,σ2).
Label: Definisi via Normal Standar — penjumlahan ν kuadrat Normal standar independen.
f(x;ν)=2ν/2Γ(ν/2)1xν/2−1e−x/2,x>0
Label: PDF Chi-Kuadrat — ini adalah Gamma(α=ν/2,β=2) dalam parametrisasi skala; berlaku χ2(ν)=Γ(ν/2,2).
E[χ2(ν)]=ν,Var(χ2(ν))=2ν
Label: Mean dan Variansi Chi-Kuadrat — mean = derajat kebebasan; variansi = dua kali derajat kebebasan.
Mχ2(ν)(t)=(1−2t)−ν/2,t<21
Label: MGF Chi-Kuadrat — bentuk Gamma(nu/2,β=2); sifat aditif: χ2(ν1)+χ2(ν2)∼χ2(ν1+ν2) untuk variabel independen.
σ2(n−1)S2∼χ2(n−1)
Label: Distribusi Variansi Sampel — hasil kunci dari Fisher’s Theorem; derajat kebebasan n−1, bukan n, karena satu derajat kebebasan “digunakan” untuk mengestimasi μ dengan Xˉ.
Rumus Utama — Distribusi-t Student t(ν)
T=V/νZ,Z∼N(0,1),V∼χ2(ν),Z⊥V
Label: Definisi Distribusi-t — rasio Normal standar dengan akar Chi-Kuadrat yang dinormalisasi.
f(t;ν)=νπΓ(2ν)Γ(2ν+1)(1+νt2)−(ν+1)/2,t∈R
Label: PDF Distribusi-t — simetris di nol; ekor lebih tebal dari Normal standar; mendekati N(0,1) saat ν→∞.
E[T]=0(ν>1),Var(T)=ν−2ν(ν>2)
Label: Mean dan Variansi Distribusi-t — mean nol (simetris); variansi >1 (ekor lebih tebal dari Normal); untuk ν≤2 variansi tidak terdefinisi.
T=S/nXˉ−μ∼t(n−1)
Label: Statistik-t Sampel — digunakan saat σ2 tidak diketahui; penyebut menggunakan S (standar deviasi sampel), bukan σ (standar deviasi populasi).
Rumus Utama — Distribusi-FF(ν1,ν2)
F=V/ν2U/ν1,U∼χ2(ν1),V∼χ2(ν2),U⊥V
Label: Definisi Distribusi-F — rasio dua Chi-Kuadrat independen yang masing-masing dibagi derajat kebebasannya.
Chi-Kuadrat: Setiap Zi harus N(0,1) dan independen. Sifat aditif mensyaratkan independensi.
Distribusi-t:Z dan V harus independen. Ini terpenuhi secara otomatis untuk statistik T=(Xˉ−μ)/(S/n) dari sampel Normal karena Fisher’s Theorem menjamin Xˉ⊥S2.
Distribusi-F:U dan V harus independen. Untuk uji dua sampel, dua sampel harus independen satu sama lain.
Populasi Normal: Distribusi χ2, t, dan F berlaku eksak hanya untuk sampel dari populasi Normal. Untuk populasi non-Normal, distribusi ini hanya pendekatan (valid untuk n besar via CLT untuk distribusi t).
Fisher’s Theorem: Kebebasan Xˉ dan S2 adalah properti eksklusif distribusi Normal — untuk distribusi lain, Xˉ dan S2 umumnya berkorelasi.
Section 3 — Jembatan Logika
◈Dari Definisi ke Rumus›
Mengapa (n−1)S2/σ2∼χ2(n−1) bukan χ2(n)?
Kita mulai dari identitas:
∑i=1n(σXi−μ)2=σ2(n−1)S2+(σ/nXˉ−μ)2
Ruas kiri adalah jumlah n kuadrat Normal standar independen → χ2(n).
Suku kedua ruas kanan: (σ/nXˉ−μ)2∼χ2(1) karena Xˉ∼N(μ,σ2/n).
Dari Fisher’s Theorem, Xˉ dan S2 independen, sehingga dua suku di ruas kanan independen. Maka berdasarkan sifat aditif χ2 (terbalik):
χ2(n)=χkiri2+χ2(1)⟹χkiri2=σ2(n−1)S2∼χ2(n−1)
Kehilangan satu derajat kebebasan (dari n ke n−1) mencerminkan bahwa mengestimasi μ dengan Xˉ mengimposes satu kendala linear pada deviasi Xi−Xˉ: ∑(Xi−Xˉ)=0 selalu.
◈Tabel Perbandingan Tiga Distribusi Sampel›
Properti
χ2(ν)
t(ν)
F(ν1,ν2)
Support
(0,∞)
(−∞,∞)
(0,∞)
Simetri
Tidak simetris (right-skewed)
Simetris di nol
Tidak simetris
Mean
ν
0 (ν>1)
ν2/(ν2−2) (ν2>2)
Variansi
2ν
ν/(ν−2) (ν>2)
Kompleks (ν2>4)
Limit Normal
χ2(ν)/ν→1
t(ν)→N(0,1)
F(1,ν)→χ2(1)
Konteks sampel
(n−1)S2/σ2
(Xˉ−μ)/(S/n)
S12/S22 (jika σ12=σ22)
df sampel
n−1
n−1
n1−1, n2−1
Derivasi Distribusi-t dari Komponen:
T=S/nXˉ−μ
Tulis ulang dalam bentuk standar. Bagi pembilang dan penyebut dengan σ/n:
T=S2/σ2(Xˉ−μ)/(σ/n)=V/(n−1)Z
di mana Z=(Xˉ−μ)/(σ/n)∼N(0,1) dan V=(n−1)S2/σ2∼χ2(n−1).
Karena Z⊥V (Fisher’s Theorem), ini tepat memenuhi definisi t(n−1):
T=V/(n−1)Z∼t(n−1)
Derivasi Distribusi-F untuk Dua Sampel:
Untuk X1(1),…,Xn1(1)∼i.i.d.N(μ1,σ12) dan X1(2),…,Xn2(2)∼i.i.d.N(μ2,σ22) independen:
Jika H0:σ12=σ22 maka F=S12/S22∼F(n1−1,n2−1) di bawah H0.
Relasi Persentil F dan Invers:
F1−α(ν1,ν2)=Fα(ν2,ν1)1
Ini berguna ketika tabel hanya menyediakan nilai α kecil (ekor kanan) dan kita membutuhkan persentil ekor kiri. Contoh: F0,95(5,10)=1/F0,05(10,5).
✘Dilarang›
Dilarang menggunakan distribusi-t tanpa asumsi populasi Normal (atau n besar). Statistik T=(Xˉ−μ)/(S/n) hanya mengikuti distribusi t(n−1)eksak untuk populasi Normal. Untuk populasi non-Normal dengan n kecil, distribusinya bukan t — gunakan metode non-parametrik atau bootstrap.
Dilarang mencampur derajat kebebasan. Untuk χ2: df =n−1 (bukan n). Untuk t: df =n−1 (bukan n). Untuk F dua sampel: df numerator =n1−1, df denominator =n2−1 — urutan momennen dan denominator harus konsisten dengan statistik yang dihitung.
Dilarang mengasumsikan Xˉ dan S2 independen untuk populasi non-Normal. Kebebasan Xˉ⊥S2 adalah properti eksklusif distribusi Normal. Untuk distribusi lain (Eksponensial, Gamma, dll.), Xˉ dan S2 berkorelasi.
Section 4 — Contoh Soal
Soal A — Fundamental
Dari sampel acak X1,…,X16 dari N(μ=50,σ2=25), definisikan Xˉ dan S2 sebagai mean dan variansi sampel.
(a) Nyatakan distribusi Xˉ secara eksak.
(b) Hitung P(48≤Xˉ≤52,5).
(c) Nyatakan distribusi 2515S2 dan hitung E[2515S2] serta Var(2515S2).
(d) Hitung P(S2≤40), yaitu probabilitas bahwa variansi sampel tidak melampaui 40.
(e) Nyatakan distribusi statistik T=S/4Xˉ−50 dan jelaskan mengapa dapat menggunakan distribusi ini.
✓Solusi Soal A›
1. Identifikasi Variabel
Xi∼i.i.d.N(μ=50,σ2=25), sehingga σ=5
n=16; df =n−1=15
Xˉ = mean sampel; S2 = variansi sampel
2. Identifikasi Distribusi / Model
Populasi Normal eksak → distribusi Xˉ Normal eksak; (n−1)S2/σ2∼χ2(n−1); T=(Xˉ−μ)/(S/n)∼t(n−1).
3. Setup Persamaan
Fisher’s Theorem: Xˉ∼N(μ,σ2/n) dan (n−1)S2/σ2∼χ2(n−1), Xˉ⊥S2.
4. Eksekusi Aljabar
(a) Distribusi Xˉ:Xˉ∼N(50,1625)=N(50,1,5625)
Standar error: SE(Xˉ)=σ/n=5/4=1,25.
(b) P(48≤Xˉ≤52,5):
Standarisasi dengan SE=1,25:
z1=1,2548−50=1,25−2=−1,60,z2=1,2552,5−50=1,252,5=2,00
Dari Fisher’s Theorem dengan n=16, σ2=25:
σ2(n−1)S2=2515S2∼χ2(15)
Menggunakan properti χ2(ν):
E[2515S2]=ν=15Var(2515S2)=2ν=30
(d) P(S2≤40):
Konversikan ke χ2:
P(S2≤40)=P(2515S2≤2515×40)=P(χ2(15)≤24)
Dari tabel χ2: P(χ2(15)≤24,996)≈0,95, sehingga P(χ2(15)≤24)≈0,945.
(Nilai eksak: persentil ke-94,5 distribusi χ2(15) adalah sekitar 24.)
(e) Distribusi T=(Xˉ−50)/(S/4):
Tulis ulang: T=S/16Xˉ−50=S/nXˉ−μ
Dari Fisher’s Theorem:
Pembilang standarisasi: Z=(Xˉ−50)/(5/4)∼N(0,1)
(n−1)S2/σ2=15S2/25∼χ2(15), dan Xˉ⊥S2
Maka T=Z/(15S2/25)/15=Z/S2/25=Z/(S/5) — dan:
T=S/4Xˉ−50∼t(15)
Justifikasi: Distribusi t(n−1) berlaku karena: (1) populasi Normal sehingga Xˉ Normal, (2) (n−1)S2/σ2∼χ2(n−1), dan (3) Xˉ⊥S2 (Fisher’s Theorem untuk populasi Normal).
5. Verification
SE(Xˉ)=5/4=1,25: lebih kecil dari σ=5 karena rata-rata 16 pengamatan lebih stabil ✓
E[15S2/25]=15=ν: konsisten dengan properti χ2(ν) ✓
P(S2≤40)≈0,945: dengan E[S2]=σ2=25 dan nilai 40 cukup di atas mean, probabilitas kumulatif mendekati 1 masuk akal ✓
Derajat kebebasan t: n−1=15, bukan n=16 ✓
▲Exam Tips — Soal A›
Target waktu: 10–12 menit
Common trap 1: Standar error Xˉ adalah σ/n=5/4=1,25 — bukan σ=5. Standarisasi harus menggunakan SE, bukan σ.
Common trap 2: Untuk konversi ke χ2 di bagian (d): P(S2≤40)=P(χ2(15)≤15×40/25)=P(χ2(15)≤24) — kalikan dengan (n−1)/σ2, bukan hanya dibagi σ2.
Common trap 3: Derajat kebebasan t dan χ2 adalah n−1=15, bukan n=16. Satu derajat kebebasan “hilang” karena mengestimasi μ dengan Xˉ.
Soal B — Exam-Typical
Seorang aktuaris mengambil sampel n=10 polis asuransi dan memperoleh xˉ=42 juta rupiah dan s=8 juta rupiah. Diasumsikan nilai klaim mengikuti distribusi Normal dengan mean μ yang tidak diketahui.
(a) Bangun statistik T yang berdistribusi t(9) menggunakan Xˉ, S, μ, dan n.
(b) Hitung P(T≤1,833) di mana T∼t(9) (nilai tabel).
(c) Hitung P(∣Xˉ−μ∣≤4,634) menggunakan distribusi t(9) dan s=8.
(d) Misalkan aktuaris kedua mengambil sampel independen n2=8 polis dari populasi yang sama dan memperoleh s2=6. Bangun statistik F yang membandingkan kedua variansi sampel dan tentukan distribusinya.
(e) Gunakan relasi F1−α(ν1,ν2)=1/Fα(ν2,ν1) untuk mencari F0,95(9,7) jika diketahui F0,05(7,9)=3,29.
✓Solusi Soal B›
1. Identifikasi Variabel
Sampel 1: n1=10, xˉ=42, s1=8; σ2 tidak diketahui
Sampel 2: n2=8, s2=6; dari populasi sama (diasumsikan σ12=σ22)
Populasi Normal
2. Identifikasi Distribusi / Model
Karena σ2 tidak diketahui: gunakan distribusi t. Perbandingan variansi: distribusi F.
3. Setup Persamaan
Statistik-t: T=(Xˉ−μ)/(S/n)
Statistik-F: F=S12/S22 (jika σ12=σ22)
4. Eksekusi Aljabar
(a) Statistik T∼t(9):T=S/nXˉ−μ=S/10Xˉ−μ∼t(9)
Derajat kebebasan: n−1=10−1=9.
(b) P(T≤1,833) untuk T∼t(9):
Dari tabel distribusi-t: t0,05(9)=1,833 berarti P(T>1,833)=0,05.
P(T≤1,833)=1−0,05=0,95
Interpretasi: nilai 1,833 adalah persentil ke-95 dari t(9).
(c) P(∣Xˉ−μ∣≤4,634):
Konversikan ke statistik T menggunakan s=8 dan n=10:
P(∣Xˉ−μ∣≤4,634)=P(8/10Xˉ−μ≤8/104,634)
Target waktu: 12–14 menit
Common trap 1: Relasi invers F: F0,95(9,7)=1/F0,05(7,9) — urutan df terbalik di sisi kanan. Banyak kandidat salah menulis 1/F0,05(9,7) (urutan tidak terbalik).
Common trap 2: Untuk bagian (c), pastikan membagi 4,634 dengan standar error s/n, bukan dengan s saja.
Common trap 3: Distribusi F(9,7) untuk S12/S22 hanya valid di bawah H0:σ12=σ22. Jika σ12=σ22, statistiknya adalah F=(S12/σ12)/(S22/σ22).
Soal C — Challenging
Misalkan X1,…,Xn∼i.i.d.N(μ,σ2). Definisikan Xˉ, S2, dan Sn2=n1∑i=1n(Xi−Xˉ)2 (variansi sampel dengan penyebut n, bukan n−1).
(a) Tunjukkan bahwa i=1∑n(σXi−μ)2=σ2(n−1)S2+(σ/nXˉ−μ)2 dan identifikasi distribusi masing-masing suku di ruas kanan.
(b) Gunakan dekomposisi pada (a) dan kebebasan Xˉ dari S2 untuk membuktikan bahwa σ2(n−1)S2∼χ2(n−1).
(c) Tunjukkan bahwa E[Sn2]=nn−1σ2 (bias ke bawah) dan E[S2]=σ2 (tak-bias).
(d) Misalkan Y=cS2/σ2 berdistribusi χ2(ν). Tentukan nilai c dan ν dari n dan definisikan derajat kebebasan.
(e) Untuk n=25 dan σ2=9 (diketahui), tentukan interval [a,b] simetris sehingga P(a≤S2≤b)=0,90 menggunakan persentil χ2(24): χ0,052(24)=36,415 dan χ0,952(24)=13,848.
Suku silang hilang karena ∑(Xi−Xˉ)=0 selalu. Bagi dengan σ2:
∑i=1n(σXi−μ)2==(n−1)S2/σ2σ2∑(Xi−Xˉ)2+(σ/nXˉ−μ)2
Identifikasi distribusi masing-masing:
Ruas kiri: ∑Zi2 di mana Zi=(Xi−μ)/σ∼i.i.d.N(0,1) → χ2(n)
Suku kedua ruas kanan: (σ/nXˉ−μ)2=ZXˉ2 di mana ZXˉ∼N(0,1) → χ2(1)
Suku pertama ruas kanan: (n−1)S2/σ2 — akan ditentukan distribusinya di bagian (b)
(b) Bukti σ2(n−1)S2∼χ2(n−1):
Dari dekomposisi di (a): Qn=Qn−1+Q1 di mana:
Qn=∑Zi2∼χ2(n)
Q1=ZXˉ2∼χ2(1)
Qn−1=(n−1)S2/σ2
Fisher’s Theorem (diterima sebagai fakta untuk populasi Normal) menyatakan Xˉ⊥S2, sehingga Q1⊥Qn−1.
Hitung MGF Qn−1 menggunakan sifat aditif χ2 (terbalik): jika Qn=Qn−1+Q1 dan keduanya independen:
MQn(t)=MQn−1(t)⋅MQ1(t)(1−2t)−n/2=MQn−1(t)⋅(1−2t)−1/2MQn−1(t)=(1−2t)−n/2/(1−2t)−1/2=(1−2t)−(n−1)/2
Ini adalah MGF χ2(n−1). Oleh Uniqueness Theorem:
σ2(n−1)S2∼χ2(n−1)✓
(c) Bias Sn2 dan tak-bias S2:
Karena (n−1)S2/σ2∼χ2(n−1) dengan E[χ2(n−1)]=n−1:
E[σ2(n−1)S2]=n−1⟹E[S2]=σ2(tak-bias) ✓
Hubungan Sn2 dan S2: Sn2=nn−1S2, sehingga:
E[Sn2]=nn−1E[S2]=nn−1σ2<σ2(bias ke bawah) ✓
Bias: E[Sn2]−σ2=−σ2/n (mendekati nol untuk n besar).
(d) Nilai c dan ν:
Dari hasil (b): σ2(n−1)S2∼χ2(n−1).
Maka Y=cS2/σ2∼χ2(ν) mensyaratkan:
c=n−1,ν=n−1
Derajat kebebasan ν=n−1 mencerminkan bahwa dari n deviasi Xi−Xˉ, hanya n−1 yang bebas karena kendala ∑(Xi−Xˉ)=0.
(e) Interval [a,b] untuk P(a≤S2≤b)=0,90 dengan n=25, σ2=9:
Konversikan ke χ2(24) menggunakan (n−1)S2/σ2=24S2/9:
P(a≤S2≤b)=P(924a≤χ2(24)≤924b)=0,90
Pilih interval simetris dalam arti probabilitas ekor masing-masing =0,05:
P(χ2(24)≤24a/9)=0,05⟹924a=χ0,952(24)=13,848a=2413,848×9=24124,632=5,193
E[S2]=σ2=9: interval [5,193,13,655] mencakup nilai 9 di dalamnya ✓
Interval S2 tidak simetris di sekitar E[S2]=9: 9−5,193=3,807 dan 13,655−9=4,655 — distribusi χ2 right-skewed sehingga interval S2 tidak simetris ✓
Rumus: batas bawah =χα/2,bawah2⋅σ2/(n−1); batas atas =χα/2,atas2⋅σ2/(n−1) ✓
▲Exam Tips — Soal C›
Target waktu: 18–22 menit
Common trap 1: Persentil χ2 untuk interval dua sisi: P(a≤χ2≤b)=0,90 menggunakan persentil ke-5 (χ0,952) sebagai batas bawah dan persentil ke-95 (χ0,052) sebagai batas atas — notasi χα2 berarti P(χ2>χα2)=α. Banyak kandidat terbalik mana persentil atas dan bawah.
Common trap 2: Untuk konversi P(S2≤b)→P(χ2(24)≤24b/9) — kalikan S2 dengan (n−1)/σ2=24/9, bukan hanya 1/σ2=1/9.
Common trap 3: Interval untuk S2 tidak simetris di sekitar σ2 karena distribusi χ2 right-skewed. Jangan menggunakan interval simetris σ2±c — gunakan transformasi χ2 yang benar.
Section 5 — Verifikasi & Sanity Check
✓Validasi Identifikasi Distribusi Sampel›
Sebelum menggunakan distribusi χ2, t, atau F:
Populasi harus Normal (atau aproksimasi untuk n besar) ✓
Derajat kebebasan harus benar: χ2 dan t menggunakan n−1; F menggunakan n1−1 dan n2−1 ✓
Independensi yang diperlukan terpenuhi: Xˉ⊥S2 (Fisher’s Theorem, hanya untuk Normal); dua sampel independen untuk F ✓
✓Validasi Persentil dan Probabilitas›
Notasi χα2(ν): P(χ2(ν)>χα2(ν))=α — ini adalah ekor kanan; nilai lebih besar untuk α lebih kecil ✓
Notasi tα(ν): P(t(ν)>tα(ν))=α — karena simetri: t1−α(ν)=−tα(ν) ✓
Untuk interval dua sisi P(∣T∣≤c)=1−α: gunakan c=tα/2(ν) ✓
Untuk statistik T=(Xˉ−μ)/(S/n): derajat kebebasan =n−1, penyebut menggunakan S (bukan σ) ✓
Untuk statistik F=S12/S22 (jika σ12=σ22): df =(n1−1,n2−1) ✓
Metode Alternatif
Menggunakan relasi χ2=Γ untuk menghitung probabilitas:χ2(ν)=Γ(ν/2,β=2), sehingga probabilitas χ2 dapat dihitung via tabel Gamma atau hubungan Gamma–Poisson untuk ν genap (ν/2∈Z+).
Menggunakan t2∼F(1,ν) untuk konversi:P(∣T∣>c)=P(T2>c2)=P(F(1,ν)>c2) — berguna ketika tabel F lebih lengkap dari tabel t.
Simetri distribusi t untuk probabilitas dua sisi:P(∣T∣≤c)=2P(T≤c)−1=2Φt(c)−1 menggunakan simetri di nol.
Section 6 — Visualisasi Mental
Chi-Kuadrat — Histogram Ekor Kanan:
PDF χ2(ν) adalah kurva yang mulai dari 0, naik ke modus di max(ν−2,0), lalu turun dengan ekor kanan panjang. Untuk ν=1 atau ν=2: modus di 0, menurun monoton. Untuk ν besar: mendekati Normal N(ν,2ν). Selalu non-negatif karena merupakan jumlah kuadrat. Semakin besar ν, kurva semakin “datar” dan bergeser ke kanan.
Distribusi-t — Lonceng Lebih Gemuk:
Bentuknya mirip Normal standar — lonceng simetris di nol — tetapi ekor lebih tebal. Untuk ν=1 (Cauchy): ekor sangat tebal, tidak memiliki mean. Untuk ν=5: sudah cukup mirip Normal. Untuk ν≥30: hampir tidak bisa dibedakan dari N(0,1). Implikasi: interval kepercayaan menggunakan t lebih lebar dari menggunakan z — mencerminkan ketidakpastian tambahan karena σ2 tidak diketahui.
Distribusi-F — Asimetris Positif:
Support (0,∞), right-skewed. Untuk ν1,ν2 besar: mendekati Normal. Perhatikan bahwa F(ν1,ν2)=1/F(ν2,ν1) — membalik distribusi berarti membalik urutan df. Kurva dimulai dari 0, naik ke modus di (ν1−2)/ν1⋅ν2/(ν2+2) (jika ν1>2), lalu menurun dengan ekor kanan.
Hubungan Visual ↔ Rumus
Pelebaran ekor distribusi-t dibanding Normal berkorespondensi dengan:
Var(t(ν))=ν−2ν>1⟷ekor lebih tebal dari N(0,1) yang Var=1
Distribusi χ2 mendekati Normal untuk ν besar berkorespondensi dengan:
2χ2−2ν−1≈N(0,1) untuk ν besar⟷kurva semakin simetris
F(ν1,ν2)=V/ν2U/ν1=V/ν2÷U/ν11=F(ν2,ν1)1⟷balik pecahan = balik distribusi
Section 7 — Jebakan Umum
⬡Kesalahan Parametrisasi›
Jebakan utama — Derajat kebebasan yang salah:
Statistik
df BENAR
df SALAH yang umum
(n−1)S2/σ2
χ2(n−1)
χ2(n)
(Xˉ−μ)/(S/n)
t(n−1)
t(n) atau N(0,1)
S12/S22 (jika σ12=σ22)
F(n1−1,n2−1)
F(n1,n2)
F1−α(ν1,ν2)
=1/Fα(ν2,ν1)
=1/Fα(ν1,ν2) (tidak terbalik)
Penyebab: Kehilangan satu df karena mengestimasi μ dengan Xˉ; imposes kendala ∑(Xi−Xˉ)=0.
⬡Kesalahan Konseptual›
Menggunakan Z=(Xˉ−μ)/(σ/n) saat σ2 tidak diketahui. Jika σ2 tidak diketahui dan diestimasi dengan S2, statistik yang benar adalah T=(Xˉ−μ)/(S/n)∼t(n−1) — bukan N(0,1). Perbedaannya signifikan untuk n kecil.
Mengasumsikan Xˉ⊥S2 untuk populasi non-Normal. Ini hanya berlaku untuk populasi Normal (Fisher’s Theorem). Untuk distribusi lain, Xˉ dan S2 dapat berkorelasi.
Terbalik arah persentil χ2 untuk interval dua sisi. Untuk P(c1≤χ2(ν)≤c2)=1−α: batas bawah c1=χ1−α/22(ν) (persentil ke-α/2, nilai kecil) dan batas atas c2=χα/22(ν) (persentil ke-(1−α/2), nilai besar). Notasi χα2 adalah nilai dengan probabilitas ekor kanan α — bukan persentil ke-α.
Salah urutan df dalam relasi invers F.F0,95(9,7)=1/F0,05(7,9) — urutan df di kedua sisi TERBALIK. Kesalahan umum: menulis 1/F0,05(9,7) tanpa membalik urutan.
⬡Kesalahan Interpretasi Soal›
”σ2 tidak diketahui”: Otomatis gunakan t, bukan Z. Ini adalah petunjuk wajib untuk distribusi t.
“Bandingkan variansi dua populasi”: Otomatis distribusi F; pastikan identifikasi mana yang menjadi numerator/denominator karena F(ν1,ν2)=F(ν2,ν1).
“Interval untuk σ2 atau S2”: Gunakan transformasi χ2: P(c1≤(n−1)S2/σ2≤c2).
“Distribusi eksak” vs “aproksimasi”: Untuk populasi Normal: t, χ2, F berlaku eksak untuk n berapapun. Untuk populasi non-Normal: hanya berlaku sebagai aproksimasi untuk n besar (via CLT untuk t).
▲Red Flags›
Soal menyebut ”σ2 tidak diketahui” dengan populasi Normal: Distribusi t wajib — bukan Z.
Soal meminta interval kepercayaan atau uji untuk σ2: Distribusi χ2 dengan (n−1)S2/σ2∼χ2(n−1).
Soal memberikan dua variansi sampel S12 dan S22: Distribusi F untuk perbandingan.
Soal meminta persentil ekor kiri distribusi F: Gunakan relasi invers dengan membalik df.
Soal menyebut ”n kecil” (misal n<30) dan populasi Normal: Distribusi t atau χ2 berlaku eksak — jangan aproksimasi dengan Normal.
Soal meminta distribusi T2:T2∼F(1,n−1) — gunakan relasi t2∼F(1,ν).
Section 8 — Ringkasan Eksekutif
≡Must-Remember›
Fisher’s Theorem — fondasi semua distribusi sampel Normal:Xi∼i.i.d.N(μ,σ2)⟹Xˉ∼N(μ,nσ2),σ2(n−1)S2∼χ2(n−1),Xˉ⊥S2
Chi-Kuadrat — jumlah kuadrat Normal standar, relasi Gamma:χ2(ν)=∑i=1νZi2,E=ν,Var=2ν,χ2(ν)=Γ(ν/2,2)
Distribusi-t — ketika σ2 tidak diketahui:T=S/nXˉ−μ∼t(n−1),ekor lebih tebal dari N(0,1),t(ν)→N(0,1) saat ν→∞
Distribusi-F — rasio dua variansi sampel:F=S22/σ22S12/σ12∼F(n1−1,n2−1),F1−α(ν1,ν2)=Fα(ν2,ν1)1
Chi-Kuadrat: Inferensi tentang σ2 (interval kepercayaan, uji); distribusi statistik (n−1)S2/σ2; uji kecocokan distribusi (goodness of fit); uji independensi tabel kontingensi.
Distribusi-t: Inferensi tentang μ ketika σ2 tidak diketahui; interval kepercayaan dan uji satu sampel atau dua sampel (berpasangan atau independen).
Distribusi-F: Perbandingan variansi dua populasi; uji homogenitas variansi; ANOVA.
Kapan TIDAK Boleh Digunakan
Jangan t atau χ2 eksak untuk populasi non-Normal dengan n kecil — distribusi tidak valid. Gunakan metode non-parametrik atau bootstrap.
Jangan Z=(Xˉ−μ)/(σ/n) jika σ2 tidak diketahui — gunakan t dengan S.
Jangan F jika dua sampel tidak independen (misalnya data berpasangan before-after) — gunakan uji t berpasangan.
Jangan asumsikan Xˉ⊥S2 untuk populasi non-Normal — properti eksklusif Normal.
Quick Decision Tree
graph TD A["Sampel dari populasi Normal<br>n, X-bar, S^2 tersedia"] --> B["Inferensi tentang apa?"] B --> C["Mean mu"] B --> D["Variansi sigma^2"] B --> E["Perbandingan dua variansi"] C --> F["Apakah sigma^2 diketahui?"] F -->|"Ya"| G["Z = (X-bar - mu) / (sigma/sqrt(n))<br>~ N(0,1)"] F -->|"Tidak"| H["T = (X-bar - mu) / (S/sqrt(n))<br>~ t(n-1)"] D --> I["Chi-Kuadrat:<br>(n-1)S^2/sigma^2 ~ chi^2(n-1)<br>df = n-1"] E --> J["F = (S1^2/sigma1^2) / (S2^2/sigma2^2)<br>~ F(n1-1, n2-1)<br>Jika H0: sigma1^2=sigma2^2 maka F=S1^2/S2^2"] H --> K["df = n-1, bukan n<br>Ekor lebih tebal dari Normal<br>Untuk n besar: t approx N(0,1)"] I --> L["Interval untuk sigma^2:<br>Gunakan persentil chi^2<br>Interval tidak simetris di sekitar sigma^2"] J --> M["Persentil F ekor kiri:<br>F_{1-alpha}(v1,v2) = 1/F_alpha(v2,v1)<br>Balik KEDUA df"]
❝Follow-up Options›
“Berikan soal variasi: turunkan interval kepercayaan 95% untuk μ menggunakan distribusi t dan untuk σ2 menggunakan distribusi χ2 dari data sampel yang diberikan”
📖 Ref: Hogg-Tanis-Zimm (2015) Bab 5.3–5.5; Hogg-McKean-Craig (2019) Bab 3.3–3.6; Miller et al. (2014) Bab 8.3–8.5; Walpole et al. (2012) Bab 8.2–8.5 | 🗓️ 2026-02-21 | #CF2 #InferensStatistik #DistribusiSampel #ChiKuadrat #TDistribusi #FDistribusi #NormalSampel