PAI · AAMAI · 2026
Aktuaria
Indonesia
CF2 · Materi 4.1

Penarikan Sampel Acak

2026-02-21 Medium Bobot: 20–30% Hogg-Tanis-Zimmerman (2015) Bab 5.1–5.2; Hogg-McKean-Craig (2019) Bab 3.1–3.2; Miller et al. (2014) Bab 8.1–8.2; Walpole et al. (2012) Bab 8.1
CF2InferensStatistikSampelAcakPopulasiStatistikEstimasiIIDDistribusiSampelTopikEmpat

📊 4.1 — Penarikan Sampel Acak

Ringkasan Cepat

Topik: Penarikan Sampel Acak — Konsep Populasi, Sampel, dan Inferensi Statistik | Bobot: ~20–30% | Difficulty: Medium Ref: Hogg-Tanis-Zimm (2015) Bab 5.1–5.2; Hogg-McKean-Craig (2019) Bab 3.1–3.2; Miller et al. (2014) Bab 8.1–8.2; Walpole et al. (2012) Bab 8.1 | Prereq: 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu, 2.6 Distribusi Kontinu Umum, 3.1 Distribusi Gabungan (Joint Distribution)

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 4: Inferensi Statistik4.1Mendefinisikan populasi, parameter, sampel acak, dan statistik; membedakan parameter populasi θ\theta dengan estimator θ^\hat{\theta}; memformulasikan distribusi gabungan sampel i.i.d. sebagai produk PDF/PMF; menghitung probabilitas melibatkan statistik sederhana dari sampel; memahami konsep distribusi sampling (sampling distribution) sebagai fondasi inferensi20–30%Medium2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu, 2.6 Distribusi Kontinu Umum, 3.1 Distribusi Gabungan (Joint Distribution)4.2 Distribusi Sampel, 4.3 Teorema Limit Pusat (CLT), 4.4 Hukum Bilangan Besar (LLN), 4.5 Estimasi Parameter, 4.6 Sifat-Sifat EstimatorHogg-Tanis-Zimm (2015) Bab 5.1–5.2; Hogg-McKean-Craig (2019) Bab 3.1–3.2; Miller et al. (2014) Bab 8.1–8.2; Walpole et al. (2012) Bab 8.1

Section 1 — Intuisi

Bayangkan seorang aktuaris ditugaskan untuk memperkirakan rata-rata kerugian klaim kesehatan dari seluruh pemegang polis sebuah perusahaan asuransi besar — katakanlah 500.000 orang. Mustahil secara praktis untuk menghitung kerugian masing-masing dari 500.000 orang tersebut. Yang dilakukan adalah mengambil sampel — misalnya 200 pemegang polis dipilih secara acak, kerugian mereka dicatat, dan dari data 200 orang ini dibuatlah taksiran untuk keseluruhan 500.000. Proses inilah yang disebut inferensi statistik: menarik kesimpulan tentang populasi berdasarkan informasi dari sampel.

Kunci dari seluruh proses ini terletak pada kata “acak”. Jika 200 pemegang polis dipilih sembarangan — misalnya hanya yang mudah dihubungi atau yang klaimnya besar — sampel tidak representatif dan inferensi menjadi cacat. Ketika kita memilih secara acak sederhana dengan pengembalian, setiap pengamatan XiX_i menjadi variabel acak yang memiliki distribusi yang sama dengan distribusi populasi dan independen satu sama lain. Kondisi i.i.d. (independent and identically distributed) ini adalah fondasi matematis dari hampir seluruh Topik 4: ia memungkinkan distribusi gabungan sampel ditulis sebagai produk PDF/PMF, yang pada gilirannya membuat semua derivasi seperti MLE, distribusi Xˉ\bar{X}, dan CLT menjadi mungkin.

Konsep terpenting untuk dipahami sejak awal adalah perbedaan antara parameter dan statistik. Parameter — seperti μ\mu, σ2\sigma^2, atau pp — adalah bilangan tetap (meski tidak diketahui) yang mendeskripsikan populasi. Statistik — seperti Xˉ\bar{X}, S2S^2, atau p^\hat{p} — adalah fungsi dari data sampel, sehingga ia sendiri merupakan variabel acak yang memiliki distribusinya sendiri, yang disebut distribusi sampling. Memahami bahwa estimator adalah variabel acak, bukan bilangan tetap, adalah lompatan konseptual terpenting dari Topik 2–3 ke Topik 4.

Section 2 — Definisi Formal

Definisi Matematis

Populasi dan Parameter: Suatu populasi adalah himpunan semua nilai yang mungkin dari besaran yang diamati, dikarakterisasi oleh distribusi probabilitas f(x;θ)f(x;\theta) yang bergantung pada parameter θ\theta (bisa vektor).

Sampel Acak (Random Sample): X1,X2,,XnX_1, X_2, \ldots, X_n disebut sampel acak berukuran nn dari populasi f(x;θ)f(x;\theta) jika variabel-variabel tersebut independen dan identik terdistribusi (i.i.d.) dengan distribusi f(x;θ)f(x;\theta): X1,X2,,Xni.i.d.f(x;θ)X_1, X_2, \ldots, X_n \overset{\text{i.i.d.}}{\sim} f(x;\theta)

Distribusi Gabungan Sampel: fX1,,Xn(x1,,xn;θ)=i=1nf(xi;θ)f_{X_1,\ldots,X_n}(x_1,\ldots,x_n;\theta) = \prod_{i=1}^{n} f(x_i;\theta)

Statistik (Statistic): Suatu statistik T=T(X1,,Xn)T = T(X_1,\ldots,X_n) adalah fungsi yang terukur dari sampel yang tidak bergantung pada parameter θ\theta yang tidak diketahui. Statistik adalah variabel acak dengan distribusinya sendiri — disebut distribusi sampling (sampling distribution).

Variabel & Parameter

SimbolMaknaCatatan
θ\thetaParameter populasiBilangan tetap tapi tidak diketahui; bisa skalar atau vektor
f(x;θ)f(x;\theta)PDF/PMF populasiTergantung parameter θ\theta; diketahui bentuknya, tidak diketahui nilai θ\theta
nnUkuran sampelJumlah pengamatan; ditetapkan oleh peneliti
XiX_iPengamatan ke-ii dalam sampelVariabel acak; i.i.d. f(x;θ)\sim f(x;\theta)
xix_iRealizasi (nilai terobservasi) dari XiX_iBilangan tetap setelah sampel diambil
T=T(X1,,Xn)T = T(X_1,\ldots,X_n)StatistikVariabel acak; fungsi dari sampel; tidak bergantung θ\theta
θ^\hat{\theta}Estimator dari θ\thetaStatistik yang digunakan untuk menduga θ\theta; variabel acak
θ^obs\hat{\theta}_{\text{obs}}Estimasi (nilai terobservasi dari θ^\hat{\theta})Bilangan tetap; realisasi dari estimator
Xˉ\bar{X}Mean sampel1ni=1nXi\frac{1}{n}\sum_{i=1}^n X_i; statistik paling dasar
S2S^2Variansi sampel1n1i=1n(XiXˉ)2\frac{1}{n-1}\sum_{i=1}^n (X_i-\bar{X})^2; estimator tak-bias σ2\sigma^2

Rumus Utama

Xˉ=1ni=1nXi\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i

Label: Mean Sampel — statistik ringkas (summary statistic) paling fundamental; estimator alami untuk mean populasi μ\mu.

S2=1n1i=1n(XiXˉ)2S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2

Label: Variansi Sampel — penyebut n1n-1 (bukan nn) diperlukan agar S2S^2 adalah estimator tak-bias untuk σ2\sigma^2; ini adalah identitas kritis yang sering diuji.

fX1,,Xn(x1,,xn;θ)=i=1nf(xi;θ)f_{X_1,\ldots,X_n}(x_1,\ldots,x_n;\theta) = \prod_{i=1}^{n} f(x_i;\theta)

Label: Distribusi Gabungan Sampel i.i.d. — karena independen, PDF gabungan adalah produk PDF individual; ini adalah fondasi dari fungsi likelihood di 4.5 Estimasi Parameter.

E[Xˉ]=μ,Var(Xˉ)=σ2nE[\bar{X}] = \mu, \qquad \text{Var}(\bar{X}) = \frac{\sigma^2}{n}

Label: Mean dan Variansi dari Mean Sampel — berlaku untuk semua distribusi populasi dengan E[Xi]=μE[X_i] = \mu dan Var(Xi)=σ2\text{Var}(X_i) = \sigma^2; tidak memerlukan asumsi Normalitas.

E[S2]=σ2E[S^2] = \sigma^2

Label: Tak-Bias Variansi Sampel — penyebut n1n-1 memastikan ini; jika digunakan penyebut nn, estimator menjadi bias dengan E[S~2]=n1nσ2E[\tilde{S}^2] = \frac{n-1}{n}\sigma^2.

Asumsi Eksplisit

  • i.i.d.: Setiap XiX_i independen dari XjX_j untuk iji \neq j, dan semua XiX_i memiliki distribusi yang identik f(x;θ)f(x;\theta). Asumsi ini diperlukan agar distribusi gabungan dapat difaktorkan.
  • Distribusi populasi diketahui hingga θ\theta: Bentuk f(x;θ)f(x;\theta) diasumsikan diketahui (misalnya Normal, Eksponensial); hanya nilai θ\theta yang tidak diketahui. Inferensi adalah tentang mengestimasi θ\theta.
  • Nilai nn tetap: Ukuran sampel diasumsikan tetap (bukan acak) sebelum pengamatan dilakukan.
  • Sampling dengan pengembalian (atau populasi sangat besar): Asumsi i.i.d. mensyaratkan setiap pengamatan independent — ini valid untuk sampling dengan pengembalian, atau sampling tanpa pengembalian dari populasi yang jauh lebih besar dari nn (faktor koreksi populasi terbatas dapat diabaikan).

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Mengapa distribusi gabungan i.i.d. adalah produk? Ini langsung dari definisi independensi. Untuk kejadian independen A1,,AnA_1,\ldots,A_n: P(A1An)=P(A1)P(An)P(A_1 \cap \cdots \cap A_n) = P(A_1)\cdots P(A_n). Analog untuk variabel acak kontinu: jika X1,,XnX_1,\ldots,X_n independen, maka PDF gabungan adalah: fX1,,Xn(x1,,xn)=fX1(x1)fXn(xn)=i=1nf(xi;θ)f_{X_1,\ldots,X_n}(x_1,\ldots,x_n) = f_{X_1}(x_1) \cdots f_{X_n}(x_n) = \prod_{i=1}^n f(x_i;\theta) “Identik terdistribusi” berarti semua fXi=ff_{X_i} = f — distribusinya sama. Kombinasi keduanya: setiap XiX_i adalah “salinan independen” dari variabel acak dengan distribusi populasi yang sama.

Mengapa Xˉ\bar{X} adalah variabel acak? Karena Xˉ=1n(X1++Xn)\bar{X} = \frac{1}{n}(X_1 + \cdots + X_n) adalah fungsi dari X1,,XnX_1,\ldots,X_n yang merupakan variabel acak. Sebelum sampel diambil, nilai Xˉ\bar{X} tidak pasti — ia berdistribusi dengan distribusi samplingnya. Setelah sampel diambil dan x1,,xnx_1,\ldots,x_n terobservasi, barulah xˉ=1nxi\bar{x} = \frac{1}{n}\sum x_i menjadi bilangan tetap (estimasi, bukan estimator).

Perbedaan Kritis: Parameter vs Statistik
Parameter (θ\theta)Statistik (TT)
SifatBilangan tetap, tidak diketahuiVariabel acak
Bergantung padaDistribusi populasiData sampel X1,,XnX_1,\ldots,X_n
Contohμ\mu, σ2\sigma^2, pp, λ\lambdaXˉ\bar{X}, S2S^2, p^\hat{p}, X(1)X_{(1)}
DistribusiTidak memiliki distribusi (tetap)Memiliki distribusi sampling
Nilai berubah?Tidak (tetap per populasi)Ya, berubah antar sampel berbeda

Setiap kali Anda melihat Xˉ\bar{X} atau S2S^2 dalam persamaan probabilitas seperti P(Xˉ>c)P(\bar{X} > c), ingat bahwa ini adalah probabilitas atas variabel acak — bukan probabilitas tentang bilangan tetap.

Derivasi E[Xˉ]=μE[\bar{X}] = \mu dan Var(Xˉ)=σ2/n\text{Var}(\bar{X}) = \sigma^2/n:

Karena X1,,XnX_1,\ldots,X_n i.i.d. dengan E[Xi]=μE[X_i] = \mu dan Var(Xi)=σ2\text{Var}(X_i) = \sigma^2:

E[Xˉ]=E ⁣[1ni=1nXi]=1ni=1nE[Xi]=1nnμ=μE[\bar{X}] = E\!\left[\frac{1}{n}\sum_{i=1}^n X_i\right] = \frac{1}{n}\sum_{i=1}^n E[X_i] = \frac{1}{n}\cdot n\mu = \mu Var(Xˉ)=Var ⁣(1ni=1nXi)=1n2i=1nVar(Xi)=1n2nσ2=σ2n\text{Var}(\bar{X}) = \text{Var}\!\left(\frac{1}{n}\sum_{i=1}^n X_i\right) = \frac{1}{n^2}\sum_{i=1}^n \text{Var}(X_i) = \frac{1}{n^2}\cdot n\sigma^2 = \frac{\sigma^2}{n}

(Langkah kedua pada variansi menggunakan independensi — tanpa independensi, ada suku kovariansi Cov(Xi,Xj)\text{Cov}(X_i,X_j) yang tidak hilang.)

Derivasi E[S2]=σ2E[S^2] = \sigma^2 (justifikasi penyebut n1n-1):

(n1)S2=i=1n(XiXˉ)2=i=1nXi2nXˉ2(n-1)S^2 = \sum_{i=1}^n (X_i-\bar{X})^2 = \sum_{i=1}^n X_i^2 - n\bar{X}^2

Ambil nilai harapan:

E ⁣[(n1)S2]=i=1nE[Xi2]nE[Xˉ2]E\!\left[(n-1)S^2\right] = \sum_{i=1}^n E[X_i^2] - n\,E[\bar{X}^2]

Gunakan E[Xi2]=μ2+σ2E[X_i^2] = \mu^2 + \sigma^2 dan E[Xˉ2]=μ2+σ2/nE[\bar{X}^2] = \mu^2 + \sigma^2/n:

=n(μ2+σ2)n ⁣(μ2+σ2n)=nσ2σ2=(n1)σ2= n(\mu^2+\sigma^2) - n\!\left(\mu^2+\frac{\sigma^2}{n}\right) = n\sigma^2 - \sigma^2 = (n-1)\sigma^2

Sehingga:

E[S2]=(n1)σ2n1=σ2E[S^2] = \frac{(n-1)\sigma^2}{n-1} = \sigma^2 \quad \checkmark

Jika menggunakan penyebut nn (yaitu S~2=1n(XiXˉ)2\tilde{S}^2 = \frac{1}{n}\sum(X_i-\bar{X})^2), maka E[S~2]=n1nσ2<σ2E[\tilde{S}^2] = \frac{n-1}{n}\sigma^2 < \sigma^2bias ke bawah.

Dilarang
  1. Dilarang menyebut Xˉ\bar{X} sebagai “nilai tetap” atau “angka” sebelum sampel diambil. Sebelum pengamatan, Xˉ\bar{X} adalah variabel acak dengan distribusi samplingnya. Setelah sampel terobservasi, xˉ\bar{x} (huruf kecil) adalah realizasinya yang merupakan bilangan tetap.
  2. Dilarang menggunakan penyebut nn pada variansi sampel S2S^2 jika tujuannya adalah estimator tak-bias σ2\sigma^2. Penyebut nn menghasilkan estimator yang bias (underestimate). Gunakan n1n-1 untuk estimasi; nn hanya digunakan dalam konteks tertentu seperti Maximum Likelihood Estimator untuk σ2\sigma^2 distribusi Normal (yang memang bias).
  3. Dilarang menerapkan Var(Xˉ)=σ2/n\text{Var}(\bar{X}) = \sigma^2/n tanpa asumsi independensi. Rumus ini mensyaratkan Cov(Xi,Xj)=0\text{Cov}(X_i, X_j) = 0 untuk iji \neq j. Untuk sampling tanpa pengembalian dari populasi kecil, ada faktor koreksi populasi terbatas yang harus diaplikasikan.

Section 4 — Contoh Soal

Soal A — Fundamental

Sebuah perusahaan asuransi memodelkan waktu tunggu (dalam hari) hingga klaim pertama mengikuti distribusi Eksponensial dengan parameter laju λ\lambda (tidak diketahui). Seorang aktuaris mengambil sampel acak X1,X2,,X5X_1, X_2, \ldots, X_5 dari 5 pemegang polis independen dan memperoleh nilai terobservasi: x1=12,x2=7,x3=19,x4=4,x5=8x_1 = 12, \quad x_2 = 7, \quad x_3 = 19, \quad x_4 = 4, \quad x_5 = 8

(a) Nyatakan distribusi populasi f(x;λ)f(x;\lambda) dan identifikasi parameter yang tidak diketahui. (b) Tuliskan distribusi gabungan fX1,,X5(x1,,x5;λ)f_{X_1,\ldots,X_5}(x_1,\ldots,x_5;\lambda) secara eksplisit. (c) Hitung xˉ\bar{x} dan s2s^2 dari data terobservasi. (d) Tentukan E[Xˉ]E[\bar{X}] dan Var(Xˉ)\text{Var}(\bar{X}) dalam bentuk λ\lambda. (e) Jika diketahui λ=0,1\lambda = 0{,}1 (yaitu rata-rata populasi 10 hari), hitung P(Xˉ>12)P(\bar{X} > 12) menggunakan fakta bahwa i=15XiΓ(5,λ)\sum_{i=1}^5 X_i \sim \Gamma(5,\lambda).

Solusi Soal A

1. Identifikasi Variabel

  • Xii.i.d.Exp(λ)X_i \overset{\text{i.i.d.}}{\sim} \text{Exp}(\lambda), n=5n = 5
  • Realisasi terobservasi: x1=12,x2=7,x3=19,x4=4,x5=8x_1=12, x_2=7, x_3=19, x_4=4, x_5=8
  • Parameter yang tidak diketahui: λ>0\lambda > 0

2. Identifikasi Distribusi / Model Sampel acak i.i.d. dari Eksponensial. Distribusi gabungan = produk PDF Eksponensial. Mean sampel berdistribusi Γ(5,λ)\Gamma(5,\lambda) setelah dikalikan nn.

3. Setup Persamaan

PDF Eksponensial: f(x;λ)=λeλxf(x;\lambda) = \lambda e^{-\lambda x}, x>0x > 0

Distribusi gabungan (produk karena i.i.d.): fX1,,X5(x1,,x5;λ)=i=15λeλxif_{X_1,\ldots,X_5}(x_1,\ldots,x_5;\lambda) = \prod_{i=1}^5 \lambda e^{-\lambda x_i}

4. Eksekusi Aljabar

(a) Distribusi populasi: f(x;λ)=λeλx,x>0,λ>0f(x;\lambda) = \lambda e^{-\lambda x}, \quad x > 0, \quad \lambda > 0 Parameter yang tidak diketahui: λ\lambda (laju klaim). Mean populasi =1/λ= 1/\lambda.

(b) Distribusi gabungan: fX1,,X5(x1,,x5;λ)=i=15λeλxi=λ5exp ⁣(λi=15xi)f_{X_1,\ldots,X_5}(x_1,\ldots,x_5;\lambda) = \prod_{i=1}^5 \lambda e^{-\lambda x_i} = \lambda^5 \exp\!\left(-\lambda \sum_{i=1}^5 x_i\right) =λ5exp ⁣(λ(x1+x2+x3+x4+x5)),semua xi>0= \lambda^5 \exp\!\left(-\lambda(x_1+x_2+x_3+x_4+x_5)\right), \quad \text{semua } x_i > 0

(c) Menghitung xˉ\bar{x} dan s2s^2:

xˉ=12+7+19+4+85=505=10\bar{x} = \frac{12+7+19+4+8}{5} = \frac{50}{5} = 10

Deviasi dari mean:

iixix_ixixˉx_i - \bar{x}(xixˉ)2(x_i-\bar{x})^2
112+2+244
273-399
319+9+98181
446-63636
582-244
Total134134

s2=(xixˉ)2n1=1344=33,5s^2 = \frac{\sum(x_i-\bar{x})^2}{n-1} = \frac{134}{4} = 33{,}5

(d) E[Xˉ]E[\bar{X}] dan Var(Xˉ)\text{Var}(\bar{X}) dalam λ\lambda:

Untuk XiExp(λ)X_i \sim \text{Exp}(\lambda): E[Xi]=1/λE[X_i] = 1/\lambda dan Var(Xi)=1/λ2\text{Var}(X_i) = 1/\lambda^2. E[Xˉ]=μ=1λE[\bar{X}] = \mu = \frac{1}{\lambda} Var(Xˉ)=σ2n=1/λ25=15λ2\text{Var}(\bar{X}) = \frac{\sigma^2}{n} = \frac{1/\lambda^2}{5} = \frac{1}{5\lambda^2}

(e) P(Xˉ>12)P(\bar{X} > 12) dengan λ=0,1\lambda = 0{,}1:

Karena Xii.i.d.Exp(λ=0,1)X_i \overset{\text{i.i.d.}}{\sim} \text{Exp}(\lambda=0{,}1) dan Xˉ=S5/5\bar{X} = S_5/5 di mana S5=XiΓ(5,λ=0,1)S_5 = \sum X_i \sim \Gamma(5, \lambda=0{,}1):

P(Xˉ>12)=P ⁣(S55>12)=P(S5>60)P(\bar{X} > 12) = P\!\left(\frac{S_5}{5} > 12\right) = P(S_5 > 60)

Gunakan hubungan Gamma–Poisson (karena α=5Z+\alpha = 5 \in \mathbb{Z}^+): P(S5>60)=P ⁣(Poisson(λ60)α1)=P ⁣(Poisson(6)4)P(S_5 > 60) = P\!\left(\text{Poisson}(\lambda \cdot 60) \leq \alpha - 1\right) = P\!\left(\text{Poisson}(6) \leq 4\right)

=k=04e66kk!=e6(1+6+18+36+54)=e6×115= \sum_{k=0}^{4} \frac{e^{-6}\cdot 6^k}{k!} = e^{-6}\left(1 + 6 + 18 + 36 + 54\right) = e^{-6} \times 115

=0,002479×115=0,2851= 0{,}002479 \times 115 = 0{,}2851

5. Verification

  • xˉ=10\bar{x} = 10: rata-rata populasi dengan λ=0,1\lambda=0{,}1 adalah 1/λ=101/\lambda = 10 — sampel ini menghasilkan estimasi tepat di nilai parameter ✓
  • s2=33,5s^2 = 33{,}5: variansi populasi dengan λ=0,1\lambda=0{,}1 adalah 1/λ2=1001/\lambda^2 = 100; variansi sampel dari hanya 5 pengamatan memang bisa jauh dari nilai populasi ✓
  • P(Xˉ>12)0,285P(\bar{X} > 12) \approx 0{,}285: dengan E[Xˉ]=10E[\bar{X}] = 10 dan Xˉ\bar{X} di atas 12 (0{,}2 SD di atas mean untuk Gamma dengan n=5n=5), probabilitas sekitar 28,5% masuk akal ✓
  • Distribusi gabungan: λ5eλxi\lambda^5 e^{-\lambda \sum x_i} — ini adalah fungsi likelihood yang akan digunakan di 4.5 Estimasi Parameter untuk menurunkan MLE ✓
Exam Tips — Soal A

Target waktu: 10–12 menit Common trap 1: Saat menghitung s2s^2, gunakan penyebut n1=4n-1 = 4, bukan n=5n = 5. Soal CF2 sering menguji apakah kandidat menggunakan estimator tak-bias. Common trap 2: Untuk bagian (e), P(Xˉ>12)P(Xi>12)P(\bar{X} > 12) \neq P(X_i > 12) — ini adalah probabilitas tentang mean sampel (variabel acak yang berbeda dari XiX_i individual). Shortcut: Distribusi gabungan i.i.d. selalu dapat ditulis sebagai f(xi;θ)\prod f(x_i;\theta) — untuk Eksponensial ini menghasilkan λneλxi\lambda^n e^{-\lambda \sum x_i}, bentuk yang sangat berguna untuk likelihood.


Soal B — Exam-Typical

Klaim asuransi jiwa (dalam juta rupiah) dari suatu portofolio mengikuti distribusi N(μ,σ2=16)N(\mu, \sigma^2 = 16). Seorang aktuaris mengambil sampel acak X1,,X25X_1, \ldots, X_{25} dan memperoleh xˉ=8,4\bar{x} = 8{,}4.

(a) Nyatakan distribusi sampling dari Xˉ\bar{X} untuk sampel berukuran n=25n = 25. (b) Hitung P(7,5Xˉ9,5)P(7{,}5 \leq \bar{X} \leq 9{,}5) jika nilai sebenarnya μ=8\mu = 8. (c) Hitung P(Xˉμ>1,0)P(|\bar{X} - \mu| > 1{,}0) jika μ=8\mu = 8. (d) Berapa ukuran sampel minimal nn yang diperlukan agar P(Xˉμ0,5)0,95P(|\bar{X} - \mu| \leq 0{,}5) \geq 0{,}95? (e) Jelaskan interpretasi dari xˉ=8,4\bar{x} = 8{,}4: apakah ini parameter atau statistik? Apakah ini estimator atau estimasi?

Solusi Soal B

1. Identifikasi Variabel

  • Xii.i.d.N(μ,σ2=16)X_i \overset{\text{i.i.d.}}{\sim} N(\mu, \sigma^2 = 16), σ=4\sigma = 4
  • n=25n = 25; xˉobs=8,4\bar{x}_{\text{obs}} = 8{,}4
  • μ\mu tidak diketahui (parameter yang akan diestimasi)

2. Identifikasi Distribusi / Model Sampel i.i.d. dari Normal — distribusi sampling Xˉ\bar{X} adalah Normal eksak (bukan hanya aproksimasi CLT) karena populasi Normal.

3. Setup Persamaan

Distribusi sampling: XˉN ⁣(μ,  σ2n)=N ⁣(μ,  1625)\bar{X} \sim N\!\left(\mu,\; \frac{\sigma^2}{n}\right) = N\!\left(\mu,\; \frac{16}{25}\right)

Standarisasi: Z=Xˉμσ/n=Xˉμ4/5=Xˉμ0,8N(0,1)Z = \dfrac{\bar{X}-\mu}{\sigma/\sqrt{n}} = \dfrac{\bar{X}-\mu}{4/5} = \dfrac{\bar{X}-\mu}{0{,}8} \sim N(0,1)

4. Eksekusi Aljabar

(a) Distribusi sampling Xˉ\bar{X}: XˉN ⁣(μ,  1625)=N(μ,  0,64)\bar{X} \sim N\!\left(\mu,\; \frac{16}{25}\right) = N(\mu,\; 0{,}64) dengan standar error SE(Xˉ)=σ/n=4/5=0,8\text{SE}(\bar{X}) = \sigma/\sqrt{n} = 4/5 = 0{,}8.

(b) P(7,5Xˉ9,5)P(7{,}5 \leq \bar{X} \leq 9{,}5) dengan μ=8\mu = 8:

Standarisasi batas: z1=7,580,8=0,50,8=0,625z_1 = \frac{7{,}5 - 8}{0{,}8} = \frac{-0{,}5}{0{,}8} = -0{,}625 z2=9,580,8=1,50,8=1,875z_2 = \frac{9{,}5 - 8}{0{,}8} = \frac{1{,}5}{0{,}8} = 1{,}875

P(7,5Xˉ9,5)=Φ(1,875)Φ(0,625)P(7{,}5 \leq \bar{X} \leq 9{,}5) = \Phi(1{,}875) - \Phi(-0{,}625) =Φ(1,875)[1Φ(0,625)]= \Phi(1{,}875) - [1-\Phi(0{,}625)] 0,9696(10,7340)=0,96960,2660=0,7036\approx 0{,}9696 - (1-0{,}7340) = 0{,}9696 - 0{,}2660 = 0{,}7036

(c) P(Xˉμ>1,0)P(|\bar{X}-\mu|>1{,}0) dengan μ=8\mu=8:

P(Xˉ8>1,0)=P ⁣(Z>1,00,8)=P(Z>1,25)P(|\bar{X}-8|>1{,}0) = P\!\left(|Z|>\frac{1{,}0}{0{,}8}\right) = P(|Z|>1{,}25) =2[1Φ(1,25)]=2[10,8944]=2(0,1056)=0,2112= 2[1-\Phi(1{,}25)] = 2[1-0{,}8944] = 2(0{,}1056) = 0{,}2112

(d) Ukuran sampel minimal untuk P(Xˉμ0,5)0,95P(|\bar{X}-\mu|\leq 0{,}5) \geq 0{,}95:

P(Xˉμ0,5)=P ⁣(Z0,5σ/n)=P ⁣(Z0,5n4)0,95P(|\bar{X}-\mu|\leq 0{,}5) = P\!\left(|Z|\leq\frac{0{,}5}{\sigma/\sqrt{n}}\right) = P\!\left(|Z|\leq\frac{0{,}5\sqrt{n}}{4}\right) \geq 0{,}95

Syarat: P(Zc)0,95    cz0,025=1,96P(|Z| \leq c) \geq 0{,}95 \implies c \geq z_{0{,}025} = 1{,}96:

0,5n41,96    n4×1,960,5=15,68    n(15,68)2=245,86\frac{0{,}5\sqrt{n}}{4} \geq 1{,}96 \implies \sqrt{n} \geq \frac{4 \times 1{,}96}{0{,}5} = 15{,}68 \implies n \geq (15{,}68)^2 = 245{,}86

Ukuran sampel minimal: n=246\boxed{n = 246} (dibulatkan ke atas).

(e) Interpretasi xˉ=8,4\bar{x} = 8{,}4:

  • Xˉ\bar{X} (huruf besar) adalah statistik — variabel acak yang merupakan fungsi dari sampel X1,,X25X_1,\ldots,X_{25}; ini adalah estimator untuk μ\mu.
  • xˉ=8,4\bar{x} = 8{,}4 (huruf kecil) adalah estimasi — realizasi terobservasi dari statistik Xˉ\bar{X} setelah 25 pengamatan dilakukan; ini adalah bilangan tetap.
  • μ\mu adalah parameter — bilangan tetap (tapi tidak diketahui) yang diestimasi oleh Xˉ\bar{X}.
  • Ringkasan: Xˉ\bar{X} adalah estimator (variabel acak), xˉ=8,4\bar{x}=8{,}4 adalah estimasi (realisasi), μ\mu adalah parameter (target inferensi).

5. Verification

  • SE(Xˉ)=0,8\text{SE}(\bar{X}) = 0{,}8: lebih kecil dari σ=4\sigma=4 — rata-rata dari 25 pengamatan jauh lebih stabil dari pengamatan tunggal ✓
  • P(Xˉμ>1,0)=0,211P(|\bar{X}-\mu|>1{,}0) = 0{,}211: melebihi satu SE (0,80{,}8) dari mean, probabilitas sekitar 21% cukup masuk akal ✓
  • n=246n = 246: untuk mengurangi SE menjadi σ/n=4/2460,255\sigma/\sqrt{n} = 4/\sqrt{246} \approx 0{,}255, dan 0,5/0,2551,960{,}5/0{,}255 \approx 1{,}96 — tepat memenuhi syarat ✓
Exam Tips — Soal B

Target waktu: 12–15 menit Common trap 1: Standar error Xˉ\bar{X} adalah σ/n\sigma/\sqrt{n}, bukan σ2/n\sigma^2/n (itu variansinya) dan bukan σ/n\sigma/n. Untuk soal ini: σ/25=4/5=0,8\sigma/\sqrt{25} = 4/5 = 0{,}8. Common trap 2: Untuk bagian (d), setelah mendapat n245,86n \geq 245{,}86, bulatkan ke atas menjadi 246 — bukan ke bawah. Ukuran sampel harus memenuhi ketidaksamaan, bukan hanya mendekatinya. Common trap 3: z0,025=1,96z_{0{,}025} = 1{,}96 digunakan karena kita membutuhkan P(Zc)0,95P(|Z| \leq c) \geq 0{,}95, yang berarti P(Zc)0,975P(Z \leq c) \geq 0{,}975 — persentil ke-97,5 dari N(0,1)N(0,1). Shortcut: Formula ukuran sampel: n(zα/2σe)2n \geq \left(\frac{z_{\alpha/2}\cdot\sigma}{e}\right)^2 di mana ee adalah margin of error — hafalkan bentuk ini untuk soal penentuan nn.


Soal C — Challenging

Misalkan X1,X2,,XnX_1, X_2, \ldots, X_n adalah sampel acak i.i.d. dari distribusi dengan PDF: f(x;θ)=θxθ1,0<x<1,θ>0f(x;\theta) = \theta x^{\theta-1}, \quad 0 < x < 1, \quad \theta > 0

(a) Verifikasi bahwa f(x;θ)f(x;\theta) adalah PDF yang valid untuk semua θ>0\theta > 0. (b) Tuliskan distribusi gabungan fX1,,Xn(x1,,xn;θ)f_{X_1,\ldots,X_n}(x_1,\ldots,x_n;\theta) dan sederhanakan. (c) Tunjukkan bahwa E[X]=θ/(θ+1)E[X] = \theta/(\theta+1) dan Var(X)=θ/[(θ+1)2(θ+2)]\text{Var}(X) = \theta/[(\theta+1)^2(\theta+2)]. (d) Nyatakan E[Xˉ]E[\bar{X}] dan Var(Xˉ)\text{Var}(\bar{X}) sebagai fungsi dari θ\theta dan nn. (e) Misalkan T=lnXiT = -\ln X_i untuk satu pengamatan XiX_i. Tunjukkan bahwa TExp(θ)T \sim \text{Exp}(\theta) menggunakan teknik transformasi, lalu tentukan distribusi W=i=1n(lnXi)W = \sum_{i=1}^n (-\ln X_i) dan E[W]E[W].

Solusi Soal C

1. Identifikasi Variabel

  • Xii.i.d.f(x;θ)=θxθ1X_i \overset{\text{i.i.d.}}{\sim} f(x;\theta) = \theta x^{\theta-1} pada (0,1)(0,1) — ini adalah distribusi Beta(θ,1)(θ,1) atau Power distribution
  • Parameter: θ>0\theta > 0; Support: (0,1)(0,1)

2. Identifikasi Distribusi / Model Distribusi power (pangkat) pada (0,1)(0,1). Transformasi T=lnXT = -\ln X mengubahnya menjadi Eksponensial — teknik transformasi dari 2.4 Transformasi Variabel Acak Univariat.

3. Setup Persamaan

Validasi: 01θxθ1dx=1\int_0^1 \theta x^{\theta-1} dx = 1

Momen: E[Xk]=01xkθxθ1dx=θ01xk+θ1dxE[X^k] = \int_0^1 x^k \cdot \theta x^{\theta-1} dx = \theta \int_0^1 x^{k+\theta-1} dx

4. Eksekusi Aljabar

(a) Validasi PDF: 01θxθ1dx=θ[xθθ]01=θ1θ=1\int_0^1 \theta x^{\theta-1}\,dx = \theta \cdot \left[\frac{x^\theta}{\theta}\right]_0^1 = \theta \cdot \frac{1}{\theta} = 1 \quad \checkmark

f(x;θ)=θxθ10f(x;\theta) = \theta x^{\theta-1} \geq 0 untuk x(0,1)x \in (0,1) dan θ>0\theta > 0 ✓. PDF valid untuk semua θ>0\theta > 0.

(b) Distribusi gabungan: fX1,,Xn(x1,,xn;θ)=i=1nθxiθ1=θni=1nxiθ1=θnexp ⁣[(θ1)i=1nlnxi]f_{X_1,\ldots,X_n}(x_1,\ldots,x_n;\theta) = \prod_{i=1}^n \theta x_i^{\theta-1} = \theta^n \prod_{i=1}^n x_i^{\theta-1} = \theta^n \exp\!\left[(\theta-1)\sum_{i=1}^n \ln x_i\right]

untuk 0<xi<10 < x_i < 1, semua ii.

Bentuk terakhir menggunakan xiθ1=exp ⁣[(θ1)lnxi]=exp ⁣[(θ1)lnxi]\prod x_i^{\theta-1} = \exp\!\left[(\theta-1)\ln\prod x_i\right] = \exp\!\left[(\theta-1)\sum \ln x_i\right].

(c) E[X]E[X] dan Var(X)\text{Var}(X):

Momen pertama: E[X]=01xθxθ1dx=θ01xθdx=θ1θ+1=θθ+1E[X] = \int_0^1 x \cdot \theta x^{\theta-1}\,dx = \theta\int_0^1 x^\theta\,dx = \theta\cdot\frac{1}{\theta+1} = \frac{\theta}{\theta+1}

Momen kedua: E[X2]=01x2θxθ1dx=θ01xθ+1dx=θ1θ+2=θθ+2E[X^2] = \int_0^1 x^2 \cdot \theta x^{\theta-1}\,dx = \theta\int_0^1 x^{\theta+1}\,dx = \theta\cdot\frac{1}{\theta+2} = \frac{\theta}{\theta+2}

Variansi: Var(X)=E[X2](E[X])2=θθ+2θ2(θ+1)2\text{Var}(X) = E[X^2] - (E[X])^2 = \frac{\theta}{\theta+2} - \frac{\theta^2}{(\theta+1)^2} =θ[1θ+2θ(θ+1)2]=θ(θ+1)2θ(θ+2)(θ+2)(θ+1)2= \theta\left[\frac{1}{\theta+2} - \frac{\theta}{(\theta+1)^2}\right] = \theta\cdot\frac{(\theta+1)^2 - \theta(\theta+2)}{(\theta+2)(\theta+1)^2}

Hitung pembilang: (θ+1)2θ(θ+2)=θ2+2θ+1θ22θ=1(\theta+1)^2 - \theta(\theta+2) = \theta^2+2\theta+1 - \theta^2 - 2\theta = 1: Var(X)=θ(θ+1)2(θ+2)\text{Var}(X) = \frac{\theta}{(\theta+1)^2(\theta+2)} \quad \checkmark

(d) E[Xˉ]E[\bar{X}] dan Var(Xˉ)\text{Var}(\bar{X}): E[Xˉ]=E[X]=θθ+1E[\bar{X}] = E[X] = \frac{\theta}{\theta+1} Var(Xˉ)=Var(X)n=θn(θ+1)2(θ+2)\text{Var}(\bar{X}) = \frac{\text{Var}(X)}{n} = \frac{\theta}{n(\theta+1)^2(\theta+2)}

(e) Distribusi T=lnXiT = -\ln X_i dan W=i=1nTiW = \sum_{i=1}^n T_i:

Teknik CDF untuk T=lnXT = -\ln X:

Support TT: X(0,1)    T=lnX(0,)X \in (0,1) \implies T = -\ln X \in (0,\infty).

CDF TT untuk t>0t > 0: FT(t)=P(Tt)=P(lnXt)=P(lnXt)=P(Xet)F_T(t) = P(T \leq t) = P(-\ln X \leq t) = P(\ln X \geq -t) = P(X \geq e^{-t}) =1FX(et)=10etθxθ1dx=1[xθ]0et=1eθt= 1 - F_X(e^{-t}) = 1 - \int_0^{e^{-t}} \theta x^{\theta-1}\,dx = 1 - [x^\theta]_0^{e^{-t}} = 1 - e^{-\theta t}

Diferensiasikan: fT(t)=ddt(1eθt)=θeθt,t>0f_T(t) = \frac{d}{dt}(1-e^{-\theta t}) = \theta e^{-\theta t}, \quad t > 0

Ini adalah PDF Exp(θ)\text{Exp}(\theta), sehingga: Ti=lnXiExp(θ)\boxed{T_i = -\ln X_i \sim \text{Exp}(\theta)}

Distribusi W=i=1nTiW = \sum_{i=1}^n T_i:

Karena Tii.i.d.Exp(θ)T_i \overset{\text{i.i.d.}}{\sim} \text{Exp}(\theta) dan penjumlahan nn Eksponensial i.i.d.: W=i=1nTi=i=1n(lnXi)=lni=1nXiΓ(n,θ)W = \sum_{i=1}^n T_i = \sum_{i=1}^n (-\ln X_i) = -\ln\prod_{i=1}^n X_i \sim \Gamma(n,\,\theta)

(parametrisasi laju θ\theta)

E[W]=nθE[W] = \frac{n}{\theta}

5. Verification

  • Untuk θ=1\theta = 1: f(x;1)=1f(x;1) = 1 (Uniform(0,1)(0,1)), E[X]=1/2E[X] = 1/2, Var(X)=1/12\text{Var}(X) = 1/12 — sesuai dengan formula yang diturunkan: E[X]=1/2E[X]=1/2, Var(X)=1/(43)=1/12\text{Var}(X)=1/(4\cdot3)=1/12
  • T=lnXT = -\ln X dari U(0,1)U(0,1): ini adalah hasil baku inverse transform methodTExp(1)T \sim \text{Exp}(1) untuk θ=1\theta=1
  • WΓ(n,θ)W \sim \Gamma(n,\theta): E[W]=n/θE[W] = n/\theta; untuk θ=1\theta=1, E[W]=n=E[lnX1]nE[W] = n = E[-\ln X_1]\cdot n karena E[lnU]=1E[-\ln U] = 1 untuk UU(0,1)U \sim U(0,1)
Exam Tips — Soal C

Target waktu: 18–22 menit Common trap 1: Distribusi gabungan i=1nθxiθ1=θnxiθ1\prod_{i=1}^n \theta x_i^{\theta-1} = \theta^n \prod x_i^{\theta-1} — pastikan mengangkat θn\theta^n ke luar produk dengan benar. Common trap 2: Untuk teknik CDF pada T=lnXT = -\ln X: P(lnXt)P(Xet)P(-\ln X \leq t) \Leftrightarrow P(X \geq e^{-t}) — tanda pertidaksamaan terbalik karena ln-\ln adalah fungsi monoton turun. Common trap 3: Saat menghitung Var(X)\text{Var}(X), jangan lupa bentuk Var=E[X2](E[X])2\text{Var} = E[X^2]-(E[X])^2 — substitusi nilai yang benar dan sederhanakan secara aljabar dengan hati-hati. Shortcut: Hasil T=lnXExp(θ)T = -\ln X \sim \text{Exp}(\theta) untuk XBeta(θ,1)X \sim \text{Beta}(\theta,1) adalah transformasi baku yang berguna — kenali pola ini untuk soal serupa.

Section 5 — Verifikasi & Sanity Check

Validasi Distribusi Sampling

Setiap pernyataan tentang distribusi sampling Xˉ\bar{X} harus memenuhi:

  1. E[Xˉ]=μE[\bar{X}] = \mu (tak-bias): rata-rata dari banyak sampel mendekati parameter populasi ✓
  2. Var(Xˉ)=σ2/n\text{Var}(\bar{X}) = \sigma^2/n: semakin besar nn, distribusi sampling semakin terkonsentrasi ✓
  3. Untuk nn \to \infty: Var(Xˉ)0\text{Var}(\bar{X}) \to 0 — ini adalah manifestasi Hukum Bilangan Besar ✓
Validasi Statistik vs Parameter

Sebelum menulis persamaan probabilitas:

  1. Verifikasi bahwa besaran di dalam P()P(\cdot) adalah variabel acak (statistik), bukan parameter tetap ✓
  2. P(μ>c)P(\mu > c) tidak bermakna jika μ\mu adalah parameter tetap — hanya P(Xˉ>c)P(\bar{X} > c) yang bermakna ✓
  3. xˉ\bar{x} (huruf kecil, terobservasi) adalah bilangan tetap — tidak memiliki distribusi ✓
Validasi Distribusi Gabungan i.i.d.

Distribusi gabungan f(xi;θ)\prod f(x_i;\theta) valid jika:

  1. Setiap f(xi;θ)f(x_i;\theta) adalah PDF/PMF yang valid (non-negatif, ternormalisasi) ✓
  2. Faktorisasi menjadi produk valid karena independensi — jika tidak independen, ada suku tambahan ✓
  3. “Identik” berarti semua menggunakan distribusi yang sama dengan parameter yang sama
Validasi Variansi Sampel S2S^2
  1. E[S2]=σ2E[S^2] = \sigma^2 hanya dengan penyebut n1n-1
  2. S20S^2 \geq 0 selalu — variansi tidak mungkin negatif; jika hasil negatif, ada kesalahan aritmatika ✓
  3. Untuk n=1n=1: S2S^2 tidak terdefinisi (penyebut =0= 0) — diperlukan minimal n2n \geq 2

Metode Alternatif

Ukuran sampel via margin of error: Formula n(zα/2σ/e)2n \geq (z_{\alpha/2}\cdot\sigma/e)^2 memberikan ukuran sampel minimal untuk margin of error ee pada tingkat kepercayaan 1α1-\alpha. Untuk 95%95\%: z0,025=1,96z_{0{,}025} = 1{,}96; untuk 99%99\%: z0,005=2,576z_{0{,}005} = 2{,}576.

Menggunakan MGF untuk distribusi Xˉ\bar{X}: MGF dari Xˉ=Sn/n\bar{X} = S_n/n adalah MXˉ(t)=[MX(t/n)]nM_{\bar{X}}(t) = [M_X(t/n)]^n. Jika MXM_X diketahui, MXˉM_{\bar{X}} dapat dihitung dan dicocokkan dengan distribusi yang dikenal via Uniqueness Theorem — berguna untuk distribusi Normal dan Eksponensial.

Section 6 — Visualisasi Mental

Populasi vs Sampel — Dua Level Ketidakpastian:

Bayangkan sebuah “guci raksasa” berisi bola-bola dengan angka (distribusi populasi f(x;θ)f(x;\theta)). Parameter μ\mu adalah rata-rata semua bola — bilangan tetap tapi tidak kita tahu. Setiap kali kita mengambil nn bola acak, kita mendapat sampel x1,,xnx_1,\ldots,x_n dan menghitung xˉ\bar{x}. Jika proses ini diulang ribuan kali (masing-masing mengambil nn bola baru), nilai xˉ\bar{x} akan berbeda-beda — distribusi dari berbagai xˉ\bar{x} ini adalah distribusi sampling. Semakin besar nn, semakin terkonsentrasi distribusi sampling (lebih kecil variansinya).

Estimator vs Estimasi — Sebelum dan Sesudah Pengamatan:

Sebelum mengambil sampel: Xˉ\bar{X} adalah kurva distribusi — tersebar di sepanjang garis bilangan, mencerminkan ketidakpastian. Setelah mengambil satu sampel: kita mendapat satu titik xˉ\bar{x} pada garis bilangan — ini adalah realizasi tunggal dari distribusi sampling. Proses inferensi: dari xˉ\bar{x} (titik tunggal) kita simpulkan tentang μ\mu (parameter tetap tapi tidak diketahui) menggunakan pengetahuan tentang distribusi sampling Xˉ\bar{X}.

Hubungan Visual ↔ Rumus

Penyempitan distribusi sampling seiring nn bertambah berkorespondensi dengan:

Var(Xˉ)=σ2ndistribusi sampling semakin sempit saat n\text{Var}(\bar{X}) = \frac{\sigma^2}{n} \longleftrightarrow \text{distribusi sampling semakin sempit saat } n \uparrow

Faktorisasi distribusi gabungan berkorespondensi dengan:

f(x1,,xn;θ)=f(xi;θ)setiap bola diambil independen dari guci yang samaf(x_1,\ldots,x_n;\theta) = \prod f(x_i;\theta) \longleftrightarrow \text{setiap bola diambil independen dari guci yang sama}

Tak-bias E[Xˉ]=μE[\bar{X}] = \mu berkorespondensi dengan:

Pusat distribusi sampling=μrata-rata dari banyak xˉ mendekati μ\text{Pusat distribusi sampling} = \mu \longleftrightarrow \text{rata-rata dari banyak } \bar{x} \text{ mendekati } \mu

Section 7 — Jebakan Umum

Kesalahan Parametrisasi

Kesalahan utama — Penyebut nn vs n1n-1 pada variansi sampel:

  • Salah: S2=1n(XiXˉ)2S^2 = \frac{1}{n}\sum(X_i-\bar{X})^2 sebagai estimator tak-bias σ2\sigma^2
  • Benar: S2=1n1(XiXˉ)2S^2 = \frac{1}{n-1}\sum(X_i-\bar{X})^2 — penyebut n1n-1 memberikan E[S2]=σ2E[S^2] = \sigma^2
  • Konteks pengecualian: MLE untuk σ2\sigma^2 pada distribusi Normal menggunakan penyebut nn, tetapi estimator ini bias. Soal CF2 selalu menyebutkan konteks; jika tidak disebutkan, default ke n1n-1.
Kesalahan Konseptual
  1. Mengira parameter θ\theta memiliki distribusi probabilitas. Parameter adalah bilangan tetap (meski tidak diketahui) — ia tidak “acak”. Hanya estimator θ^\hat{\theta} yang merupakan variabel acak dengan distribusi sampling. Menulis P(μ>5)P(\mu > 5) sebagai probabilitas (bukan dalam konteks Bayesian) adalah kategori kesalahan ini.
  2. Mencampur standar error dengan standar deviasi populasi. σ\sigma adalah standar deviasi populasi (ukuran variabilitas satu pengamatan). SE(Xˉ)=σ/n\text{SE}(\bar{X}) = \sigma/\sqrt{n} adalah standar error rata-rata sampel (ukuran variabilitas estimator). Keduanya berbeda dan tidak boleh dipertukarkan.
  3. Mengasumsikan distribusi sampling Xˉ\bar{X} selalu Normal. Distribusi sampling Xˉ\bar{X} persis Normal hanya jika populasi Normal (untuk nn berapapun). Untuk populasi non-Normal, Xˉ\bar{X} hanya mendekati Normal untuk nn besar (CLT) — tidak eksak.
  4. Lupa bahwa rumus Var(Xˉ)=σ2/n\text{Var}(\bar{X}) = \sigma^2/n mensyaratkan independensi. Untuk sampling tanpa pengembalian dari populasi kecil, rumus ini tidak berlaku — diperlukan faktor koreksi populasi terbatas (FPC) seperti pada distribusi Hipergeometrik.
Kesalahan Interpretasi Soal
  • “Estimator” vs “Estimasi”: Estimator adalah aturan/formula (variabel acak); estimasi adalah nilai spesifik setelah pengamatan (bilangan tetap). Soal mungkin meminta “estimator untuk μ\mu” (Xˉ\bar{X} — variabel acak) vs “estimasi untuk μ\mu” (xˉ\bar{x} — bilangan).
  • “Sampel acak” secara default berarti i.i.d. — independen DAN identik terdistribusi. Jika soal menyebut “sampel acak”, asumsikan kedua syarat ini terpenuhi.
  • “Distribusi sampling dari Xˉ\bar{X} — ini berbeda dari “distribusi populasi”. Distribusi sampling adalah distribusi Xˉ\bar{X} (sebagai variabel acak) di atas semua sampel yang mungkin berukuran nn.
Red Flags
  • Soal menyebutkan “sampel berukuran nn” lalu meminta probabilitas tentang Xˉ\bar{X}: Ingat bahwa Xˉ\bar{X} memiliki Var(Xˉ)=σ2/n\text{Var}(\bar{X}) = \sigma^2/n — standarisasinya menggunakan σ/n\sigma/\sqrt{n}, bukan σ\sigma.
  • Soal meminta ukuran sampel nn agar margin of error tertentu terpenuhi: Gunakan formula n(zα/2σ/e)2n \geq (z_{\alpha/2}\cdot\sigma/e)^2 dan bulatkan ke atas.
  • Soal menyebutkan distribusi gabungan f(xi;θ)\prod f(x_i;\theta): Ini adalah fungsi likelihood — petunjuk kuat bahwa soal akan meminta MLE di 4.5 Estimasi Parameter.
  • Soal menyebutkan E[S2]E[S^2] atau “estimator tak-bias”: Segera periksa penyebut — harus n1n-1 untuk tak-bias.
  • Soal meminta distribusi W=TiW = \sum T_i di mana Ti=g(Xi)T_i = g(X_i): Tentukan distribusi TiT_i via transformasi terlebih dahulu, lalu gunakan sifat aditif jika TiT_i i.i.d.

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Sampel acak i.i.d. — distribusi gabungan adalah produk: X1,,Xni.i.d.f(x;θ)    f(x1,,xn;θ)=i=1nf(xi;θ)X_1,\ldots,X_n \overset{\text{i.i.d.}}{\sim} f(x;\theta) \implies f(x_1,\ldots,x_n;\theta) = \prod_{i=1}^n f(x_i;\theta)
  2. Mean sampel — tak-bias, variansi mengecil dengan nn: E[Xˉ]=μ,Var(Xˉ)=σ2n,SE(Xˉ)=σnE[\bar{X}] = \mu, \qquad \text{Var}(\bar{X}) = \frac{\sigma^2}{n}, \qquad \text{SE}(\bar{X}) = \frac{\sigma}{\sqrt{n}}
  3. Variansi sampel — tak-bias dengan penyebut n1n-1: S2=1n1i=1n(XiXˉ)2,E[S2]=σ2S^2 = \frac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})^2, \qquad E[S^2] = \sigma^2
  4. Perbedaan kritis — parameter vs statistik: θ,  μ,  σ2parameter: tetap, tak diketahuivsXˉ,  S2,  θ^statistik: variabel acak, punya distribusi sampling\underbrace{\theta,\;\mu,\;\sigma^2}_{\text{parameter: tetap, tak diketahui}} \quad\text{vs}\quad \underbrace{\bar{X},\;S^2,\;\hat{\theta}}_{\text{statistik: variabel acak, punya distribusi sampling}}
  5. Ukuran sampel minimal untuk margin of error ee pada level 1α1-\alpha: n(zα/2σe)2(bulatkan ke atas)n \geq \left(\frac{z_{\alpha/2}\cdot\sigma}{e}\right)^2 \quad \text{(bulatkan ke atas)}

Kapan Digunakan

  • Trigger keywords: “sampel acak”, “i.i.d.”, “populasi”, “parameter”, “estimator”, “estimasi”, “distribusi sampling”, “mean sampel Xˉ\bar{X}”, “variansi sampel S2S^2”, “standar error”.
  • Tipe skenario soal:
    • Nyatakan distribusi sampling dari Xˉ\bar{X} atau statistik lain untuk sampel dari populasi tertentu.
    • Hitung P(Xˉ>c)P(\bar{X} > c) atau P(Xˉμ<e)P(|\bar{X}-\mu| < e) menggunakan distribusi sampling.
    • Tentukan ukuran sampel minimal nn untuk presisi tertentu.
    • Tulis distribusi gabungan i.i.d. sebagai produk (fondasi untuk fungsi likelihood di MLE).
    • Verifikasi apakah suatu statistik adalah estimator tak-bias via E[θ^]=θE[\hat{\theta}] = \theta.

Kapan TIDAK Boleh Digunakan

  • Jika pengamatan tidak independen: Rumus Var(Xˉ)=σ2/n\text{Var}(\bar{X}) = \sigma^2/n tidak berlaku — ada suku kovariansi. Gunakan metode khusus untuk data dependen (serial, klaster) [BEYOND CF2].
  • Jika distribusi populasi tidak diketahui sama sekali: Inferensi non-parametrik diperlukan [BEYOND CF2].
  • Jika nn kecil dan populasi non-Normal: CLT belum berlaku; distribusi sampling Xˉ\bar{X} tidak Normal. Gunakan hasil eksak dari 4.2 Distribusi Sampel jika tersedia.
  • Jika soal meminta distribusi bersyarat atau joint dari (X1,,Xn)(X_1,\ldots,X_n) untuk variabel dependen: Gunakan teknik dari 3.1 Distribusi Gabungan (Joint Distribution) dan 3.3 Distribusi Bersyarat (Conditional Distribution).

Quick Decision Tree

graph TD
    A["Soal melibatkan sampel acak<br>X1, X2, ..., Xn"] --> B["Apakah pengamatan i.i.d.?"]
    B -->|"Ya"| C["Distribusi gabungan =<br>produk PDF/PMF individual"]
    B -->|"Tidak"| D["Tidak bisa difaktorkan<br>Gunakan distribusi gabungan penuh<br>dari Topik 3"]
    C --> E["Apa yang diminta?"]
    E --> F["Distribusi sampling<br>dari X-bar atau S^2?"]
    E --> G["Probabilitas tentang<br>X-bar atau statistik lain?"]
    E --> H["Ukuran sampel minimal n?"]
    E --> I["Distribusi gabungan<br>untuk likelihood?"]
    F --> F1["E[X-bar] = mu<br>Var(X-bar) = sigma^2/n<br>Jika normal: X-bar ~ N(mu, sigma^2/n) eksak<br>Jika non-normal: CLT untuk n besar"]
    G --> G1["Standarisasi: Z = (X-bar - mu) / (sigma/sqrt(n))<br>Gunakan tabel Phi atau distribusi Gamma/Chi-kuadrat"]
    H --> H1["n >= (z_{alpha/2} * sigma / e)^2<br>Bulatkan ke ATAS"]
    I --> I1["L(theta) = prod f(xi; theta)<br>Digunakan untuk MLE di 4.5"]
    F --> J["Apakah perlu E[S^2]?"]
    J -->|"Ya"| K["E[S^2] = sigma^2<br>dengan penyebut n-1<br>Bukan n"]

Follow-up Options
  1. “Berikan soal variasi: hitung distribusi sampling Xˉ\bar{X} untuk sampel dari distribusi Poisson dan Bernoulli menggunakan MGF”
  2. “Jelaskan hubungan 4.1 Penarikan Sampel Acak dengan 4.3 Teorema Limit Pusat (CLT) — bagaimana CLT membenarkan aproksimasi Normal untuk Xˉ\bar{X} dari distribusi apapun”
  3. “Buat flashcard 1-halaman untuk topik ini”

📖 Ref: Hogg-Tanis-Zimm (2015) Bab 5.1–5.2; Hogg-McKean-Craig (2019) Bab 3.1–3.2; Miller et al. (2014) Bab 8.1–8.2; Walpole et al. (2012) Bab 8.1 | 🗓️ 2026-02-21 | #CF2 #InferensStatistik #SampelAcak #Populasi #Statistik #Estimasi #IID #DistribusiSampel