Penarikan Sampel Acak
📊 4.1 — Penarikan Sampel Acak
Ringkasan Cepat›
Topik: Penarikan Sampel Acak — Konsep Populasi, Sampel, dan Inferensi Statistik | Bobot: ~20–30% | Difficulty: Medium Ref: Hogg-Tanis-Zimm (2015) Bab 5.1–5.2; Hogg-McKean-Craig (2019) Bab 3.1–3.2; Miller et al. (2014) Bab 8.1–8.2; Walpole et al. (2012) Bab 8.1 | Prereq: 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu, 2.6 Distribusi Kontinu Umum, 3.1 Distribusi Gabungan (Joint Distribution)
Section 0 — Pemetaan Topik
| Topik CF2 | Sub-topik ID | Skill Diuji | Bobot | Difficulty | Prerequisite | Connected Topics | Referensi |
|---|---|---|---|---|---|---|---|
| Topik 4: Inferensi Statistik | 4.1 | Mendefinisikan populasi, parameter, sampel acak, dan statistik; membedakan parameter populasi dengan estimator ; memformulasikan distribusi gabungan sampel i.i.d. sebagai produk PDF/PMF; menghitung probabilitas melibatkan statistik sederhana dari sampel; memahami konsep distribusi sampling (sampling distribution) sebagai fondasi inferensi | 20–30% | Medium | 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu, 2.6 Distribusi Kontinu Umum, 3.1 Distribusi Gabungan (Joint Distribution) | 4.2 Distribusi Sampel, 4.3 Teorema Limit Pusat (CLT), 4.4 Hukum Bilangan Besar (LLN), 4.5 Estimasi Parameter, 4.6 Sifat-Sifat Estimator | Hogg-Tanis-Zimm (2015) Bab 5.1–5.2; Hogg-McKean-Craig (2019) Bab 3.1–3.2; Miller et al. (2014) Bab 8.1–8.2; Walpole et al. (2012) Bab 8.1 |
Section 1 — Intuisi
Bayangkan seorang aktuaris ditugaskan untuk memperkirakan rata-rata kerugian klaim kesehatan dari seluruh pemegang polis sebuah perusahaan asuransi besar — katakanlah 500.000 orang. Mustahil secara praktis untuk menghitung kerugian masing-masing dari 500.000 orang tersebut. Yang dilakukan adalah mengambil sampel — misalnya 200 pemegang polis dipilih secara acak, kerugian mereka dicatat, dan dari data 200 orang ini dibuatlah taksiran untuk keseluruhan 500.000. Proses inilah yang disebut inferensi statistik: menarik kesimpulan tentang populasi berdasarkan informasi dari sampel.
Kunci dari seluruh proses ini terletak pada kata “acak”. Jika 200 pemegang polis dipilih sembarangan — misalnya hanya yang mudah dihubungi atau yang klaimnya besar — sampel tidak representatif dan inferensi menjadi cacat. Ketika kita memilih secara acak sederhana dengan pengembalian, setiap pengamatan menjadi variabel acak yang memiliki distribusi yang sama dengan distribusi populasi dan independen satu sama lain. Kondisi i.i.d. (independent and identically distributed) ini adalah fondasi matematis dari hampir seluruh Topik 4: ia memungkinkan distribusi gabungan sampel ditulis sebagai produk PDF/PMF, yang pada gilirannya membuat semua derivasi seperti MLE, distribusi , dan CLT menjadi mungkin.
Konsep terpenting untuk dipahami sejak awal adalah perbedaan antara parameter dan statistik. Parameter — seperti , , atau — adalah bilangan tetap (meski tidak diketahui) yang mendeskripsikan populasi. Statistik — seperti , , atau — adalah fungsi dari data sampel, sehingga ia sendiri merupakan variabel acak yang memiliki distribusinya sendiri, yang disebut distribusi sampling. Memahami bahwa estimator adalah variabel acak, bukan bilangan tetap, adalah lompatan konseptual terpenting dari Topik 2–3 ke Topik 4.
Section 2 — Definisi Formal
Definisi Matematis›
Populasi dan Parameter: Suatu populasi adalah himpunan semua nilai yang mungkin dari besaran yang diamati, dikarakterisasi oleh distribusi probabilitas yang bergantung pada parameter (bisa vektor).
Sampel Acak (Random Sample): disebut sampel acak berukuran dari populasi jika variabel-variabel tersebut independen dan identik terdistribusi (i.i.d.) dengan distribusi :
Distribusi Gabungan Sampel:
Statistik (Statistic): Suatu statistik adalah fungsi yang terukur dari sampel yang tidak bergantung pada parameter yang tidak diketahui. Statistik adalah variabel acak dengan distribusinya sendiri — disebut distribusi sampling (sampling distribution).
Variabel & Parameter
| Simbol | Makna | Catatan |
|---|---|---|
| Parameter populasi | Bilangan tetap tapi tidak diketahui; bisa skalar atau vektor | |
| PDF/PMF populasi | Tergantung parameter ; diketahui bentuknya, tidak diketahui nilai | |
| Ukuran sampel | Jumlah pengamatan; ditetapkan oleh peneliti | |
| Pengamatan ke- dalam sampel | Variabel acak; i.i.d. | |
| Realizasi (nilai terobservasi) dari | Bilangan tetap setelah sampel diambil | |
| Statistik | Variabel acak; fungsi dari sampel; tidak bergantung | |
| Estimator dari | Statistik yang digunakan untuk menduga ; variabel acak | |
| Estimasi (nilai terobservasi dari ) | Bilangan tetap; realisasi dari estimator | |
| Mean sampel | ; statistik paling dasar | |
| Variansi sampel | ; estimator tak-bias |
Rumus Utama
Label: Mean Sampel — statistik ringkas (summary statistic) paling fundamental; estimator alami untuk mean populasi .
Label: Variansi Sampel — penyebut (bukan ) diperlukan agar adalah estimator tak-bias untuk ; ini adalah identitas kritis yang sering diuji.
Label: Distribusi Gabungan Sampel i.i.d. — karena independen, PDF gabungan adalah produk PDF individual; ini adalah fondasi dari fungsi likelihood di 4.5 Estimasi Parameter.
Label: Mean dan Variansi dari Mean Sampel — berlaku untuk semua distribusi populasi dengan dan ; tidak memerlukan asumsi Normalitas.
Label: Tak-Bias Variansi Sampel — penyebut memastikan ini; jika digunakan penyebut , estimator menjadi bias dengan .
Asumsi Eksplisit
- i.i.d.: Setiap independen dari untuk , dan semua memiliki distribusi yang identik . Asumsi ini diperlukan agar distribusi gabungan dapat difaktorkan.
- Distribusi populasi diketahui hingga : Bentuk diasumsikan diketahui (misalnya Normal, Eksponensial); hanya nilai yang tidak diketahui. Inferensi adalah tentang mengestimasi .
- Nilai tetap: Ukuran sampel diasumsikan tetap (bukan acak) sebelum pengamatan dilakukan.
- Sampling dengan pengembalian (atau populasi sangat besar): Asumsi i.i.d. mensyaratkan setiap pengamatan independent — ini valid untuk sampling dengan pengembalian, atau sampling tanpa pengembalian dari populasi yang jauh lebih besar dari (faktor koreksi populasi terbatas dapat diabaikan).
Section 3 — Jembatan Logika
Dari Definisi ke Rumus›
Mengapa distribusi gabungan i.i.d. adalah produk? Ini langsung dari definisi independensi. Untuk kejadian independen : . Analog untuk variabel acak kontinu: jika independen, maka PDF gabungan adalah: “Identik terdistribusi” berarti semua — distribusinya sama. Kombinasi keduanya: setiap adalah “salinan independen” dari variabel acak dengan distribusi populasi yang sama.
Mengapa adalah variabel acak? Karena adalah fungsi dari yang merupakan variabel acak. Sebelum sampel diambil, nilai tidak pasti — ia berdistribusi dengan distribusi samplingnya. Setelah sampel diambil dan terobservasi, barulah menjadi bilangan tetap (estimasi, bukan estimator).
Perbedaan Kritis: Parameter vs Statistik›
| Parameter () | Statistik () | |
|---|---|---|
| Sifat | Bilangan tetap, tidak diketahui | Variabel acak |
| Bergantung pada | Distribusi populasi | Data sampel |
| Contoh | , , , | , , , |
| Distribusi | Tidak memiliki distribusi (tetap) | Memiliki distribusi sampling |
| Nilai berubah? | Tidak (tetap per populasi) | Ya, berubah antar sampel berbeda |
Setiap kali Anda melihat atau dalam persamaan probabilitas seperti , ingat bahwa ini adalah probabilitas atas variabel acak — bukan probabilitas tentang bilangan tetap.
Derivasi dan :
Karena i.i.d. dengan dan :
(Langkah kedua pada variansi menggunakan independensi — tanpa independensi, ada suku kovariansi yang tidak hilang.)
Derivasi (justifikasi penyebut ):
Ambil nilai harapan:
Gunakan dan :
Sehingga:
Jika menggunakan penyebut (yaitu ), maka — bias ke bawah.
Dilarang›
- Dilarang menyebut sebagai “nilai tetap” atau “angka” sebelum sampel diambil. Sebelum pengamatan, adalah variabel acak dengan distribusi samplingnya. Setelah sampel terobservasi, (huruf kecil) adalah realizasinya yang merupakan bilangan tetap.
- Dilarang menggunakan penyebut pada variansi sampel jika tujuannya adalah estimator tak-bias . Penyebut menghasilkan estimator yang bias (underestimate). Gunakan untuk estimasi; hanya digunakan dalam konteks tertentu seperti Maximum Likelihood Estimator untuk distribusi Normal (yang memang bias).
- Dilarang menerapkan tanpa asumsi independensi. Rumus ini mensyaratkan untuk . Untuk sampling tanpa pengembalian dari populasi kecil, ada faktor koreksi populasi terbatas yang harus diaplikasikan.
Section 4 — Contoh Soal
Soal A — Fundamental
Sebuah perusahaan asuransi memodelkan waktu tunggu (dalam hari) hingga klaim pertama mengikuti distribusi Eksponensial dengan parameter laju (tidak diketahui). Seorang aktuaris mengambil sampel acak dari 5 pemegang polis independen dan memperoleh nilai terobservasi:
(a) Nyatakan distribusi populasi dan identifikasi parameter yang tidak diketahui. (b) Tuliskan distribusi gabungan secara eksplisit. (c) Hitung dan dari data terobservasi. (d) Tentukan dan dalam bentuk . (e) Jika diketahui (yaitu rata-rata populasi 10 hari), hitung menggunakan fakta bahwa .
Solusi Soal A›
1. Identifikasi Variabel
- ,
- Realisasi terobservasi:
- Parameter yang tidak diketahui:
2. Identifikasi Distribusi / Model Sampel acak i.i.d. dari Eksponensial. Distribusi gabungan = produk PDF Eksponensial. Mean sampel berdistribusi setelah dikalikan .
3. Setup Persamaan
PDF Eksponensial: ,
Distribusi gabungan (produk karena i.i.d.):
4. Eksekusi Aljabar
(a) Distribusi populasi: Parameter yang tidak diketahui: (laju klaim). Mean populasi .
(b) Distribusi gabungan:
(c) Menghitung dan :
Deviasi dari mean:
| 1 | 12 | ||
| 2 | 7 | ||
| 3 | 19 | ||
| 4 | 4 | ||
| 5 | 8 | ||
| Total |
(d) dan dalam :
Untuk : dan .
(e) dengan :
Karena dan di mana :
Gunakan hubungan Gamma–Poisson (karena ):
5. Verification
- : rata-rata populasi dengan adalah — sampel ini menghasilkan estimasi tepat di nilai parameter ✓
- : variansi populasi dengan adalah ; variansi sampel dari hanya 5 pengamatan memang bisa jauh dari nilai populasi ✓
- : dengan dan di atas 12 (0{,}2 SD di atas mean untuk Gamma dengan ), probabilitas sekitar 28,5% masuk akal ✓
- Distribusi gabungan: — ini adalah fungsi likelihood yang akan digunakan di 4.5 Estimasi Parameter untuk menurunkan MLE ✓
Exam Tips — Soal A›
Target waktu: 10–12 menit Common trap 1: Saat menghitung , gunakan penyebut , bukan . Soal CF2 sering menguji apakah kandidat menggunakan estimator tak-bias. Common trap 2: Untuk bagian (e), — ini adalah probabilitas tentang mean sampel (variabel acak yang berbeda dari individual). Shortcut: Distribusi gabungan i.i.d. selalu dapat ditulis sebagai — untuk Eksponensial ini menghasilkan , bentuk yang sangat berguna untuk likelihood.
Soal B — Exam-Typical
Klaim asuransi jiwa (dalam juta rupiah) dari suatu portofolio mengikuti distribusi . Seorang aktuaris mengambil sampel acak dan memperoleh .
(a) Nyatakan distribusi sampling dari untuk sampel berukuran . (b) Hitung jika nilai sebenarnya . (c) Hitung jika . (d) Berapa ukuran sampel minimal yang diperlukan agar ? (e) Jelaskan interpretasi dari : apakah ini parameter atau statistik? Apakah ini estimator atau estimasi?
Solusi Soal B›
1. Identifikasi Variabel
- ,
- ;
- tidak diketahui (parameter yang akan diestimasi)
2. Identifikasi Distribusi / Model Sampel i.i.d. dari Normal — distribusi sampling adalah Normal eksak (bukan hanya aproksimasi CLT) karena populasi Normal.
3. Setup Persamaan
Distribusi sampling:
Standarisasi:
4. Eksekusi Aljabar
(a) Distribusi sampling : dengan standar error .
(b) dengan :
Standarisasi batas:
(c) dengan :
(d) Ukuran sampel minimal untuk :
Syarat: :
Ukuran sampel minimal: (dibulatkan ke atas).
(e) Interpretasi :
- (huruf besar) adalah statistik — variabel acak yang merupakan fungsi dari sampel ; ini adalah estimator untuk .
- (huruf kecil) adalah estimasi — realizasi terobservasi dari statistik setelah 25 pengamatan dilakukan; ini adalah bilangan tetap.
- adalah parameter — bilangan tetap (tapi tidak diketahui) yang diestimasi oleh .
- Ringkasan: adalah estimator (variabel acak), adalah estimasi (realisasi), adalah parameter (target inferensi).
5. Verification
- : lebih kecil dari — rata-rata dari 25 pengamatan jauh lebih stabil dari pengamatan tunggal ✓
- : melebihi satu SE () dari mean, probabilitas sekitar 21% cukup masuk akal ✓
- : untuk mengurangi SE menjadi , dan — tepat memenuhi syarat ✓
Exam Tips — Soal B›
Target waktu: 12–15 menit Common trap 1: Standar error adalah , bukan (itu variansinya) dan bukan . Untuk soal ini: . Common trap 2: Untuk bagian (d), setelah mendapat , bulatkan ke atas menjadi 246 — bukan ke bawah. Ukuran sampel harus memenuhi ketidaksamaan, bukan hanya mendekatinya. Common trap 3: digunakan karena kita membutuhkan , yang berarti — persentil ke-97,5 dari . Shortcut: Formula ukuran sampel: di mana adalah margin of error — hafalkan bentuk ini untuk soal penentuan .
Soal C — Challenging
Misalkan adalah sampel acak i.i.d. dari distribusi dengan PDF:
(a) Verifikasi bahwa adalah PDF yang valid untuk semua . (b) Tuliskan distribusi gabungan dan sederhanakan. (c) Tunjukkan bahwa dan . (d) Nyatakan dan sebagai fungsi dari dan . (e) Misalkan untuk satu pengamatan . Tunjukkan bahwa menggunakan teknik transformasi, lalu tentukan distribusi dan .
Solusi Soal C›
1. Identifikasi Variabel
- pada — ini adalah distribusi Beta atau Power distribution
- Parameter: ; Support:
2. Identifikasi Distribusi / Model Distribusi power (pangkat) pada . Transformasi mengubahnya menjadi Eksponensial — teknik transformasi dari 2.4 Transformasi Variabel Acak Univariat.
3. Setup Persamaan
Validasi:
Momen:
4. Eksekusi Aljabar
(a) Validasi PDF:
untuk dan ✓. PDF valid untuk semua .
(b) Distribusi gabungan:
untuk , semua .
Bentuk terakhir menggunakan .
(c) dan :
Momen pertama:
Momen kedua:
Variansi:
Hitung pembilang: :
(d) dan :
(e) Distribusi dan :
Teknik CDF untuk :
Support : .
CDF untuk :
Diferensiasikan:
Ini adalah PDF , sehingga:
Distribusi :
Karena dan penjumlahan Eksponensial i.i.d.:
(parametrisasi laju )
5. Verification
- Untuk : (Uniform), , — sesuai dengan formula yang diturunkan: , ✓
- dari : ini adalah hasil baku inverse transform method — untuk ✓
- : ; untuk , karena untuk ✓
Exam Tips — Soal C›
Target waktu: 18–22 menit Common trap 1: Distribusi gabungan — pastikan mengangkat ke luar produk dengan benar. Common trap 2: Untuk teknik CDF pada : — tanda pertidaksamaan terbalik karena adalah fungsi monoton turun. Common trap 3: Saat menghitung , jangan lupa bentuk — substitusi nilai yang benar dan sederhanakan secara aljabar dengan hati-hati. Shortcut: Hasil untuk adalah transformasi baku yang berguna — kenali pola ini untuk soal serupa.
Section 5 — Verifikasi & Sanity Check
Validasi Distribusi Sampling›
Setiap pernyataan tentang distribusi sampling harus memenuhi:
- (tak-bias): rata-rata dari banyak sampel mendekati parameter populasi ✓
- : semakin besar , distribusi sampling semakin terkonsentrasi ✓
- Untuk : — ini adalah manifestasi Hukum Bilangan Besar ✓
Validasi Statistik vs Parameter›
Sebelum menulis persamaan probabilitas:
- Verifikasi bahwa besaran di dalam adalah variabel acak (statistik), bukan parameter tetap ✓
- tidak bermakna jika adalah parameter tetap — hanya yang bermakna ✓
- (huruf kecil, terobservasi) adalah bilangan tetap — tidak memiliki distribusi ✓
Validasi Distribusi Gabungan i.i.d.›
Distribusi gabungan valid jika:
- Setiap adalah PDF/PMF yang valid (non-negatif, ternormalisasi) ✓
- Faktorisasi menjadi produk valid karena independensi — jika tidak independen, ada suku tambahan ✓
- “Identik” berarti semua menggunakan distribusi yang sama dengan parameter yang sama ✓
Validasi Variansi Sampel ›
- hanya dengan penyebut ✓
- selalu — variansi tidak mungkin negatif; jika hasil negatif, ada kesalahan aritmatika ✓
- Untuk : tidak terdefinisi (penyebut ) — diperlukan minimal ✓
Metode Alternatif
Ukuran sampel via margin of error: Formula memberikan ukuran sampel minimal untuk margin of error pada tingkat kepercayaan . Untuk : ; untuk : .
Menggunakan MGF untuk distribusi : MGF dari adalah . Jika diketahui, dapat dihitung dan dicocokkan dengan distribusi yang dikenal via Uniqueness Theorem — berguna untuk distribusi Normal dan Eksponensial.
Section 6 — Visualisasi Mental
Populasi vs Sampel — Dua Level Ketidakpastian:
Bayangkan sebuah “guci raksasa” berisi bola-bola dengan angka (distribusi populasi ). Parameter adalah rata-rata semua bola — bilangan tetap tapi tidak kita tahu. Setiap kali kita mengambil bola acak, kita mendapat sampel dan menghitung . Jika proses ini diulang ribuan kali (masing-masing mengambil bola baru), nilai akan berbeda-beda — distribusi dari berbagai ini adalah distribusi sampling. Semakin besar , semakin terkonsentrasi distribusi sampling (lebih kecil variansinya).
Estimator vs Estimasi — Sebelum dan Sesudah Pengamatan:
Sebelum mengambil sampel: adalah kurva distribusi — tersebar di sepanjang garis bilangan, mencerminkan ketidakpastian. Setelah mengambil satu sampel: kita mendapat satu titik pada garis bilangan — ini adalah realizasi tunggal dari distribusi sampling. Proses inferensi: dari (titik tunggal) kita simpulkan tentang (parameter tetap tapi tidak diketahui) menggunakan pengetahuan tentang distribusi sampling .
Hubungan Visual ↔ Rumus
Penyempitan distribusi sampling seiring bertambah berkorespondensi dengan:
Faktorisasi distribusi gabungan berkorespondensi dengan:
Tak-bias berkorespondensi dengan:
Section 7 — Jebakan Umum
Kesalahan Parametrisasi›
Kesalahan utama — Penyebut vs pada variansi sampel:
- Salah: sebagai estimator tak-bias
- Benar: — penyebut memberikan
- Konteks pengecualian: MLE untuk pada distribusi Normal menggunakan penyebut , tetapi estimator ini bias. Soal CF2 selalu menyebutkan konteks; jika tidak disebutkan, default ke .
Kesalahan Konseptual›
- Mengira parameter memiliki distribusi probabilitas. Parameter adalah bilangan tetap (meski tidak diketahui) — ia tidak “acak”. Hanya estimator yang merupakan variabel acak dengan distribusi sampling. Menulis sebagai probabilitas (bukan dalam konteks Bayesian) adalah kategori kesalahan ini.
- Mencampur standar error dengan standar deviasi populasi. adalah standar deviasi populasi (ukuran variabilitas satu pengamatan). adalah standar error rata-rata sampel (ukuran variabilitas estimator). Keduanya berbeda dan tidak boleh dipertukarkan.
- Mengasumsikan distribusi sampling selalu Normal. Distribusi sampling persis Normal hanya jika populasi Normal (untuk berapapun). Untuk populasi non-Normal, hanya mendekati Normal untuk besar (CLT) — tidak eksak.
- Lupa bahwa rumus mensyaratkan independensi. Untuk sampling tanpa pengembalian dari populasi kecil, rumus ini tidak berlaku — diperlukan faktor koreksi populasi terbatas (FPC) seperti pada distribusi Hipergeometrik.
Kesalahan Interpretasi Soal›
- “Estimator” vs “Estimasi”: Estimator adalah aturan/formula (variabel acak); estimasi adalah nilai spesifik setelah pengamatan (bilangan tetap). Soal mungkin meminta “estimator untuk ” ( — variabel acak) vs “estimasi untuk ” ( — bilangan).
- “Sampel acak” secara default berarti i.i.d. — independen DAN identik terdistribusi. Jika soal menyebut “sampel acak”, asumsikan kedua syarat ini terpenuhi.
- “Distribusi sampling dari ” — ini berbeda dari “distribusi populasi”. Distribusi sampling adalah distribusi (sebagai variabel acak) di atas semua sampel yang mungkin berukuran .
Red Flags›
- Soal menyebutkan “sampel berukuran ” lalu meminta probabilitas tentang : Ingat bahwa memiliki — standarisasinya menggunakan , bukan .
- Soal meminta ukuran sampel agar margin of error tertentu terpenuhi: Gunakan formula dan bulatkan ke atas.
- Soal menyebutkan distribusi gabungan : Ini adalah fungsi likelihood — petunjuk kuat bahwa soal akan meminta MLE di 4.5 Estimasi Parameter.
- Soal menyebutkan atau “estimator tak-bias”: Segera periksa penyebut — harus untuk tak-bias.
- Soal meminta distribusi di mana : Tentukan distribusi via transformasi terlebih dahulu, lalu gunakan sifat aditif jika i.i.d.
Section 8 — Ringkasan Eksekutif
Must-Remember›
- Sampel acak i.i.d. — distribusi gabungan adalah produk:
- Mean sampel — tak-bias, variansi mengecil dengan :
- Variansi sampel — tak-bias dengan penyebut :
- Perbedaan kritis — parameter vs statistik:
- Ukuran sampel minimal untuk margin of error pada level :
Kapan Digunakan
- Trigger keywords: “sampel acak”, “i.i.d.”, “populasi”, “parameter”, “estimator”, “estimasi”, “distribusi sampling”, “mean sampel ”, “variansi sampel ”, “standar error”.
- Tipe skenario soal:
- Nyatakan distribusi sampling dari atau statistik lain untuk sampel dari populasi tertentu.
- Hitung atau menggunakan distribusi sampling.
- Tentukan ukuran sampel minimal untuk presisi tertentu.
- Tulis distribusi gabungan i.i.d. sebagai produk (fondasi untuk fungsi likelihood di MLE).
- Verifikasi apakah suatu statistik adalah estimator tak-bias via .
Kapan TIDAK Boleh Digunakan
- Jika pengamatan tidak independen: Rumus tidak berlaku — ada suku kovariansi. Gunakan metode khusus untuk data dependen (serial, klaster)
[BEYOND CF2]. - Jika distribusi populasi tidak diketahui sama sekali: Inferensi non-parametrik diperlukan
[BEYOND CF2]. - Jika kecil dan populasi non-Normal: CLT belum berlaku; distribusi sampling tidak Normal. Gunakan hasil eksak dari 4.2 Distribusi Sampel jika tersedia.
- Jika soal meminta distribusi bersyarat atau joint dari untuk variabel dependen: Gunakan teknik dari 3.1 Distribusi Gabungan (Joint Distribution) dan 3.3 Distribusi Bersyarat (Conditional Distribution).
Quick Decision Tree
graph TD
A["Soal melibatkan sampel acak<br>X1, X2, ..., Xn"] --> B["Apakah pengamatan i.i.d.?"]
B -->|"Ya"| C["Distribusi gabungan =<br>produk PDF/PMF individual"]
B -->|"Tidak"| D["Tidak bisa difaktorkan<br>Gunakan distribusi gabungan penuh<br>dari Topik 3"]
C --> E["Apa yang diminta?"]
E --> F["Distribusi sampling<br>dari X-bar atau S^2?"]
E --> G["Probabilitas tentang<br>X-bar atau statistik lain?"]
E --> H["Ukuran sampel minimal n?"]
E --> I["Distribusi gabungan<br>untuk likelihood?"]
F --> F1["E[X-bar] = mu<br>Var(X-bar) = sigma^2/n<br>Jika normal: X-bar ~ N(mu, sigma^2/n) eksak<br>Jika non-normal: CLT untuk n besar"]
G --> G1["Standarisasi: Z = (X-bar - mu) / (sigma/sqrt(n))<br>Gunakan tabel Phi atau distribusi Gamma/Chi-kuadrat"]
H --> H1["n >= (z_{alpha/2} * sigma / e)^2<br>Bulatkan ke ATAS"]
I --> I1["L(theta) = prod f(xi; theta)<br>Digunakan untuk MLE di 4.5"]
F --> J["Apakah perlu E[S^2]?"]
J -->|"Ya"| K["E[S^2] = sigma^2<br>dengan penyebut n-1<br>Bukan n"]
Follow-up Options›
- “Berikan soal variasi: hitung distribusi sampling untuk sampel dari distribusi Poisson dan Bernoulli menggunakan MGF”
- “Jelaskan hubungan 4.1 Penarikan Sampel Acak dengan 4.3 Teorema Limit Pusat (CLT) — bagaimana CLT membenarkan aproksimasi Normal untuk dari distribusi apapun”
- “Buat flashcard 1-halaman untuk topik ini”
📖 Ref: Hogg-Tanis-Zimm (2015) Bab 5.1–5.2; Hogg-McKean-Craig (2019) Bab 3.1–3.2; Miller et al. (2014) Bab 8.1–8.2; Walpole et al. (2012) Bab 8.1 | 🗓️ 2026-02-21 | #CF2 #InferensStatistik #SampelAcak #Populasi #Statistik #Estimasi #IID #DistribusiSampel