Variabel Acak Diskrit
📊 2.1 — Variabel Acak Diskrit
Ringkasan Cepat›
Topik: Variabel Acak Diskrit | Bobot: ~25–35% | Difficulty: Medium Ref: Hogg-Tanis-Zimm Bab 2.1–2.2; Miller Bab 3.1–3.4, 4.1 | Prereq: 1.1 Eksperimen Acak dan Ruang Sampel, 1.2 Aksioma dan Perhitungan Probabilitas
Section 0 — Pemetaan Topik
| Topik CF2 | Sub-topik ID | Skill Diuji | Bobot | Difficulty | Prerequisite | Connected Topics | Referensi |
|---|---|---|---|---|---|---|---|
| Topik 2: Variabel Acak Univariat | 2.1 | Mendefinisikan PMF dan CDF diskrit; menghitung , , momen ke-; menerapkan LOTUS; menentukan distribusi fungsi dari variabel acak diskrit | 25–35% | Medium | 1.1 Eksperimen Acak dan Ruang Sampel, 1.2 Aksioma dan Perhitungan Probabilitas | 2.2 Variabel Acak Kontinu, 2.3 Fungsi Pembangkit, 2.4 Transformasi Variabel Acak Univariat, 2.5 Distribusi Diskrit Umum, 3.1 Distribusi Gabungan (Joint Distribution) | Hogg-Tanis-Zimm (2015) Bab 2.1–2.2; Miller et al. (2014) Bab 3.1–3.4, 4.1 |
Section 1 — Intuisi
Bayangkan seorang aktuaris yang menganalisis klaim harian sebuah perusahaan asuransi. Dalam satu hari, bisa saja terdapat 0 klaim, 1 klaim, 2 klaim, dan seterusnya — tetapi tidak mungkin ada 1,5 klaim. Hasil yang bisa dihitung satu per satu seperti inilah yang memotivasi konsep variabel acak diskrit: sebuah variabel yang hanya mengambil nilai-nilai terhitung (countable), seperti bilangan bulat non-negatif. Tidak ada nilai “di antara” yang mungkin terjadi.
Untuk bisa bekerja dengan variabel acak ini secara matematis, kita perlu cara untuk mendeskripsikan seberapa sering setiap nilai muncul. Inilah peran fungsi massa probabilitas (PMF): ia menetapkan probabilitas untuk setiap nilai yang mungkin. Misalnya, jika peluang mendapat 0 klaim adalah 40%, 1 klaim adalah 35%, dan 2 klaim adalah 25%, maka PMF tersebut secara lengkap mendeskripsikan ketidakpastian dalam sistem. Selanjutnya, fungsi distribusi kumulatif (CDF) menjawab pertanyaan berbeda: “berapa peluang mendapat paling banyak klaim?” — yakni dengan menjumlahkan semua probabilitas dari 0 hingga .
Yang paling penting secara praktis adalah ukuran ringkas: nilai harapan (mean) yang memberitahu kita angka klaim rata-rata per hari, dan variansi yang mengukur seberapa berfluktuasi angka klaim tersebut di sekitar rata-rata. Dua angka ini — dan — adalah fondasi untuk penentuan premi, cadangan teknis, dan hampir seluruh pemodelan risiko aktuaria. Menguasai cara menghitung dan menginterpretasikannya dari PMF adalah keterampilan paling fundamental di seluruh Topik 2.
Section 2 — Definisi Formal
Definisi Matematis›
Suatu variabel acak diskrit adalah fungsi sedemikian sehingga himpunan nilainya bersifat terhitung (countable).
Fungsi Massa Probabilitas (PMF):
Fungsi Distribusi Kumulatif (CDF):
Nilai Harapan (Mean):
Variansi:
Variabel & Parameter
| Simbol | Makna | Catatan |
|---|---|---|
| Variabel acak diskrit | Fungsi dari ke | |
| Support: himpunan semua nilai yang mungkin dari | Harus terhitung (countable) | |
| atau | Fungsi massa probabilitas (PMF) | untuk semua ; |
| atau | Fungsi distribusi kumulatif (CDF) | Non-decreasing; right-continuous; ; |
| atau | Nilai harapan (mean) | Pusat distribusi secara rata-rata |
| Momen ke- tentang nol (raw moment) | ||
| Momen ke- sentral (central moment) | ||
| atau | Variansi | Mengukur penyebaran di sekitar |
| Standar deviasi | Satuan sama dengan | |
| Fungsi dari variabel acak | Digunakan dalam LOTUS |
Rumus Utama
Label: Syarat Normalisasi PMF — jumlah seluruh probabilitas harus tepat sama dengan 1; ini adalah syarat perlu dan cukup bagi suatu fungsi non-negatif untuk menjadi PMF yang valid.
Label: CDF dari PMF — CDF diperoleh dengan menjumlahkan (bukan mengintegrasikan) PMF dari nilai terkecil hingga .
Label: Probabilitas Interval dari CDF — untuk ; perhatikan tanda di sisi kiri (eksklusif) dan di sisi kanan (inklusif) untuk variabel diskrit.
Label: LOTUS (Law of the Unconscious Statistician) — nilai harapan dari fungsi dihitung langsung dari PMF tanpa perlu menentukan distribusi terlebih dahulu.
Label: Rumus Komputasional Variansi — lebih efisien secara komputasi dibanding definisi langsung; berlaku selalu.
Label: Sifat Variansi terhadap Transformasi Linear — konstanta aditif tidak memengaruhi variansi; konstanta multiplikatif dikuadratkan.
Label: Linieritas Nilai Harapan — berlaku untuk semua variabel acak (diskrit maupun kontinu), tidak memerlukan independensi.
Asumsi Eksplisit
- Support terhitung: adalah himpunan terhitung (bisa hingga maupun tak hingga terhitung seperti ).
- Existensi nilai harapan: terdefinisi jika dan hanya jika .
- Existensi variansi: terdefinisi jika dan hanya jika , yang mengimplikasikan juga terdefinisi.
- PMF non-negatif: untuk semua , dan untuk .
Section 3 — Jembatan Logika
Dari Definisi ke Rumus›
PMF adalah titik awal segalanya. Dari PMF, semua ukuran ringkas dapat diturunkan. CDF hanyalah “akumulasi” PMF dari kiri: — bayangkan menumpuk batang-batang histogram dari kiri ke kanan. Nilai harapan adalah rata-rata tertimbang dari semua nilai yang mungkin, di mana bobotnya adalah probabilitasnya sendiri — ini persis analogi dengan rata-rata tertimbang yang kita kenal dari statistika deskriptif. Variansi adalah nilai harapan dari “jarak kuadrat” ke mean — LOTUS langsung memberikan .
Support dan Domain›
- Support : himpunan semua dengan . Di luar support, .
- Support bisa hingga (e.g., untuk dadu) atau tak hingga terhitung (e.g., untuk distribusi Poisson).
- CDF untuk variabel diskrit adalah fungsi tangga (step function): konstan di antara nilai-nilai support, melompat sebesar tepat di setiap .
- bersifat right-continuous: , bukan .
Derivasi Rumus Komputasional Variansi:
Mulai dari definisi:
Ekspansi kuadrat:
Terapkan linieritas nilai harapan:
Substitusi :
Sehingga:
Derivasi LOTUS:
Misalkan dan . Untuk setiap nilai yang mungkin diambil , . Maka:
Langkah terakhir menggunakan fakta bahwa setiap berkontribusi tepat sekali dalam penjumlahan ganda tersebut.
Dilarang›
- Dilarang menggunakan integral untuk menghitung atau dari variabel acak diskrit — variabel diskrit menggunakan , bukan . Integral hanya untuk variabel kontinu.
- Dilarang menghitung sebagai untuk variabel diskrit ketika batas bawah inklusif — rumus yang benar adalah jika adalah bilangan bulat, atau lebih aman: langsung dari PMF.
- Dilarang menyimpulkan bahwa hanya karena — variansi nol berarti adalah konstanta hampir pasti, bukan karena meannya nol.
Section 4 — Contoh Soal
Soal A — Fundamental
Sebuah dadu tidak imbang (biased die) memiliki enam sisi dengan nilai 1 hingga 6. PMF-nya didefinisikan sebagai untuk , di mana adalah konstanta. Tentukan: (a) nilai , (b) , (c) , dan (d) .
Solusi Soal A›
1. Identifikasi Variabel
- Variabel acak: nilai yang muncul pada satu lemparan dadu tidak imbang
- Support:
- PMF: , parameter tidak diketahui
2. Identifikasi Distribusi / Model
- Variabel acak diskrit dengan support hingga
- Syarat normalisasi digunakan untuk menentukan
3. Setup Persamaan
Dari syarat normalisasi:
4. Eksekusi Aljabar
(a) Menentukan :
Maka untuk .
(b) :
(c) :
(d) :
Pertama hitung :
Kemudian:
5. Verification
- ✓ dan ✓
- : masuk akal karena dadu condong ke nilai besar (nilai kecil dapat probabilitas kecil), sehingga ✓
- (mean dadu seimbang): konsisten karena sisi besar lebih “berat” ✓
- ✓
Exam Tips — Soal A›
- Target waktu: 4–5 menit
- Common trap: Menghitung untuk dan lupa bahwa , bukan . Langkah paling rentan error: pastikan kamu mengalikan dengan , sehingga suku-suku menjadi .
- Shortcut : Gunakan formula untuk . Di sini : ✓
Soal B — Exam-Typical
Seorang manajer risiko memodelkan jumlah kecelakaan kerja per minggu di suatu pabrik dengan variabel acak yang memiliki PMF:
(a) Tentukan nilai sehingga valid sebagai PMF. (b) Hitung . (c) Hitung , atau tentukan apakah terdefinisi. (d) Tentukan CDF dalam bentuk ekspresi tertutup.
Solusi Soal B›
1. Identifikasi Variabel
- Variabel acak: jumlah kecelakaan kerja per minggu
- Support: (tak hingga terhitung)
- PMF: , parameter tidak diketahui
2. Identifikasi Distribusi / Model
- Variabel acak diskrit dengan support tak hingga
- Kunci: gunakan dekomposisi pecahan parsial (deret teleskopik)
3. Setup Persamaan
Syarat normalisasi:
4. Eksekusi Aljabar
(a) Menentukan :
Dekomposisi parsial:
Maka , sehingga .
PMF valid: untuk
(b) :
(c) :
Deret ini adalah deret harmonik yang divergen (). Dengan demikian, tidak terdefinisi (tidak hingga).
(d) CDF untuk :
Jadi: untuk , dan untuk .
5. Verification
- ✓
- non-decreasing dan saat ✓
- ✓ (konsisten dengan hasil di atas)
- tidak terdefinisi: konsisten karena ekor distribusi cukup berat ( yang borderline)
Exam Tips — Soal B›
- Target waktu: 8–10 menit
- Common trap 1: Langsung mencoba menghitung numerik tanpa menguji konvergensinya — selalu cek dulu apakah deret konvergen sebelum menyimpulkan terdefinisi.
- Common trap 2: Tidak mengenali deret teleskopik. Jika PMF berbentuk , segera gunakan dekomposisi parsial.
- Shortcut CDF teleskopik: Untuk support dengan PMF bentuk teleskopik, CDF hampir selalu punya ekspresi tertutup sederhana.
Soal C — Challenging
Suatu perusahaan asuransi menggunakan variabel acak untuk memodelkan jumlah klaim pada suatu polis dalam satu tahun, dengan PMF:
Didefinisikan variabel acak baru (yang merepresentasikan jumlah klaim yang dibayar perusahaan, karena polis hanya menanggung maksimal 2 klaim). (a) Tentukan PMF dari . (b) Hitung dan . (c) Hitung menggunakan LOTUS langsung dari PMF . (d) Verifikasi konsistensi antara hasil (b) dan (c).
Solusi Soal C›
1. Identifikasi Variabel
- dalam parametrisasi jumlah kegagalan sebelum sukses pertama, dengan (peluang “sukses” = polis tidak klaim). PMF: untuk
- : support
2. Identifikasi Distribusi / Model
- Transformasi variabel acak diskrit melalui fungsi
- Distribusi diperoleh dengan mengelompokkan semua ke nilai
3. Setup Persamaan
4. Eksekusi Aljabar
(a) PMF dari :
Verifikasi: ✓
PMF :
| 0 | 1 | 2 | |
|---|---|---|---|
(b) dan :
(c) langsung via LOTUS dari PMF :
Karena , maka . Terapkan LOTUS pada :
Pecah berdasarkan nilai :
(sifat distribusi geometrik: )
(d) Verifikasi Konsistensi:
Hasil (b): (dari PMF langsung) Hasil (c): (dari LOTUS pada PMF ) ✓
Kedua metode memberikan hasil yang sama, mengkonfirmasi kebenaran perhitungan.
5. Verification
- : berada antara 0 dan 2 (batas support ), masuk akal ✓
- ✓
- : konsisten karena ✓
Exam Tips — Soal C›
- Target waktu: 12–15 menit
- Common trap 1 (Transformasi ): Mengabaikan bahwa , bukan . Nilai “menampung” semua .
- Common trap 2 (LOTUS vs distribusi baru): Banyak kandidat menghabiskan waktu menentukan distribusi terpisah, padahal LOTUS memungkinkan langsung menghitung dari PMF asal.
- Shortcut geometrik: Untuk dengan parametrisasi ini, — hafalkan untuk komputasi cepat.
Section 5 — Verifikasi & Sanity Check
Validasi PMF›
- Non-negativitas: untuk semua . Jika ada satu nilai , fungsi tersebut bukan PMF valid.
- Normalisasi: (tepat, bukan ). Jika hasilnya , cek kembali apakah support sudah lengkap atau ada suku yang terlewat.
- Batas: untuk setiap secara individu.
Validasi CDF Diskrit›
- Non-decreasing: jika . CDF diskrit berbentuk tangga yang tidak pernah turun.
- Batas kiri dan kanan: dan .
- Konsistensi dengan PMF: Lompatan di tepat sebesar , yaitu .
- Probabilitas interval: untuk bilangan bulat.
Validasi dan ›
- berada dalam rentang support: Jika , maka . Jika keluar dari rentang ini, ada kesalahan perhitungan.
- selalu. Hasil negatif pasti salah. Variansi nol adalah konstanta hampir pasti.
- Cek batas: untuk variabel dengan support (batas Popoviciu).
- Konsistensi rumus: (selalu benar, analogous dengan ).
Metode Alternatif
Metode Langsung vs Metode Komputasional untuk :
Metode Langsung (definisi):
Lebih intuitif, tetapi perlu menghitung terlebih dahulu dan melibatkan kuadrat dari selisih. Lebih rentan kesalahan aritmetik.
Metode Komputasional:
Lebih cepat: hitung dan secara terpisah, lalu kurangkan. Pada ujian, ini biasanya lebih efisien.
Menggunakan PGF untuk dan [terhubung ke 2.3 Fungsi Pembangkit]:
Jika adalah fungsi pembangkit probabilitas, maka:
Section 6 — Visualisasi Mental
Histogram PMF:
Bayangkan grafik batang (bar chart) dengan sumbu X = nilai-nilai support dan sumbu Y = probabilitas . Setiap batang berdiri tepat di bilangan bulat (atau nilai diskrit lainnya) — tidak ada batang di antara nilai-nilai tersebut. Tinggi batang di tepat sama dengan . Total luas (tinggi semua batang dijumlah, karena lebar = 1) sama dengan 1. Mean adalah titik keseimbangan (balance point) dari histogram ini — bayangkan histogram sebagai papan jungkit dan adalah titik tumpunya.
Grafik CDF sebagai Fungsi Tangga:
Grafik dengan sumbu X = nilai real dan sumbu Y = , berkisar dari 0 hingga 1. Fungsi ini berupa garis-garis horizontal yang melompat ke atas setiap kali melewati nilai support . Tinggi lompatan di tepat sebesar . Di antara dua nilai support yang berurutan, konstan (tidak berubah). Fungsi ini right-continuous: nilai di titik lompatan menggunakan nilai setelah lompatan (kurva “menutup” ke kanan).
Hubungan Visual ↔ Rumus
Setiap batang histogram di dengan tinggi berkontribusi satu suku dalam penjumlahan:
Setiap lompatan di CDF di titik berukuran tepat :
Variansi adalah ukuran “penyebaran” histogram: distribusi yang tersebar lebar (banyak batang jauh dari mean) memiliki variansi besar; distribusi yang terkonsentrasi di sekitar mean memiliki variansi kecil.
Section 7 — Jebakan Umum
Kesalahan Parametrisasi›
Kesalahan 1 — PMF vs PDF: Menggunakan (integral) alih-alih (penjumlahan) untuk menghitung CDF dari variabel diskrit.
Salah:
Benar:
Kesalahan 2 — Parametrisasi Geometrik: Distribusi Geometrik memiliki dua parametrisasi umum: untuk (jumlah percobaan hingga sukses pertama) dan untuk (jumlah kegagalan sebelum sukses pertama). Keduanya “Geometrik” tetapi berbeda ( vs ). Selalu periksa support sebelum menggunakan formula.
Kesalahan Konseptual›
- untuk variabel diskrit ketika batas bawah inklusif. Rumus yang benar jika adalah . Paling aman: hitung langsung atau gunakan jika adalah bilangan bulat.
- Mengasumsikan secara umum. Ini hanya benar jika adalah fungsi linear. Untuk fungsi non-linear (seperti atau ), harus gunakan LOTUS.
- Menyamakan support terhitung (countable) dengan support hingga (finite). Support bisa terhitung tak hingga (e.g., ) — PMF tetap valid selama konvergen.
- Lupa memeriksa existensi sebelum menghitung. Jika , maka tidak terdefinisi — kesimpulan numerik apapun tidak valid.
Kesalahan Interpretasi Soal›
- “Paling banyak ” — gunakan CDF langsung.
- “Lebih dari ” — komplemen, bukan .
- “Tepat ” — ambil langsung dari PMF.
- “Paling sedikit ” — perhatikan , bukan .
- Kebingungan antara dan adalah salah satu jebakan paling sering di soal CF2.
Red Flags›
- PMF berbentuk atau : Selalu cek normalisasi dulu untuk menentukan ; jangan asumsikan nilai atau langsung menghitung momen.
- Support tak hingga : Hati-hati memeriksa konvergensi sebelum menyimpulkan ada.
- Soal meminta di mana non-linear: Jangan pernah substitusi ke dalam ; wajib gunakan LOTUS.
- Kata “terdefinisi” (defined) atau “ada” (exists): Soal sedang menguji apakah kamu memeriksa konvergensi, bukan langsung menghitung.
- PMF diberikan hingga konstanta atau : Langkah pertama selalu tentukan konstanta dari syarat normalisasi sebelum melanjutkan ke bagian lain.
Section 8 — Ringkasan Eksekutif
Must-Remember›
- PMF valid jika dan hanya jika:
- CDF dari PMF (penjumlahan, bukan integral):
- Nilai harapan (rata-rata tertimbang):
- Rumus komputasional variansi (lebih efisien):
- LOTUS — nilai harapan fungsi dari variabel acak:
Kapan Digunakan
- Trigger keywords: “jumlah”, “frekuensi”, “berapa banyak”, “probabilitas distribusi”, “PMF”, “fungsi massa”, “nilai harapan”, “rata-rata”, “variansi”, “momen ke-”.
- Tipe skenario soal:
- Diberikan PMF (eksplisit atau hingga konstanta), hitung , , .
- Tentukan apakah fungsi yang diberikan adalah PMF valid.
- Hitung untuk fungsi tertentu menggunakan LOTUS.
- Tentukan PMF dari transformasi dan hitung momennya.
- Interpretasikan CDF diskrit (fungsi tangga).
Kapan TIDAK Boleh Digunakan
- Jika variabel acak bersifat kontinu (misalnya “waktu”, “berat”, “tinggi”): gunakan 2.2 Variabel Acak Kontinu dengan PDF dan integral, bukan PMF dan penjumlahan.
- Jika soal meminta MGF: Walaupun tetap menggunakan definisi yang sama, penanganan MGF dan sifat-sifatnya dibahas di 2.3 Fungsi Pembangkit.
- Jika distribusi gabungan dua variabel acak atau lebih dibutuhkan: Beralih ke 3.1 Distribusi Gabungan (Joint Distribution).
Quick Decision Tree
graph TD
A["Variabel acak X diberikan"] --> B["Apakah nilai X dapat<br>dihitung satu per satu?"]
B -->|"Ya (diskrit)"| C["Gunakan PMF p(x)"]
B -->|"Tidak (kontinu)"| D["Gunakan PDF f(x)<br>lihat 2.2"]
C --> E["Apa yang dicari?"]
E --> F["Validasi PMF?"]
E --> G["Probabilitas P(X di A)?"]
E --> H["Nilai harapan E[g(X)]?"]
E --> I["Variansi Var(X)?"]
F --> F1["Cek: semua p(x)>=0<br>dan jumlah = 1"]
G --> G1["Jumlahkan p(x)<br>untuk x di A<br>atau gunakan CDF F(x)"]
H --> H1["LOTUS:<br>jumlahkan g(x) * p(x)"]
I --> I1["Hitung E[X] dan E[X^2]<br>via LOTUS, lalu Var = E[X^2] - (E[X])^2"]
Follow-up Options›
- “Berikan contoh soal variasi PMF dengan support tak hingga dan uji konvergensi momen”
- “Jelaskan hubungan 2.1 Variabel Acak Diskrit dengan 2.3 Fungsi Pembangkit (PGF dan MGF)”
- “Buat flashcard 1-halaman untuk topik ini”
📖 Ref: Hogg-Tanis-Zimm (2015) Bab 2.1–2.2; Miller et al. (2014) Bab 3.1–3.4, 4.1 | 🗓️ 2026-02-21 | #CF2 #VariabelAcak #Diskrit #PMF #CDF #ExpectedValue #Variansi