Distribusi Marginal
📊 3.2 — Distribusi Marginal
Ringkasan Cepat›
Topik: Distribusi Marginal | Bobot: ~20–30% | Difficulty: Medium Ref: Hogg-McKean-Craig (2019) Bab 2.1–2.2; Miller et al. (2014) Bab 3.5–3.7, 4.6–4.7 | Prereq: 3.1 Distribusi Gabungan (Joint Distribution), 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu
Section 0 — Pemetaan Topik
| Topik CF2 | Sub-topik ID | Skill Diuji | Bobot | Difficulty | Prerequisite | Connected Topics | Referensi |
|---|---|---|---|---|---|---|---|
| Topik 3: Variabel Acak Multivariat | 3.2 | Menurunkan PMF/PDF marginal dari distribusi joint; menghitung CDF marginal; menghitung , dari distribusi marginal; mengenali support marginal; membedakan marginal vs bersyarat vs joint | 20–30% | Medium | 3.1 Distribusi Gabungan (Joint Distribution), 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu | 3.3 Distribusi Bersyarat (Conditional Distribution), 3.4 Nilai Harapan dan Variansi Bersyarat, 3.5 Independensi dan Korelasi, 3.7 Distribusi Majemuk (Compound Distribution) | Hogg-McKean-Craig (2019) Bab 2.1–2.2; Miller et al. (2014) Bab 3.5–3.7, 4.6–4.7, 5.8–5.9 |
Section 1 — Intuisi
Bayangkan sebuah perusahaan asuransi jiwa memiliki data gabungan tentang dua variabel untuk setiap nasabah: = usia nasabah saat pengajuan polis (dalam tahun), dan = jumlah klaim dalam satu tahun. Distribusi joint dari memberikan gambaran lengkap tentang hubungan antara kedua variabel — misalnya, berapa peluang seorang nasabah berusia 40 tahun mengajukan tepat 2 klaim. Namun sering kali, seorang aktuaris hanya perlu menjawab pertanyaan yang lebih sederhana: “Berapa distribusi usia nasabah, tanpa mempedulikan berapa klaim yang mereka ajukan?” Inilah fungsi distribusi marginal: ia “menarik keluar” distribusi satu variabel saja dari distribusi joint, dengan cara mengakumulasikan (menjumlahkan atau mengintegrasikan) semua kemungkinan nilai variabel lainnya.
Istilah “marginal” sendiri berasal dari kebiasaan lama statistikawan yang menuliskan distribusi satu variabel di margin (tepi luar) tabel distribusi gabungan — kolom paling kanan dan baris paling bawah berisi total baris dan total kolom, yang persis merupakan distribusi marginal masing-masing variabel. Operasi yang dilakukan adalah “meringkas” dimensi yang tidak diinginkan: untuk kasus diskrit, kita menjumlahkan sepanjang dimensi tersebut; untuk kasus kontinu, kita mengintegrasikan. Hasilnya adalah fungsi satu variabel — PMF atau PDF — yang berperilaku persis seperti distribusi univariat biasa.
Dalam konteks aktuaria, distribusi marginal sangat penting ketika kita ingin memodelkan risiko dari satu sumber saja (misalnya, hanya frekuensi klaim tanpa mempertimbangkan keparahan), atau ketika kita ingin memeriksa apakah dua variabel risiko saling independen. Jika distribusi marginal dari dan dikalikan menghasilkan distribusi joint, maka dan independen — dan penyederhanaan besar dalam pemodelan dapat dilakukan. Kemampuan menurunkan dan menginterpretasikan distribusi marginal adalah fondasi untuk topik 3.3 Distribusi Bersyarat (Conditional Distribution), 3.4 Nilai Harapan dan Variansi Bersyarat, dan 3.5 Independensi dan Korelasi.
Section 2 — Definisi Formal
Definisi Matematis›
Misalkan adalah pasangan variabel acak dengan distribusi joint. Distribusi marginal dari diperoleh dengan mengakumulasikan distribusi joint terhadap seluruh nilai .
Kasus Diskrit — PMF Marginal :
Kasus Diskrit — PMF Marginal :
Kasus Kontinu — PDF Marginal :
Kasus Kontinu — PDF Marginal :
CDF Marginal (berlaku umum):
Variabel & Parameter
| Simbol | Makna | Catatan |
|---|---|---|
| Variabel acak dalam pasangan | Bisa diskrit, kontinu, atau campuran | |
| Support marginal dari dan | Support marginal bisa berbeda dari support joint | |
| PMF joint dari (kasus diskrit) | ; | |
| PDF joint dari (kasus kontinu) | ; | |
| PMF marginal dari | Fungsi satu variabel; | |
| PDF marginal dari | Fungsi satu variabel; | |
| CDF joint dari | ||
| CDF marginal dari | ||
| Nilai harapan dari distribusi marginal | atau |
Rumus Utama
Label: Marginalisasi Diskrit — jumlahkan PMF joint atas semua nilai untuk mendapatkan PMF marginal ; setiap baris dalam tabel joint dijumlahkan ke kolom margin.
Label: Marginalisasi Kontinu — integrasikan PDF joint atas variabel untuk mendapatkan PDF marginal ; batas integrasi harus menggunakan support aktual dari , bukan selalu hingga .
Label: CDF Marginal dari CDF Joint — ambil limit CDF joint ketika ; secara intuitif, kita mengizinkan mengambil semua nilai hingga .
Label: Validasi Distribusi Marginal — distribusi marginal yang diturunkan dengan benar selalu merupakan distribusi valid (PMF atau PDF yang sah).
Label: Nilai Harapan dari Marginal (ekuivalensi) — nilai harapan fungsi dapat dihitung langsung dari marginal atau dari joint; hasilnya identik.
Asumsi Eksplisit
- Support joint terdefinisi: (atau subset-nya) harus terdefinisi dengan jelas sebelum marginalisasi dilakukan.
- Konvergensi/keabsolutan: Untuk kasus diskrit, ; untuk kasus kontinu, — keduanya otomatis terpenuhi jika distribusi joint valid.
- Batas integrasi bergantung support: Ketika support joint adalah region non-rectangular (misal ), batas integrasi dalam marginalisasi bergantung pada variabel yang dipertahankan, bukan selalu hingga .
- Marginal tidak menentukan joint secara unik: Dua distribusi joint yang berbeda bisa menghasilkan marginal yang sama; oleh karena itu, mengetahui kedua marginal tidak cukup untuk menentukan distribusi joint kecuali ada informasi tambahan (misal: independensi).
Section 3 — Jembatan Logika
Dari Definisi ke Rumus›
Distribusi joint atau mendeskripsikan probabilitas untuk setiap pasangan . Ketika kita ingin distribusi saja, kita tidak peduli nilai yang mana — kita ingin semua kemungkinan digabungkan. Untuk kasus diskrit, “menggabungkan” berarti menjumlahkan: adalah total probabilitas semua kejadian untuk setiap yang mungkin. Untuk kasus kontinu, “menggabungkan” berarti mengintegrasikan: karena probabilitas bukan lagi diberikan oleh nilai fungsi tunggal melainkan oleh luas di bawah kurva. Ide dasarnya sama: kita “hapus” variabel dengan merangkum semua kemungkinannya.
Support dan Domain — Peringatan Batas Non-Rectangular›
Batas integrasi (atau batas penjumlahan) dalam marginalisasi harus mengikuti support joint yang sebenarnya. Jika support joint adalah suatu region, bukan persegi panjang, maka batas bervariasi:
Contoh: Jika hanya untuk , maka:
Batas bawah integrasi adalah (bukan ), dan batas atas integrasi adalah (bukan ). Menggunakan batas yang salah adalah kesalahan paling umum dalam soal CF2 bertopik distribusi marginal.
Derivasi Marginal dari Prinsip Probabilitas Total:
Mulai dari aksioma: probabilitas kejadian adalah total probabilitas dari semua pasangan untuk semua . Untuk kasus diskrit:
Dari sini, turunannya adalah PMF marginal:
Ini adalah hukum probabilitas total yang diterapkan pada : .
Untuk kasus kontinu, argumen yang analog menggunakan properti integral. CDF joint memenuhi:
Mendiferensialkan terhadap menghasilkan PDF marginal:
di mana pertukaran urutan diferensiasi dan integrasi dijustifikasi oleh teorema diferensiasi di bawah tanda integral (kondisi regularitas standar terpenuhi untuk distribusi yang valid di CF2).
Dilarang›
- Dilarang menggunakan batas secara membabi-buta ketika support joint terbatas atau non-rectangular — selalu gambar region support terlebih dahulu dan tentukan batas integrasi yang benar untuk setiap variabel yang dipertahankan.
- Dilarang menyimpulkan distribusi joint dari kedua marginalnya tanpa informasi tambahan — produk dari dua marginal sama dengan joint hanya jika dan independen (lihat 3.5 Independensi dan Korelasi).
- Dilarang menggunakan distribusi marginal sebagai distribusi bersyarat — kecuali dan independen; keduanya adalah fungsi yang berbeda dengan interpretasi yang berbeda.
Section 4 — Contoh Soal
Soal A — Fundamental
Misalkan adalah pasangan variabel acak diskrit dengan PMF joint sebagai berikut:
| 0.10 | 0.15 | 0.05 | |
| 0.20 | 0.25 | 0.10 | |
| 0.05 | 0.05 | 0.05 |
(a) Tentukan PMF marginal dari dan . (b) Hitung dan menggunakan distribusi marginal .
Solusi Soal A›
1. Identifikasi Variabel
- ,
- Total probabilitas: ✓
2. Identifikasi Distribusi / Model
- Variabel acak diskrit bivariat dengan PMF joint eksplisit.
- Marginalisasi dilakukan dengan menjumlahkan baris (untuk marginal ) atau kolom (untuk marginal ).
3. Setup Persamaan
4. Eksekusi Aljabar
PMF Marginal (jumlahkan tiap baris):
Cek: ✓
PMF Marginal (jumlahkan tiap kolom):
Cek: ✓
Menghitung :
Menghitung via LOTUS:
Menghitung :
5. Verification
- Distribusi marginal valid: semua dan jumlah = 1. ✓
- berada di antara nilai minimum (1) dan maksimum (3). ✓
- , dan distribusi cukup terkonsentrasi di , sehingga variansi kecil adalah masuk akal. ✓
Exam Tips — Soal A›
- Target waktu: 3–4 menit untuk bagian (a) + (b).
- Common trap: Menjumlahkan kolom untuk marginal (seharusnya baris) atau sebaliknya. Ingat: marginal → jumlahkan arah → jumlahkan baris (baris = nilai konstan, kolom = nilai bervariasi).
- Shortcut verifikasi: Jumlah semua entri PMF joint harus = 1; jumlah semua nilai marginal harus = 1; jika tidak, ada kesalahan penjumlahan.
Soal B — Exam-Typical
Misalkan memiliki PDF joint:
(a) Tentukan PDF marginal dan . (b) Hitung dan menggunakan distribusi marginal .
Solusi Soal B›
1. Identifikasi Variabel
- Support joint: — region segitiga di bawah diagonal dan di atas garis .
- Untuk marginalisasi, perlu menentukan batas variabel yang diintegrasikan sebagai fungsi variabel yang dipertahankan.
2. Identifikasi Distribusi / Model
- Distribusi kontinu bivariat dengan support non-rectangular (segitiga).
- Verifikasi: ✓
3. Setup Persamaan
Untuk : tetap, bervariasi dari hingga (karena syarat ):
Untuk : tetap, bervariasi dari hingga (karena syarat ):
4. Eksekusi Aljabar
PDF Marginal :
PDF Marginal :
Menghitung :
Menghitung :
Menghitung :
5. Verification
- untuk ✓; ✓
- untuk ✓; ✓
- masuk akal: karena dan , ekspektasi seharusnya lebih besar dari ✓
- ✓
Exam Tips — Soal B›
- Target waktu: 6–8 menit.
- Common trap paling kritis: Menggunakan batas hingga untuk — ini salah karena mengabaikan syarat . Batas bawah integrasi untuk adalah , bukan !
- Common trap kedua: Menggunakan batas hingga untuk — ini juga salah. Batas atas untuk adalah , bukan .
- Strategi: Selalu gambar region support di kertas sebelum menulis integral. Garis , , membentuk segitiga — identifikasi dengan jelas mana batas bawah dan atas untuk setiap variabel.
Soal C — Challenging
Misalkan memiliki PDF joint:
(a) Tentukan nilai konstanta . (b) Tentukan PDF marginal dan . (c) Tentukan apakah dan independen. (d) Hitung .
Solusi Soal C›
1. Identifikasi Variabel
- Support joint: — persegi satuan (rectangular support, batas tidak saling bergantung).
- Parameter belum diketahui; harus ditentukan dari syarat normalisasi.
2. Identifikasi Distribusi / Model
- Distribusi kontinu bivariat dengan support rectangular.
- Dengan support rectangular, marginalisasi lebih sederhana (batas integrasi tidak bergantung variabel yang dipertahankan).
3. Setup Persamaan
(a) Menentukan :
(b) PDF marginal:
(d) Kovariasi:
4. Eksekusi Aljabar
(a) Nilai :
(b) PDF Marginal :
PDF Marginal :
(c) Uji Independensi:
dan independen jika dan hanya jika untuk semua .
Sementara:
Karena (misalnya di : ), maka dan tidak independen.
(d) Menghitung :
:
:
(dari distribusi joint):
:
5. Verification
- ✓
- ✓
- : masuk akal secara intuitif karena PDF joint memberikan bobot lebih pada area di mana kecil dan besar (suku dalam lebih dominan ketika besar), mengindikasikan korelasi negatif lemah. ✓
- : juga masuk akal karena PDF memberikan lebih banyak bobot pada nilai-nilai besar (fungsi meningkat dalam ). ✓
Exam Tips — Soal C›
- Target waktu: 10–12 menit.
- Common trap — konstanta : Selalu tentukan di langkah pertama; jangan lanjutkan ke marginal sebelum diketahui.
- Common trap — uji independensi: Jangan cukup memeriksa satu titik saja — gunakan argumen bahwa harus dapat ditulis sebagai produk fungsi- dan fungsi- semata (faktorisasi). Di sini, tidak dapat difaktorkan sebagai , sehingga dan tidak independen.
- Shortcut kovariasi: Gunakan ; hitung langsung dari distribusi joint (bukan dari marginal), karena kovariasi adalah konsep joint.
Section 5 — Verifikasi & Sanity Check
Validasi Distribusi Marginal›
- Setelah menghitung atau , verifikasi bahwa (kontinu) atau (diskrit).
- Semua nilai PMF/PDF marginal harus non-negatif pada seluruh support.
- dari marginal harus berada di antara nilai minimum dan maksimum support .
Konsistensi dengan Joint›
- dihitung dari marginal harus sama dengan dihitung langsung dari joint :
- dari marginal harus sama dengan dari joint.
Cek Independensi›
- Jika dan independen, maka untuk semua .
- Jika dan independen, maka , sehingga .
- Perhatian: tidak menjamin independensi (lihat 3.5 Independensi dan Korelasi).
Cek Support Marginal›
- Support marginal adalah proyeksi support joint ke sumbu-: .
- Untuk support non-rectangular, support marginal bisa berbeda dari “batas luar” yang terlihat sekilas.
Metode Alternatif
Untuk kasus diskrit: Alih-alih menjumlahkan baris/kolom secara manual, gunakan tabel joint lengkap — isi margin baris (jumlah tiap baris) = marginal ; isi margin kolom (jumlah tiap kolom) = marginal . Lebih sistematis dan mengurangi risiko melewatkan suku.
Untuk CDF marginal dari CDF joint: Gunakan langsung jika CDF joint sudah tersedia, tanpa perlu menurunkan PDF joint terlebih dahulu.
Section 6 — Visualisasi Mental
Bayangkan permukaan joint sebagai “gunung” di atas bidang : PDF joint membentuk permukaan tiga dimensi di atas bidang . Sumbu X dan Y adalah nilai-nilai variabel; sumbu Z adalah densitas probabilitas. Total volume di bawah permukaan = 1.
Marginalisasi sebagai “proyeksi” ke satu sumbu: PDF marginal adalah bayangan (proyeksi) permukaan gunung ke sumbu-X. Secara teknis, adalah tinggi total irisan vertikal di konstan — yaitu, adalah “luas penampang” gunung jika dipotong tegak lurus sumbu-Y. Sumbu X adalah nilai ; sumbu vertikal adalah . Kurva yang dihasilkan adalah kurva distribusi univariat biasa (bisa unimodal, miring, dll.).
Untuk kasus diskrit, bayangkan tabel sebagai grid probabilitas: Setiap sel berisi . Marginal adalah total tiap baris (ditulis di kolom kanan) dan total tiap kolom (ditulis di baris bawah) — persis seperti tabel frekuensi dua-arah di statistika deskriptif.
Hubungan Visual ↔ Rumus
Proyeksi sumbu-X dari permukaan joint integrasi terhadap :
Lompatan di CDF joint ketika dengan tetap CDF marginal:
Jumlah margin baris di tabel diskrit penjumlahan PMF joint sepanjang kolom:
Section 7 — Jebakan Umum
Kesalahan Parametrisasi›
Kesalahan Batas Integrasi Non-Rectangular:
Salah: Untuk dengan , menghitung
Benar:
Selalu periksa: batas integrasi untuk bergantung pada nilai yang dipegang tetap jika support joint bukan persegi panjang.
Kesalahan Konseptual›
- Mengira marginal menentukan joint secara unik. Dua distribusi joint yang sama sekali berbeda bisa memiliki marginal yang identik. Contoh: distribusi joint dengan korelasi dan distribusi joint dengan korelasi bisa memiliki marginal normal yang sama.
- Menggunakan sebagai . Distribusi marginal adalah distribusi tanpa kondisi apapun pada . Distribusi bersyarat adalah distribusi ketika diketahui — ini adalah fungsi yang berbeda (lihat 3.3 Distribusi Bersyarat (Conditional Distribution)).
- Menghitung dari marginal. tidak bisa dihitung dari dan saja (kecuali independen). Harus gunakan distribusi joint: .
- Lupa bahwa support marginal adalah proyeksi dari support joint. Jika support joint adalah , maka support marginal adalah (bukan , karena tidak lagi ada di marginal).
Kesalahan Interpretasi Soal›
- “Distribusi ” tanpa konteks lebih lanjut → biasanya berarti distribusi marginal dari , bukan bersyarat.
- “Distribusi given ” → selalu berarti distribusi bersyarat (lihat 3.3 Distribusi Bersyarat (Conditional Distribution)), bukan marginal.
- ” dan tidak berkorelasi” → , tetapi ini tidak berarti dan independen. Independensi lebih kuat dari non-korelasi.
- Soal meminta “apakah dan independen?” → wajib verifikasi untuk semua , bukan hanya satu titik.
Red Flags›
- Support joint berbentuk segitiga atau non-rectangular (kata kunci: "", "", ""): wajib gambar region support terlebih dahulu; batas integrasi untuk marginalisasi pasti bergantung pada variabel yang dipertahankan.
- PDF joint mengandung faktor campuran (seperti , , ): cek apakah bisa difaktorkan sebagai — jika ya, dan independen; jika tidak, tidak independen.
- Soal meminta atau : ini adalah kuantitas joint, harus gunakan distribusi joint, bukan marginal.
- Konstanta normalisasi belum diketahui: langkah pertama selalu tentukan ; tindakan yang tepat adalah menulis dan menyelesaikan untuk sebelum melanjutkan.
Section 8 — Ringkasan Eksekutif
Must-Remember›
- Marginalisasi diskrit (jumlahkan arah variabel yang dihilangkan):
- Marginalisasi kontinu (integrasikan arah variabel yang dihilangkan): di mana adalah batas integrasi yang mungkin bergantung pada .
- CDF marginal dari CDF joint:
- Independensi faktorisasi joint:
- harus dihitung dari joint, bukan dari marginal:
Kapan Digunakan
- Trigger keywords: “distribusi saja”, “distribusi marginal”, “tanpa memperhatikan ”, “tentukan PMF/PDF dari ”, “hitung dari distribusi bersama”.
- Tipe skenario soal:
- Diberikan PMF/PDF joint (eksplisit atau dengan konstanta), turunkan distribusi marginal satu variabel.
- Hitung momen (, ) dari distribusi marginal yang diturunkan.
- Tentukan apakah dua variabel independen menggunakan faktorisasi joint = produk marginal.
- Diberikan CDF joint, turunkan CDF marginal.
Kapan TIDAK Boleh Digunakan
- Jika soal menanyakan distribusi “given ”: Ini adalah distribusi bersyarat, bukan marginal. Gunakan 3.3 Distribusi Bersyarat (Conditional Distribution).
- Jika soal meminta , , atau : Kuantitas ini membutuhkan distribusi joint, bukan marginal. Marginalisasi menghilangkan informasi tentang ketergantungan antar variabel.
- Jika hanya satu variabel diberikan tanpa konteks joint: Tidak ada yang perlu “dimarginalisasikan” — gunakan langsung teknik univariat dari 2.1 Variabel Acak Diskrit atau 2.2 Variabel Acak Kontinu.
Quick Decision Tree
graph TD
A["Diberikan distribusi joint f_XY atau p_XY"] --> B["Apa yang dicari?"]
B --> C["Distribusi satu variabel saja"]
B --> D["Distribusi satu variabel given variabel lain"]
B --> E["Apakah X dan Y independen?"]
B --> F["Cov atau rho X,Y"]
C --> G["Gunakan marginalisasi:<br>jumlahkan atau integrasikan<br>terhadap variabel yang dihilangkan"]
G --> H["Apakah support rectangular?"]
H -->|"Ya"| I["Batas integrasi tetap,<br>tidak bergantung variabel lain"]
H -->|"Tidak"| J["Gambar region support!<br>Batas bergantung variabel<br>yang dipertahankan"]
D --> K["Gunakan distribusi bersyarat:<br>f_XY dibagi f_Y<br>lihat 3.3"]
E --> L["Hitung f_X dan f_Y,<br>lalu cek f_XY = f_X * f_Y<br>untuk semua x,y"]
F --> M["Hitung E[XY] dari joint,<br>E[X] dan E[Y] dari marginal,<br>lalu Cov = E[XY] - E[X]E[Y]"]
Follow-up Options›
- “Berikan contoh soal distribusi marginal dengan support non-rectangular berbentuk parabola atau lingkaran”
- “Jelaskan hubungan 3.2 Distribusi Marginal dengan 3.3 Distribusi Bersyarat (Conditional Distribution) melalui rumus Bayes kontinu”
- “Buat flashcard 1-halaman untuk topik ini”
📖 Ref: Hogg-McKean-Craig (2019) Bab 2.1–2.2; Miller et al. (2014) Bab 3.5–3.7, 4.6–4.7, 5.8–5.9 | 🗓️ 2026-02-21 | #CF2 #Multivariat #Marginal #PMF #PDF #Marginalisasi