PAI · AAMAI · 2026
Aktuaria
Indonesia
CF2 · Materi 3.2

Distribusi Marginal

2026-02-21 Medium Bobot: 20–30% Hogg-McKean-Craig (2019) Bab 2.1–2.2; Miller et al. (2014) Bab 3.5–3.7, 4.6–4.7, 5.8–5.9
CF2ProbabilitasStatistikaMultivariatMarginalPMFPDFCDFMarginalisasi

📊 3.2 — Distribusi Marginal

Ringkasan Cepat

Topik: Distribusi Marginal | Bobot: ~20–30% | Difficulty: Medium Ref: Hogg-McKean-Craig (2019) Bab 2.1–2.2; Miller et al. (2014) Bab 3.5–3.7, 4.6–4.7 | Prereq: 3.1 Distribusi Gabungan (Joint Distribution), 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 3: Variabel Acak Multivariat3.2Menurunkan PMF/PDF marginal dari distribusi joint; menghitung CDF marginal; menghitung E[X]E[X], Var(X)\text{Var}(X) dari distribusi marginal; mengenali support marginal; membedakan marginal vs bersyarat vs joint20–30%Medium3.1 Distribusi Gabungan (Joint Distribution), 2.1 Variabel Acak Diskrit, 2.2 Variabel Acak Kontinu3.3 Distribusi Bersyarat (Conditional Distribution), 3.4 Nilai Harapan dan Variansi Bersyarat, 3.5 Independensi dan Korelasi, 3.7 Distribusi Majemuk (Compound Distribution)Hogg-McKean-Craig (2019) Bab 2.1–2.2; Miller et al. (2014) Bab 3.5–3.7, 4.6–4.7, 5.8–5.9

Section 1 — Intuisi

Bayangkan sebuah perusahaan asuransi jiwa memiliki data gabungan tentang dua variabel untuk setiap nasabah: XX = usia nasabah saat pengajuan polis (dalam tahun), dan YY = jumlah klaim dalam satu tahun. Distribusi joint dari (X,Y)(X, Y) memberikan gambaran lengkap tentang hubungan antara kedua variabel — misalnya, berapa peluang seorang nasabah berusia 40 tahun mengajukan tepat 2 klaim. Namun sering kali, seorang aktuaris hanya perlu menjawab pertanyaan yang lebih sederhana: “Berapa distribusi usia nasabah, tanpa mempedulikan berapa klaim yang mereka ajukan?” Inilah fungsi distribusi marginal: ia “menarik keluar” distribusi satu variabel saja dari distribusi joint, dengan cara mengakumulasikan (menjumlahkan atau mengintegrasikan) semua kemungkinan nilai variabel lainnya.

Istilah “marginal” sendiri berasal dari kebiasaan lama statistikawan yang menuliskan distribusi satu variabel di margin (tepi luar) tabel distribusi gabungan — kolom paling kanan dan baris paling bawah berisi total baris dan total kolom, yang persis merupakan distribusi marginal masing-masing variabel. Operasi yang dilakukan adalah “meringkas” dimensi yang tidak diinginkan: untuk kasus diskrit, kita menjumlahkan sepanjang dimensi tersebut; untuk kasus kontinu, kita mengintegrasikan. Hasilnya adalah fungsi satu variabel — PMF atau PDF — yang berperilaku persis seperti distribusi univariat biasa.

Dalam konteks aktuaria, distribusi marginal sangat penting ketika kita ingin memodelkan risiko dari satu sumber saja (misalnya, hanya frekuensi klaim tanpa mempertimbangkan keparahan), atau ketika kita ingin memeriksa apakah dua variabel risiko saling independen. Jika distribusi marginal dari XX dan YY dikalikan menghasilkan distribusi joint, maka XX dan YY independen — dan penyederhanaan besar dalam pemodelan dapat dilakukan. Kemampuan menurunkan dan menginterpretasikan distribusi marginal adalah fondasi untuk topik 3.3 Distribusi Bersyarat (Conditional Distribution), 3.4 Nilai Harapan dan Variansi Bersyarat, dan 3.5 Independensi dan Korelasi.

Section 2 — Definisi Formal

Definisi Matematis

Misalkan (X,Y)(X, Y) adalah pasangan variabel acak dengan distribusi joint. Distribusi marginal dari XX diperoleh dengan mengakumulasikan distribusi joint terhadap seluruh nilai YY.

Kasus Diskrit — PMF Marginal XX:

pX(x)=yYpX,Y(x,y),xXp_X(x) = \sum_{y \in \mathcal{Y}} p_{X,Y}(x, y), \quad x \in \mathcal{X}

Kasus Diskrit — PMF Marginal YY:

pY(y)=xXpX,Y(x,y),yYp_Y(y) = \sum_{x \in \mathcal{X}} p_{X,Y}(x, y), \quad y \in \mathcal{Y}

Kasus Kontinu — PDF Marginal XX:

fX(x)=fX,Y(x,y)dy,xXf_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y)\, dy, \quad x \in \mathcal{X}

Kasus Kontinu — PDF Marginal YY:

fY(y)=fX,Y(x,y)dx,yYf_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x, y)\, dx, \quad y \in \mathcal{Y}

CDF Marginal XX (berlaku umum):

FX(x)=limyFX,Y(x,y)=P(Xx,Y<)F_X(x) = \lim_{y \to \infty} F_{X,Y}(x, y) = P(X \leq x, Y < \infty)

Variabel & Parameter

SimbolMaknaCatatan
X,YX, YVariabel acak dalam pasangan (X,Y)(X, Y)Bisa diskrit, kontinu, atau campuran
X,Y\mathcal{X}, \mathcal{Y}Support marginal dari XX dan YYSupport marginal bisa berbeda dari support joint
pX,Y(x,y)p_{X,Y}(x, y)PMF joint dari (X,Y)(X, Y) (kasus diskrit)pX,Y(x,y)0p_{X,Y}(x,y) \geq 0; xypX,Y(x,y)=1\sum_x \sum_y p_{X,Y}(x,y) = 1
fX,Y(x,y)f_{X,Y}(x, y)PDF joint dari (X,Y)(X, Y) (kasus kontinu)fX,Y(x,y)0f_{X,Y}(x,y) \geq 0; fX,Y=1\int\int f_{X,Y} = 1
pX(x)p_X(x)PMF marginal dari XXFungsi satu variabel; xpX(x)=1\sum_x p_X(x) = 1
fX(x)f_X(x)PDF marginal dari XXFungsi satu variabel; fX(x)dx=1\int f_X(x)\,dx = 1
FX,Y(x,y)F_{X,Y}(x,y)CDF joint dari (X,Y)(X, Y)FX,Y(x,y)=P(Xx,Yy)F_{X,Y}(x,y) = P(X \leq x, Y \leq y)
FX(x)F_X(x)CDF marginal dari XXFX(x)=limyFX,Y(x,y)F_X(x) = \lim_{y \to \infty} F_{X,Y}(x, y)
EX[X]E_X[X]Nilai harapan XX dari distribusi marginalxxpX(x)\sum_x x\, p_X(x) atau xfX(x)dx\int x\, f_X(x)\,dx

Rumus Utama

pX(x)=yYpX,Y(x,y)p_X(x) = \sum_{y \in \mathcal{Y}} p_{X,Y}(x, y)

Label: Marginalisasi Diskrit — jumlahkan PMF joint atas semua nilai yy untuk mendapatkan PMF marginal XX; setiap baris dalam tabel joint dijumlahkan ke kolom margin.

fX(x)=fX,Y(x,y)dyf_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y)\, dy

Label: Marginalisasi Kontinu — integrasikan PDF joint atas variabel yy untuk mendapatkan PDF marginal XX; batas integrasi harus menggunakan support aktual dari yy, bukan selalu -\infty hingga \infty.

FX(x)=limyFX,Y(x,y)F_X(x) = \lim_{y \to \infty} F_{X,Y}(x, y)

Label: CDF Marginal dari CDF Joint — ambil limit CDF joint ketika yy \to \infty; secara intuitif, kita mengizinkan YY mengambil semua nilai hingga ++\infty.

xXpX(x)=1danfX(x)dx=1\sum_{x \in \mathcal{X}} p_X(x) = 1 \qquad \text{dan} \qquad \int_{-\infty}^{\infty} f_X(x)\,dx = 1

Label: Validasi Distribusi Marginal — distribusi marginal yang diturunkan dengan benar selalu merupakan distribusi valid (PMF atau PDF yang sah).

E[g(X)]=xXg(x)pX(x)=xyg(x)pX,Y(x,y)E[g(X)] = \sum_{x \in \mathcal{X}} g(x)\, p_X(x) = \sum_{x}\sum_{y} g(x)\, p_{X,Y}(x,y)

Label: Nilai Harapan dari Marginal (ekuivalensi) — nilai harapan fungsi XX dapat dihitung langsung dari marginal atau dari joint; hasilnya identik.

Asumsi Eksplisit

  • Support joint terdefinisi: X×Y\mathcal{X} \times \mathcal{Y} (atau subset-nya) harus terdefinisi dengan jelas sebelum marginalisasi dilakukan.
  • Konvergensi/keabsolutan: Untuk kasus diskrit, ypX,Y(x,y)<\sum_y |p_{X,Y}(x,y)| < \infty; untuk kasus kontinu, fX,Y(x,y)dy<\int |f_{X,Y}(x,y)|\,dy < \infty — keduanya otomatis terpenuhi jika distribusi joint valid.
  • Batas integrasi bergantung support: Ketika support joint adalah region non-rectangular (misal 0<x<y<10 < x < y < 1), batas integrasi dalam marginalisasi bergantung pada variabel yang dipertahankan, bukan selalu -\infty hingga \infty.
  • Marginal tidak menentukan joint secara unik: Dua distribusi joint yang berbeda bisa menghasilkan marginal yang sama; oleh karena itu, mengetahui kedua marginal tidak cukup untuk menentukan distribusi joint kecuali ada informasi tambahan (misal: independensi).

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Distribusi joint pX,Y(x,y)p_{X,Y}(x,y) atau fX,Y(x,y)f_{X,Y}(x,y) mendeskripsikan probabilitas untuk setiap pasangan (x,y)(x, y). Ketika kita ingin distribusi XX saja, kita tidak peduli nilai YY yang mana — kita ingin semua kemungkinan YY digabungkan. Untuk kasus diskrit, “menggabungkan” berarti menjumlahkan: pX(x)=ypX,Y(x,y)p_X(x) = \sum_y p_{X,Y}(x,y) adalah total probabilitas semua kejadian (X=x,Y=y)(X=x, Y=y) untuk setiap yy yang mungkin. Untuk kasus kontinu, “menggabungkan” berarti mengintegrasikan: fX(x)=fX,Y(x,y)dyf_X(x) = \int f_{X,Y}(x,y)\,dy karena probabilitas bukan lagi diberikan oleh nilai fungsi tunggal melainkan oleh luas di bawah kurva. Ide dasarnya sama: kita “hapus” variabel YY dengan merangkum semua kemungkinannya.

Support dan Domain — Peringatan Batas Non-Rectangular

Batas integrasi (atau batas penjumlahan) dalam marginalisasi harus mengikuti support joint yang sebenarnya. Jika support joint adalah suatu region, bukan persegi panjang, maka batas bervariasi:

Contoh: Jika fX,Y(x,y)>0f_{X,Y}(x,y) > 0 hanya untuk 0<x<y<10 < x < y < 1, maka:

fX(x)=y=x1fX,Y(x,y)dy,0<x<1f_X(x) = \int_{y=x}^{1} f_{X,Y}(x,y)\,dy, \quad 0 < x < 1 fY(y)=x=0yfX,Y(x,y)dx,0<y<1f_Y(y) = \int_{x=0}^{y} f_{X,Y}(x,y)\,dx, \quad 0 < y < 1

Batas bawah integrasi fXf_X adalah xx (bukan 00), dan batas atas integrasi fYf_Y adalah yy (bukan 11). Menggunakan batas yang salah adalah kesalahan paling umum dalam soal CF2 bertopik distribusi marginal.

Derivasi Marginal dari Prinsip Probabilitas Total:

Mulai dari aksioma: probabilitas kejadian {Xx}\{X \leq x\} adalah total probabilitas dari semua pasangan (Xx,Y=y)(X \leq x, Y = y) untuk semua yy. Untuk kasus diskrit:

P(Xx)=xxP(X=x)=xxyYpX,Y(x,y)P(X \leq x) = \sum_{x' \leq x} P(X = x') = \sum_{x' \leq x} \sum_{y \in \mathcal{Y}} p_{X,Y}(x', y)

Dari sini, turunannya adalah PMF marginal:

pX(x)=P(X=x)=yYpX,Y(x,y)p_X(x) = P(X = x) = \sum_{y \in \mathcal{Y}} p_{X,Y}(x, y)

Ini adalah hukum probabilitas total yang diterapkan pada YY: P(X=x)=yP(X=xY=y)P(Y=y)=ypX,Y(x,y)P(X = x) = \sum_y P(X = x \mid Y = y) P(Y = y) = \sum_y p_{X,Y}(x,y).

Untuk kasus kontinu, argumen yang analog menggunakan properti integral. CDF joint memenuhi:

FX(x)=P(Xx)=P(Xx,Y<)=limyFX,Y(x,y)F_X(x) = P(X \leq x) = P(X \leq x,\, Y < \infty) = \lim_{y \to \infty} F_{X,Y}(x, y)

Mendiferensialkan FX(x)F_X(x) terhadap xx menghasilkan PDF marginal:

fX(x)=ddxFX(x)=ddxxfX,Y(u,v)dudv=fX,Y(x,y)dyf_X(x) = \frac{d}{dx} F_X(x) = \frac{d}{dx} \int_{-\infty}^{\infty} \int_{-\infty}^{x} f_{X,Y}(u, v)\,du\,dv = \int_{-\infty}^{\infty} f_{X,Y}(x, y)\,dy

di mana pertukaran urutan diferensiasi dan integrasi dijustifikasi oleh teorema diferensiasi di bawah tanda integral (kondisi regularitas standar terpenuhi untuk distribusi yang valid di CF2).

Dilarang
  1. Dilarang menggunakan batas ±\pm\infty secara membabi-buta ketika support joint terbatas atau non-rectangular — selalu gambar region support terlebih dahulu dan tentukan batas integrasi yang benar untuk setiap variabel yang dipertahankan.
  2. Dilarang menyimpulkan distribusi joint dari kedua marginalnya tanpa informasi tambahan — produk dari dua marginal sama dengan joint hanya jika XX dan YY independen (lihat 3.5 Independensi dan Korelasi).
  3. Dilarang menggunakan distribusi marginal sebagai distribusi bersyaratfX(x)fXY(xy)f_X(x) \neq f_{X|Y}(x|y) kecuali XX dan YY independen; keduanya adalah fungsi yang berbeda dengan interpretasi yang berbeda.

Section 4 — Contoh Soal

Soal A — Fundamental

Misalkan (X,Y)(X, Y) adalah pasangan variabel acak diskrit dengan PMF joint sebagai berikut:

pX,Y(x,y)p_{X,Y}(x,y)Y=0Y=0Y=1Y=1Y=2Y=2
X=1X=10.100.150.05
X=2X=20.200.250.10
X=3X=30.050.050.05

(a) Tentukan PMF marginal dari XX dan YY. (b) Hitung E[X]E[X] dan Var(X)\text{Var}(X) menggunakan distribusi marginal XX.

Solusi Soal A

1. Identifikasi Variabel

  • X={1,2,3}\mathcal{X} = \{1, 2, 3\}, Y={0,1,2}\mathcal{Y} = \{0, 1, 2\}
  • Total probabilitas: 0.10+0.15+0.05+0.20+0.25+0.10+0.05+0.05+0.05=1.000.10 + 0.15 + 0.05 + 0.20 + 0.25 + 0.10 + 0.05 + 0.05 + 0.05 = 1.00

2. Identifikasi Distribusi / Model

  • Variabel acak diskrit bivariat dengan PMF joint eksplisit.
  • Marginalisasi dilakukan dengan menjumlahkan baris (untuk marginal XX) atau kolom (untuk marginal YY).

3. Setup Persamaan

pX(x)=y{0,1,2}pX,Y(x,y),pY(y)=x{1,2,3}pX,Y(x,y)p_X(x) = \sum_{y \in \{0,1,2\}} p_{X,Y}(x, y), \qquad p_Y(y) = \sum_{x \in \{1,2,3\}} p_{X,Y}(x, y)

4. Eksekusi Aljabar

PMF Marginal XX (jumlahkan tiap baris):

pX(1)=0.10+0.15+0.05=0.30p_X(1) = 0.10 + 0.15 + 0.05 = 0.30 pX(2)=0.20+0.25+0.10=0.55p_X(2) = 0.20 + 0.25 + 0.10 = 0.55 pX(3)=0.05+0.05+0.05=0.15p_X(3) = 0.05 + 0.05 + 0.05 = 0.15

Cek: 0.30+0.55+0.15=1.000.30 + 0.55 + 0.15 = 1.00

PMF Marginal YY (jumlahkan tiap kolom):

pY(0)=0.10+0.20+0.05=0.35p_Y(0) = 0.10 + 0.20 + 0.05 = 0.35 pY(1)=0.15+0.25+0.05=0.45p_Y(1) = 0.15 + 0.25 + 0.05 = 0.45 pY(2)=0.05+0.10+0.05=0.20p_Y(2) = 0.05 + 0.10 + 0.05 = 0.20

Cek: 0.35+0.45+0.20=1.000.35 + 0.45 + 0.20 = 1.00

Menghitung E[X]E[X]:

E[X]=xxpX(x)=1(0.30)+2(0.55)+3(0.15)=0.30+1.10+0.45=1.85E[X] = \sum_{x} x\, p_X(x) = 1(0.30) + 2(0.55) + 3(0.15) = 0.30 + 1.10 + 0.45 = 1.85

Menghitung E[X2]E[X^2] via LOTUS:

E[X2]=12(0.30)+22(0.55)+32(0.15)=0.30+2.20+1.35=3.85E[X^2] = 1^2(0.30) + 2^2(0.55) + 3^2(0.15) = 0.30 + 2.20 + 1.35 = 3.85

Menghitung Var(X)\text{Var}(X):

Var(X)=E[X2](E[X])2=3.85(1.85)2=3.853.4225=0.4275\text{Var}(X) = E[X^2] - (E[X])^2 = 3.85 - (1.85)^2 = 3.85 - 3.4225 = 0.4275

5. Verification

  • Distribusi marginal valid: semua pX(x)0p_X(x) \geq 0 dan jumlah = 1. ✓
  • E[X]=1.85E[X] = 1.85 berada di antara nilai minimum (1) dan maksimum (3). ✓
  • Var(X)=0.4275>0\text{Var}(X) = 0.4275 > 0, dan distribusi cukup terkonsentrasi di X=2X=2, sehingga variansi kecil adalah masuk akal. ✓
Exam Tips — Soal A
  • Target waktu: 3–4 menit untuk bagian (a) + (b).
  • Common trap: Menjumlahkan kolom untuk marginal XX (seharusnya baris) atau sebaliknya. Ingat: marginal XX → jumlahkan arah YY → jumlahkan baris (baris = nilai XX konstan, kolom = nilai YY bervariasi).
  • Shortcut verifikasi: Jumlah semua entri PMF joint harus = 1; jumlah semua nilai marginal XX harus = 1; jika tidak, ada kesalahan penjumlahan.

Soal B — Exam-Typical

Misalkan (X,Y)(X, Y) memiliki PDF joint:

fX,Y(x,y)={6x0<x<y<10lainnyaf_{X,Y}(x, y) = \begin{cases} 6x & 0 < x < y < 1 \\ 0 & \text{lainnya} \end{cases}

(a) Tentukan PDF marginal fX(x)f_X(x) dan fY(y)f_Y(y). (b) Hitung E[Y]E[Y] dan Var(Y)\text{Var}(Y) menggunakan distribusi marginal YY.

Solusi Soal B

1. Identifikasi Variabel

  • Support joint: {(x,y):0<x<y<1}\{(x,y) : 0 < x < y < 1\} — region segitiga di bawah diagonal y=1y = 1 dan di atas garis y=xy = x.
  • Untuk marginalisasi, perlu menentukan batas variabel yang diintegrasikan sebagai fungsi variabel yang dipertahankan.

2. Identifikasi Distribusi / Model

  • Distribusi kontinu bivariat dengan support non-rectangular (segitiga).
  • Verifikasi: 01x16xdydx=016x(1x)dx=6[1213]=616=1\int_0^1 \int_x^1 6x\,dy\,dx = \int_0^1 6x(1-x)\,dx = 6\left[\frac{1}{2} - \frac{1}{3}\right] = 6 \cdot \frac{1}{6} = 1

3. Setup Persamaan

Untuk fX(x)f_X(x): xx tetap, yy bervariasi dari xx hingga 11 (karena syarat x<y<1x < y < 1):

fX(x)=y=x16xdy,0<x<1f_X(x) = \int_{y=x}^{1} 6x\, dy, \quad 0 < x < 1

Untuk fY(y)f_Y(y): yy tetap, xx bervariasi dari 00 hingga yy (karena syarat 0<x<y0 < x < y):

fY(y)=x=0y6xdx,0<y<1f_Y(y) = \int_{x=0}^{y} 6x\, dx, \quad 0 < y < 1

4. Eksekusi Aljabar

PDF Marginal XX:

fX(x)=x16xdy=6x[y]x1=6x(1x),0<x<1f_X(x) = \int_{x}^{1} 6x\, dy = 6x \cdot [y]_{x}^{1} = 6x(1 - x), \quad 0 < x < 1

PDF Marginal YY:

fY(y)=0y6xdx=6[x22]0y=6y22=3y2,0<y<1f_Y(y) = \int_{0}^{y} 6x\, dx = 6 \cdot \left[\frac{x^2}{2}\right]_{0}^{y} = 6 \cdot \frac{y^2}{2} = 3y^2, \quad 0 < y < 1

Menghitung E[Y]E[Y]:

E[Y]=01y3y2dy=301y3dy=314=34E[Y] = \int_0^1 y \cdot 3y^2\, dy = 3\int_0^1 y^3\, dy = 3 \cdot \frac{1}{4} = \frac{3}{4}

Menghitung E[Y2]E[Y^2]:

E[Y2]=01y23y2dy=301y4dy=315=35E[Y^2] = \int_0^1 y^2 \cdot 3y^2\, dy = 3\int_0^1 y^4\, dy = 3 \cdot \frac{1}{5} = \frac{3}{5}

Menghitung Var(Y)\text{Var}(Y):

Var(Y)=E[Y2](E[Y])2=35(34)2=35916=48804580=380\text{Var}(Y) = E[Y^2] - (E[Y])^2 = \frac{3}{5} - \left(\frac{3}{4}\right)^2 = \frac{3}{5} - \frac{9}{16} = \frac{48}{80} - \frac{45}{80} = \frac{3}{80}

5. Verification

  • fX(x)=6x(1x)0f_X(x) = 6x(1-x) \geq 0 untuk 0<x<10 < x < 1 ✓; 016x(1x)dx=6(1213)=1\int_0^1 6x(1-x)\,dx = 6(\frac{1}{2} - \frac{1}{3}) = 1
  • fY(y)=3y20f_Y(y) = 3y^2 \geq 0 untuk 0<y<10 < y < 1 ✓; 013y2dy=[y3]01=1\int_0^1 3y^2\,dy = [y^3]_0^1 = 1
  • E[Y]=3/4E[Y] = 3/4 masuk akal: karena Y>X>0Y > X > 0 dan Y<1Y < 1, ekspektasi YY seharusnya lebih besar dari 1/21/2
  • Var(Y)=3/80=0.0375>0\text{Var}(Y) = 3/80 = 0.0375 > 0
Exam Tips — Soal B
  • Target waktu: 6–8 menit.
  • Common trap paling kritis: Menggunakan batas 00 hingga 11 untuk fX(x)f_X(x) — ini salah karena mengabaikan syarat y>xy > x. Batas bawah integrasi untuk yy adalah xx, bukan 00!
  • Common trap kedua: Menggunakan batas yy hingga 11 untuk fY(y)f_Y(y) — ini juga salah. Batas atas untuk xx adalah yy, bukan 11.
  • Strategi: Selalu gambar region support di kertas sebelum menulis integral. Garis y=xy=x, y=1y=1, x=0x=0 membentuk segitiga — identifikasi dengan jelas mana batas bawah dan atas untuk setiap variabel.

Soal C — Challenging

Misalkan (X,Y)(X, Y) memiliki PDF joint:

fX,Y(x,y)={c(x+y2)0<x<1,  0<y<10lainnyaf_{X,Y}(x, y) = \begin{cases} c(x + y^2) & 0 < x < 1,\; 0 < y < 1 \\ 0 & \text{lainnya} \end{cases}

(a) Tentukan nilai konstanta cc. (b) Tentukan PDF marginal fX(x)f_X(x) dan fY(y)f_Y(y). (c) Tentukan apakah XX dan YY independen. (d) Hitung Cov(X,Y)\text{Cov}(X, Y).

Solusi Soal C

1. Identifikasi Variabel

  • Support joint: {(x,y):0<x<1,0<y<1}\{(x,y) : 0 < x < 1, 0 < y < 1\} — persegi satuan (rectangular support, batas tidak saling bergantung).
  • Parameter c>0c > 0 belum diketahui; harus ditentukan dari syarat normalisasi.

2. Identifikasi Distribusi / Model

  • Distribusi kontinu bivariat dengan support rectangular.
  • Dengan support rectangular, marginalisasi lebih sederhana (batas integrasi tidak bergantung variabel yang dipertahankan).

3. Setup Persamaan

(a) Menentukan cc:

0101c(x+y2)dydx=1\int_0^1\int_0^1 c(x + y^2)\,dy\,dx = 1

(b) PDF marginal:

fX(x)=01c(x+y2)dy,fY(y)=01c(x+y2)dxf_X(x) = \int_0^1 c(x + y^2)\,dy, \quad f_Y(y) = \int_0^1 c(x + y^2)\,dx

(d) Kovariasi:

Cov(X,Y)=E[XY]E[X]E[Y]\text{Cov}(X,Y) = E[XY] - E[X]E[Y]

4. Eksekusi Aljabar

(a) Nilai cc:

c0101(x+y2)dydx=c01[xy+y33]01dx=c01(x+13)dxc\int_0^1\int_0^1 (x + y^2)\,dy\,dx = c\int_0^1 \left[xy + \frac{y^3}{3}\right]_0^1 dx = c\int_0^1 \left(x + \frac{1}{3}\right)dx =c[x22+x3]01=c(12+13)=c56=1    c=65= c\left[\frac{x^2}{2} + \frac{x}{3}\right]_0^1 = c\left(\frac{1}{2} + \frac{1}{3}\right) = c \cdot \frac{5}{6} = 1 \implies \boxed{c = \frac{6}{5}}

(b) PDF Marginal XX:

fX(x)=6501(x+y2)dy=65[xy+y33]01=65(x+13)=6x+25,0<x<1f_X(x) = \frac{6}{5}\int_0^1 (x + y^2)\,dy = \frac{6}{5}\left[xy + \frac{y^3}{3}\right]_0^1 = \frac{6}{5}\left(x + \frac{1}{3}\right) = \frac{6x + 2}{5}, \quad 0 < x < 1

PDF Marginal YY:

fY(y)=6501(x+y2)dx=65[x22+xy2]01=65(12+y2)=3+6y25,0<y<1f_Y(y) = \frac{6}{5}\int_0^1 (x + y^2)\,dx = \frac{6}{5}\left[\frac{x^2}{2} + xy^2\right]_0^1 = \frac{6}{5}\left(\frac{1}{2} + y^2\right) = \frac{3 + 6y^2}{5}, \quad 0 < y < 1

(c) Uji Independensi:

XX dan YY independen jika dan hanya jika fX,Y(x,y)=fX(x)fY(y)f_{X,Y}(x,y) = f_X(x) \cdot f_Y(y) untuk semua (x,y)(x,y).

fX(x)fY(y)=(6x+2)5(3+6y2)5=(6x+2)(3+6y2)25f_X(x) \cdot f_Y(y) = \frac{(6x+2)}{5} \cdot \frac{(3+6y^2)}{5} = \frac{(6x+2)(3+6y^2)}{25}

Sementara:

fX,Y(x,y)=65(x+y2)=6x+6y25f_{X,Y}(x,y) = \frac{6}{5}(x + y^2) = \frac{6x + 6y^2}{5}

Karena (6x+2)(3+6y2)256x+6y25\frac{(6x+2)(3+6y^2)}{25} \neq \frac{6x + 6y^2}{5} (misalnya di x=0,y=0x=0, y=0: 2325=6250\frac{2 \cdot 3}{25} = \frac{6}{25} \neq 0), maka XX dan YY tidak independen.

(d) Menghitung Cov(X,Y)\text{Cov}(X,Y):

E[X]E[X]:

E[X]=01x6x+25dx=1501(6x2+2x)dx=15[2x3+x2]01=35E[X] = \int_0^1 x \cdot \frac{6x+2}{5}\,dx = \frac{1}{5}\int_0^1 (6x^2 + 2x)\,dx = \frac{1}{5}\left[2x^3 + x^2\right]_0^1 = \frac{3}{5}

E[Y]E[Y]:

E[Y]=01y3+6y25dy=1501(3y+6y3)dy=15[3y22+6y44]01=15(32+32)=35E[Y] = \int_0^1 y \cdot \frac{3+6y^2}{5}\,dy = \frac{1}{5}\int_0^1 (3y + 6y^3)\,dy = \frac{1}{5}\left[\frac{3y^2}{2} + \frac{6y^4}{4}\right]_0^1 = \frac{1}{5}\left(\frac{3}{2} + \frac{3}{2}\right) = \frac{3}{5}

E[XY]E[XY] (dari distribusi joint):

E[XY]=650101xy(x+y2)dydx=650101(x2y+xy3)dydxE[XY] = \frac{6}{5}\int_0^1\int_0^1 xy(x + y^2)\,dy\,dx = \frac{6}{5}\int_0^1\int_0^1 (x^2y + xy^3)\,dy\,dx =6501[x2y22+xy44]01dx=6501(x22+x4)dx=65[x36+x28]01=65724=720= \frac{6}{5}\int_0^1 \left[\frac{x^2 y^2}{2} + \frac{xy^4}{4}\right]_0^1 dx = \frac{6}{5}\int_0^1 \left(\frac{x^2}{2} + \frac{x}{4}\right)dx = \frac{6}{5}\left[\frac{x^3}{6} + \frac{x^2}{8}\right]_0^1 = \frac{6}{5}\cdot\frac{7}{24} = \frac{7}{20}

Cov(X,Y)\text{Cov}(X,Y):

Cov(X,Y)=E[XY]E[X]E[Y]=7203535=720925=3510036100=1100\text{Cov}(X,Y) = E[XY] - E[X]E[Y] = \frac{7}{20} - \frac{3}{5}\cdot\frac{3}{5} = \frac{7}{20} - \frac{9}{25} = \frac{35}{100} - \frac{36}{100} = -\frac{1}{100}

5. Verification

  • 01fX(x)dx=1501(6x+2)dx=15[3x2+2x]01=55=1\int_0^1 f_X(x)\,dx = \frac{1}{5}\int_0^1(6x+2)\,dx = \frac{1}{5}[3x^2+2x]_0^1 = \frac{5}{5} = 1
  • 01fY(y)dy=1501(3+6y2)dy=15[3y+2y3]01=55=1\int_0^1 f_Y(y)\,dy = \frac{1}{5}\int_0^1(3+6y^2)\,dy = \frac{1}{5}[3y+2y^3]_0^1 = \frac{5}{5} = 1
  • Cov(X,Y)=1/100<0\text{Cov}(X,Y) = -1/100 < 0: masuk akal secara intuitif karena PDF joint memberikan bobot lebih pada area di mana xx kecil dan yy besar (suku y2y^2 dalam ff lebih dominan ketika yy besar), mengindikasikan korelasi negatif lemah. ✓
  • E[X]=E[Y]=3/5>1/2E[X] = E[Y] = 3/5 > 1/2: juga masuk akal karena PDF memberikan lebih banyak bobot pada nilai-nilai besar (fungsi 6x+26x+2 meningkat dalam xx). ✓
Exam Tips — Soal C
  • Target waktu: 10–12 menit.
  • Common trap — konstanta cc: Selalu tentukan cc di langkah pertama; jangan lanjutkan ke marginal sebelum cc diketahui.
  • Common trap — uji independensi: Jangan cukup memeriksa satu titik saja — gunakan argumen bahwa fX,Y(x,y)f_{X,Y}(x,y) harus dapat ditulis sebagai produk fungsi-xx dan fungsi-yy semata (faktorisasi). Di sini, x+y2x + y^2 tidak dapat difaktorkan sebagai g(x)h(y)g(x) \cdot h(y), sehingga XX dan YY tidak independen.
  • Shortcut kovariasi: Gunakan Cov(X,Y)=E[XY]E[X]E[Y]\text{Cov}(X,Y) = E[XY] - E[X]E[Y]; hitung E[XY]E[XY] langsung dari distribusi joint (bukan dari marginal), karena kovariasi adalah konsep joint.

Section 5 — Verifikasi & Sanity Check

Validasi Distribusi Marginal
  • Setelah menghitung fX(x)f_X(x) atau pX(x)p_X(x), verifikasi bahwa fX(x)dx=1\int f_X(x)\,dx = 1 (kontinu) atau xpX(x)=1\sum_x p_X(x) = 1 (diskrit).
  • Semua nilai PMF/PDF marginal harus non-negatif pada seluruh support.
  • E[X]E[X] dari marginal harus berada di antara nilai minimum dan maksimum support X\mathcal{X}.
Konsistensi dengan Joint
  • E[g(X)]E[g(X)] dihitung dari marginal fXf_X harus sama dengan E[g(X)]E[g(X)] dihitung langsung dari joint fX,Yf_{X,Y}: g(x)fX(x)dx=g(x)fX,Y(x,y)dydx\int g(x) f_X(x)\,dx = \int\int g(x) f_{X,Y}(x,y)\,dy\,dx
  • P(XA)P(X \in A) dari marginal harus sama dengan P(XA,YR)P(X \in A, Y \in \mathbb{R}) dari joint.
Cek Independensi
  • Jika XX dan YY independen, maka fX,Y(x,y)=fX(x)fY(y)f_{X,Y}(x,y) = f_X(x) \cdot f_Y(y) untuk semua (x,y)(x,y).
  • Jika XX dan YY independen, maka E[XY]=E[X]E[Y]E[XY] = E[X] \cdot E[Y], sehingga Cov(X,Y)=0\text{Cov}(X,Y) = 0.
  • Perhatian: Cov(X,Y)=0\text{Cov}(X,Y) = 0 tidak menjamin independensi (lihat 3.5 Independensi dan Korelasi).
Cek Support Marginal
  • Support marginal X\mathcal{X} adalah proyeksi support joint ke sumbu-xx: X={x:y s.t. fX,Y(x,y)>0}\mathcal{X} = \{x : \exists\, y \text{ s.t. } f_{X,Y}(x,y) > 0\}.
  • Untuk support non-rectangular, support marginal bisa berbeda dari “batas luar” yang terlihat sekilas.

Metode Alternatif

Untuk kasus diskrit: Alih-alih menjumlahkan baris/kolom secara manual, gunakan tabel joint lengkap — isi margin baris (jumlah tiap baris) = marginal XX; isi margin kolom (jumlah tiap kolom) = marginal YY. Lebih sistematis dan mengurangi risiko melewatkan suku.

Untuk CDF marginal dari CDF joint: Gunakan FX(x)=limyFX,Y(x,y)F_X(x) = \lim_{y \to \infty} F_{X,Y}(x,y) langsung jika CDF joint sudah tersedia, tanpa perlu menurunkan PDF joint terlebih dahulu.

Section 6 — Visualisasi Mental

Bayangkan permukaan joint sebagai “gunung” di atas bidang (x,y)(x,y): PDF joint fX,Y(x,y)f_{X,Y}(x,y) membentuk permukaan tiga dimensi di atas bidang xyxy. Sumbu X dan Y adalah nilai-nilai variabel; sumbu Z adalah densitas probabilitas. Total volume di bawah permukaan = 1.

Marginalisasi sebagai “proyeksi” ke satu sumbu: PDF marginal fX(x)f_X(x) adalah bayangan (proyeksi) permukaan gunung ke sumbu-X. Secara teknis, fX(x)f_X(x) adalah tinggi total irisan vertikal di xx konstan — yaitu, fX,Y(x,y)dy\int f_{X,Y}(x,y)\,dy adalah “luas penampang” gunung jika dipotong tegak lurus sumbu-Y. Sumbu X adalah nilai xx; sumbu vertikal adalah fX(x)f_X(x). Kurva yang dihasilkan adalah kurva distribusi univariat biasa (bisa unimodal, miring, dll.).

Untuk kasus diskrit, bayangkan tabel sebagai grid probabilitas: Setiap sel berisi pX,Y(x,y)p_{X,Y}(x,y). Marginal adalah total tiap baris (ditulis di kolom kanan) dan total tiap kolom (ditulis di baris bawah) — persis seperti tabel frekuensi dua-arah di statistika deskriptif.

Hubungan Visual ↔ Rumus

Proyeksi sumbu-X dari permukaan joint \leftrightarrow integrasi terhadap yy:

fX(x)=fX,Y(x,y)dy"luas irisan vertikal" pada xf_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y)\,dy \longleftrightarrow \text{"luas irisan vertikal" pada } x

Lompatan di CDF joint ketika yy \to \infty dengan xx tetap \leftrightarrow CDF marginal:

FX(x)=limyFX,Y(x,y)"akumulasi penuh" sepanjang sumbu-YF_X(x) = \lim_{y \to \infty} F_{X,Y}(x, y) \longleftrightarrow \text{"akumulasi penuh" sepanjang sumbu-}Y

Jumlah margin baris di tabel diskrit \leftrightarrow penjumlahan PMF joint sepanjang kolom:

pX(x)=ypX,Y(x,y)total baris di posisi xp_X(x) = \sum_{y} p_{X,Y}(x,y) \longleftrightarrow \text{total baris di posisi } x

Section 7 — Jebakan Umum

Kesalahan Parametrisasi

Kesalahan Batas Integrasi Non-Rectangular:

Salah: Untuk fX,Y(x,y)=6xf_{X,Y}(x,y) = 6x dengan 0<x<y<10 < x < y < 1, menghitung fX(x)=016xdy=6x(SALAH)f_X(x) = \int_0^1 6x\,dy = 6x \quad \text{(SALAH)}

Benar: fX(x)=x16xdy=6x(1x)(BENAR)f_X(x) = \int_x^1 6x\,dy = 6x(1-x) \quad \text{(BENAR)}

Selalu periksa: batas integrasi untuk yy bergantung pada nilai xx yang dipegang tetap jika support joint bukan persegi panjang.

Kesalahan Konseptual
  1. Mengira marginal menentukan joint secara unik. Dua distribusi joint yang sama sekali berbeda bisa memiliki marginal yang identik. Contoh: distribusi joint dengan korelasi ρ=0.5\rho = 0.5 dan distribusi joint dengan korelasi ρ=0.5\rho = -0.5 bisa memiliki marginal normal yang sama.
  2. Menggunakan fX(x)f_X(x) sebagai fXY(xy)f_{X|Y}(x|y). Distribusi marginal fX(x)f_X(x) adalah distribusi XX tanpa kondisi apapun pada YY. Distribusi bersyarat fXY(xy)=fX,Y(x,y)/fY(y)f_{X|Y}(x|y) = f_{X,Y}(x,y) / f_Y(y) adalah distribusi XX ketika Y=yY = y diketahui — ini adalah fungsi yang berbeda (lihat 3.3 Distribusi Bersyarat (Conditional Distribution)).
  3. Menghitung E[XY]E[XY] dari marginal. E[XY]E[XY] tidak bisa dihitung dari fXf_X dan fYf_Y saja (kecuali X,YX, Y independen). Harus gunakan distribusi joint: E[XY]=xyfX,Y(x,y)dydxE[XY] = \int\int xy\, f_{X,Y}(x,y)\,dy\,dx.
  4. Lupa bahwa support marginal adalah proyeksi dari support joint. Jika support joint adalah 0<x<y<10 < x < y < 1, maka support marginal XX adalah 0<x<10 < x < 1 (bukan 0<x<y0 < x < y, karena yy tidak lagi ada di marginal).
Kesalahan Interpretasi Soal
  • “Distribusi XX” tanpa konteks lebih lanjut → biasanya berarti distribusi marginal dari XX, bukan bersyarat.
  • “Distribusi XX given Y=yY = y → selalu berarti distribusi bersyarat (lihat 3.3 Distribusi Bersyarat (Conditional Distribution)), bukan marginal.
  • XX dan YY tidak berkorelasi”Cov(X,Y)=0\text{Cov}(X,Y) = 0, tetapi ini tidak berarti XX dan YY independen. Independensi lebih kuat dari non-korelasi.
  • Soal meminta “apakah XX dan YY independen?” → wajib verifikasi fX,Y(x,y)=fX(x)fY(y)f_{X,Y}(x,y) = f_X(x) f_Y(y) untuk semua (x,y)(x,y), bukan hanya satu titik.
Red Flags
  • Support joint berbentuk segitiga atau non-rectangular (kata kunci: "0<x<y<10 < x < y < 1", "x+y<1x + y < 1", "x2+y2<1x^2 + y^2 < 1"): wajib gambar region support terlebih dahulu; batas integrasi untuk marginalisasi pasti bergantung pada variabel yang dipertahankan.
  • PDF joint mengandung faktor campuran (seperti xyxy, x+y2x + y^2, ex+ye^{x+y}): cek apakah bisa difaktorkan sebagai g(x)h(y)g(x)h(y) — jika ya, XX dan YY independen; jika tidak, tidak independen.
  • Soal meminta E[XY]E[XY] atau Cov(X,Y)\text{Cov}(X,Y): ini adalah kuantitas joint, harus gunakan distribusi joint, bukan marginal.
  • Konstanta normalisasi cc belum diketahui: langkah pertama selalu tentukan cc; tindakan yang tepat adalah menulis fX,Y=1\int\int f_{X,Y} = 1 dan menyelesaikan untuk cc sebelum melanjutkan.

Section 8 — Ringkasan Eksekutif

Must-Remember
  1. Marginalisasi diskrit (jumlahkan arah variabel yang dihilangkan): pX(x)=yYpX,Y(x,y)p_X(x) = \sum_{y \in \mathcal{Y}} p_{X,Y}(x, y)
  2. Marginalisasi kontinu (integrasikan arah variabel yang dihilangkan): fX(x)=Y(x)fX,Y(x,y)dyf_X(x) = \int_{\mathcal{Y}(x)} f_{X,Y}(x, y)\, dy di mana Y(x)\mathcal{Y}(x) adalah batas integrasi yy yang mungkin bergantung pada xx.
  3. CDF marginal dari CDF joint: FX(x)=limyFX,Y(x,y)F_X(x) = \lim_{y \to \infty} F_{X,Y}(x, y)
  4. Independensi \Leftrightarrow faktorisasi joint: XY    fX,Y(x,y)=fX(x)fY(y)  (x,y)X \perp Y \iff f_{X,Y}(x,y) = f_X(x) \cdot f_Y(y) \;\forall (x,y)
  5. E[XY]E[XY] harus dihitung dari joint, bukan dari marginal: E[XY]=xyfX,Y(x,y)dydxE[X]E[Y] (kecuali independen)E[XY] = \int\int xy\, f_{X,Y}(x,y)\,dy\,dx \neq E[X] \cdot E[Y] \text{ (kecuali independen)}

Kapan Digunakan

  • Trigger keywords: “distribusi XX saja”, “distribusi marginal”, “tanpa memperhatikan YY”, “tentukan PMF/PDF dari XX”, “hitung E[X]E[X] dari distribusi bersama”.
  • Tipe skenario soal:
    • Diberikan PMF/PDF joint (eksplisit atau dengan konstanta), turunkan distribusi marginal satu variabel.
    • Hitung momen (E[X]E[X], Var(X)\text{Var}(X)) dari distribusi marginal yang diturunkan.
    • Tentukan apakah dua variabel independen menggunakan faktorisasi joint = produk marginal.
    • Diberikan CDF joint, turunkan CDF marginal.

Kapan TIDAK Boleh Digunakan

  • Jika soal menanyakan distribusi XX “given Y=yY = y”: Ini adalah distribusi bersyarat, bukan marginal. Gunakan 3.3 Distribusi Bersyarat (Conditional Distribution).
  • Jika soal meminta E[XY]E[XY], Cov(X,Y)\text{Cov}(X,Y), atau ρX,Y\rho_{X,Y}: Kuantitas ini membutuhkan distribusi joint, bukan marginal. Marginalisasi menghilangkan informasi tentang ketergantungan antar variabel.
  • Jika hanya satu variabel diberikan tanpa konteks joint: Tidak ada yang perlu “dimarginalisasikan” — gunakan langsung teknik univariat dari 2.1 Variabel Acak Diskrit atau 2.2 Variabel Acak Kontinu.

Quick Decision Tree

graph TD
    A["Diberikan distribusi joint f_XY atau p_XY"] --> B["Apa yang dicari?"]
    B --> C["Distribusi satu variabel saja"]
    B --> D["Distribusi satu variabel given variabel lain"]
    B --> E["Apakah X dan Y independen?"]
    B --> F["Cov atau rho X,Y"]
    C --> G["Gunakan marginalisasi:<br>jumlahkan atau integrasikan<br>terhadap variabel yang dihilangkan"]
    G --> H["Apakah support rectangular?"]
    H -->|"Ya"| I["Batas integrasi tetap,<br>tidak bergantung variabel lain"]
    H -->|"Tidak"| J["Gambar region support!<br>Batas bergantung variabel<br>yang dipertahankan"]
    D --> K["Gunakan distribusi bersyarat:<br>f_XY dibagi f_Y<br>lihat 3.3"]
    E --> L["Hitung f_X dan f_Y,<br>lalu cek f_XY = f_X * f_Y<br>untuk semua x,y"]
    F --> M["Hitung E[XY] dari joint,<br>E[X] dan E[Y] dari marginal,<br>lalu Cov = E[XY] - E[X]E[Y]"]

Follow-up Options
  1. “Berikan contoh soal distribusi marginal dengan support non-rectangular berbentuk parabola atau lingkaran”
  2. “Jelaskan hubungan 3.2 Distribusi Marginal dengan 3.3 Distribusi Bersyarat (Conditional Distribution) melalui rumus Bayes kontinu”
  3. “Buat flashcard 1-halaman untuk topik ini”

📖 Ref: Hogg-McKean-Craig (2019) Bab 2.1–2.2; Miller et al. (2014) Bab 3.5–3.7, 4.6–4.7, 5.8–5.9 | 🗓️ 2026-02-21 | #CF2 #Multivariat #Marginal #PMF #PDF #Marginalisasi