BELAJAR ANALISIS DAN BAHASA PEMROGRAMAN

Distribusi Probabilitas Kontinu Menggunakan R Part 1

Distribusi Probabilitas Kontinu

Distribusi probabilitas kontinu yang paling penting adalah distribusi gaussian, eksponensial, dan uniform.

Distribusi kontinu uniform

Di sini, "uniform" berarti "merata dalam interval tertentu". Ini adalah distribusi yang akita harapkan ketika kita ingin "mengambil angka secara acak dalam interval [0,1]".

Kita dapat mensimulasikan distribusi ini dengan fungsi "runif".

> round(runif(20), digits=4)
 [1] 0.6187 0.4653 0.0806 0.5425 0.4418 0.4485 0.4685 0.4461 0.9195 0.6127
[11] 0.9132 0.8607 0.1341 0.3795 0.8608 0.9100 0.1545 0.7401 0.2990 0.8714

Distribusi eksponensial

Kita bisa melihatnya sebagai analogi dari distribusi Poisson. Sebenarnya, waktu antara dua peristiwa dalam proses Poisson (secara intuitif: waktu antara dua peristiwa langka) mengikuti distribusi eksponensial. Misalnya, waktu antara dua disintegrasi radioaktif.

curve(dexp(x), xlim=c(0,10), col='red', lwd=3,
      main='Exponential Probability Distribution Function')
n <- 1000
x <- rexp(n)
hist(x, probability=T,
     col='light blue', main='Exponential Distribution')
lines(density(x), col='red', lwd=3)
curve(dexp(x), xlim=c(0,10), col='red', lwd=3, lty=2,
      add=T)
Distribusi Gaussian

Ini adalah distribusi "berbentuk lonceng" yang terkenal.

Lebih tepatnya, teorema limit pusat menyatakan bahwa jika X1, X2, ... X3 adalah variabel acak yang terdistribusi identik secara independen dengan harapan m dan varians s^2, maka
 (X1+X2+...+Xn) - nm
---------------------
      sqrt(n) s

konvergen dalam hukum ke distribusi gaussian ketika n cenderung tak terhingga. dengan kata lain, sarana empiris

X1+...Xn
--------
    n

adalah "mendekati" distribusi gaussian dari ekspektasi m dan standar deviasi s/sqrt(n).

Ini menjelaskan omnipresence  hukum gaussian: ketika Anda mengulangi eksperimen berkali-kali, hasil rata-rata (hampir) mengikuti distribusi gaussian.

limite.centrale <- function (r=runif, m=.5, s=1/sqrt(12), n=c(1,3,10,30), N=1000) {
  for (i in n) {
    x <- matrix(r(i*N),nc=i)
    x <- ( apply(x, 1, sum) - i*m )/(sqrt(i)*s)
    hist(x, col='light blue', probability=T, main=paste("n =",i), 
         ylim=c(0,max(.4, density(x)$y)))
    lines(density(x), col='red', lwd=3)
    curve(dnorm(x), col='blue', lwd=3, lty=3, add=T)
    if( N>100 ) {
      rug(sample(x,100))
    } else {
      rug(x)
    }
  }
}
op <- par(mfrow=c(2,2))
limite.centrale()
par(op)

op <- par(mfrow=c(2,2))
limite.centrale(rexp, m=1, s=1)
par(op)
op <- par(mfrow=c(2,2))
limite.centrale(rexp, m=1, s=1)
par(op)
op <- par(mfrow=c(2,2))
limite.centrale(function (n) { rnorm(n, sample(c(-3,3),n,replace=T)) }, 
                m=0, s=sqrt(10), n=c(1,2,3,10))
par(op)
Latihan: buat plot, mirip dengan yang di atas, tetapi dengan kepadatan probabilitas teoretis.

Fungsi kepadatan probabilitas gaussian adalah
f(x) = exp( -x^2/2 ) / sqrt( 2 pi )

In R:

curve(dnorm(x), xlim=c(-3,3), col='red', lwd=3)
title(main='Gaussian Probability Distribution Function')

Kepadatan kumulatif (yaitu, integral dari kepadatan):

curve(pnorm(x), xlim=c(-3,3), col='red', lwd=3)
title(main='Cumulative gaussian distribution function')
Kuantil (yaitu, kebalikan dari kepadatan kumulatif):
curve(qnorm(x), xlim=c(0,1), col='red', lwd=3)
title(main='Gaussian quantiles function')
Dan, tentu saja, kita memiliki fungsi "rnorm" untuk simulasi.
n <- 1000
x <- rnorm(n)
hist(x, probability=T, col='light blue', main='Gaussian Distribution')
lines(density(x), col='red', lwd=3)
curve(dnorm(x), add=T, col='red', lty=2, lwd=3)
legend(par('usr')[2], par('usr')[4], xjust=1,
       c('sample density', 'theoretical density'),
       lwd=2, lty=c(1,2),
       col='red')
Dalam diskusi di atas, kami mengasumsikan mean adalah mu=0 dan simpangan baku sigma=1 (distribusi "standar gaussian"): untuk mendapatkan kasus umum, kami hanya menerapkan transformasi affine:
f(x) = exp( -( (x-mu) / sigma )^2 /2 ) / sqrt( 2 pi sigma )

Distribusi gaussian kadang-kadang disebut distribusi "normal" -- saya akan mencoba menghindari kata ini, karena dalam beberapa situasi, distribusi yang ingin kita amati (yang ingin kita sebut "normal") bukanlah distribusi gaussian 









Distribusi Probabilitas Kontinu Menggunakan R Part 1 Distribusi Probabilitas Kontinu Menggunakan R Part 1 Reviewed by Jimmy Pujoseno on May 29, 2022 Rating: 5

No comments:

Recent Post

Powered by Blogger.