Distribusi Probabilitas Kontinu
Distribusi probabilitas kontinu yang paling penting adalah distribusi gaussian, eksponensial, dan uniform.
Distribusi kontinu uniform
Di sini, "uniform" berarti "merata dalam interval tertentu". Ini adalah distribusi yang akita harapkan ketika kita ingin "mengambil angka secara acak dalam interval [0,1]".
Kita dapat mensimulasikan distribusi ini dengan fungsi "runif".
> round(runif(20), digits=4) [1] 0.6187 0.4653 0.0806 0.5425 0.4418 0.4485 0.4685 0.4461 0.9195 0.6127 [11] 0.9132 0.8607 0.1341 0.3795 0.8608 0.9100 0.1545 0.7401 0.2990 0.8714
Distribusi eksponensial
Kita bisa melihatnya sebagai analogi dari distribusi Poisson. Sebenarnya, waktu antara dua peristiwa dalam proses Poisson (secara intuitif: waktu antara dua peristiwa langka) mengikuti distribusi eksponensial. Misalnya, waktu antara dua disintegrasi radioaktif.
curve(dexp(x), xlim=c(0,10), col='red', lwd=3, main='Exponential Probability Distribution Function')
n <- 1000 x <- rexp(n) hist(x, probability=T, col='light blue', main='Exponential Distribution') lines(density(x), col='red', lwd=3) curve(dexp(x), xlim=c(0,10), col='red', lwd=3, lty=2, add=T)
(X1+X2+...+Xn) - nm --------------------- sqrt(n) s
konvergen dalam hukum ke distribusi gaussian ketika n cenderung tak terhingga. dengan kata lain, sarana empiris
X1+...Xn -------- n
adalah "mendekati" distribusi gaussian dari ekspektasi m dan standar deviasi s/sqrt(n).
Ini menjelaskan omnipresence hukum gaussian: ketika Anda mengulangi eksperimen berkali-kali, hasil rata-rata (hampir) mengikuti distribusi gaussian.
limite.centrale <- function (r=runif, m=.5, s=1/sqrt(12), n=c(1,3,10,30), N=1000) { for (i in n) { x <- matrix(r(i*N),nc=i) x <- ( apply(x, 1, sum) - i*m )/(sqrt(i)*s) hist(x, col='light blue', probability=T, main=paste("n =",i), ylim=c(0,max(.4, density(x)$y))) lines(density(x), col='red', lwd=3) curve(dnorm(x), col='blue', lwd=3, lty=3, add=T) if( N>100 ) { rug(sample(x,100)) } else { rug(x) } } } op <- par(mfrow=c(2,2)) limite.centrale() par(op)
op <- par(mfrow=c(2,2)) limite.centrale(rexp, m=1, s=1) par(op)
op <- par(mfrow=c(2,2)) limite.centrale(rexp, m=1, s=1) par(op)
op <- par(mfrow=c(2,2)) limite.centrale(function (n) { rnorm(n, sample(c(-3,3),n,replace=T)) }, m=0, s=sqrt(10), n=c(1,2,3,10)) par(op)
f(x) = exp( -x^2/2 ) / sqrt( 2 pi )
In R:
curve(dnorm(x), xlim=c(-3,3), col='red', lwd=3) title(main='Gaussian Probability Distribution Function')
Kepadatan kumulatif (yaitu, integral dari kepadatan):
curve(pnorm(x), xlim=c(-3,3), col='red', lwd=3) title(main='Cumulative gaussian distribution function')Kuantil (yaitu, kebalikan dari kepadatan kumulatif):
curve(qnorm(x), xlim=c(0,1), col='red', lwd=3) title(main='Gaussian quantiles function')Dan, tentu saja, kita memiliki fungsi "rnorm" untuk simulasi.
n <- 1000 x <- rnorm(n) hist(x, probability=T, col='light blue', main='Gaussian Distribution') lines(density(x), col='red', lwd=3) curve(dnorm(x), add=T, col='red', lty=2, lwd=3) legend(par('usr')[2], par('usr')[4], xjust=1, c('sample density', 'theoretical density'), lwd=2, lty=c(1,2), col='red')Dalam diskusi di atas, kami mengasumsikan mean adalah mu=0 dan simpangan baku sigma=1 (distribusi "standar gaussian"): untuk mendapatkan kasus umum, kami hanya menerapkan transformasi affine:
f(x) = exp( -( (x-mu) / sigma )^2 /2 ) / sqrt( 2 pi sigma )
Distribusi gaussian kadang-kadang disebut distribusi "normal" -- saya akan mencoba menghindari kata ini, karena dalam beberapa situasi, distribusi yang ingin kita amati (yang ingin kita sebut "normal") bukanlah distribusi gaussian
No comments: