BELAJAR ANALISIS DAN BAHASA PEMROGRAMAN

Distribusi Probabilitas Diskrit Menggunakan R Part 2

Distribusi Hypergeometric

Ini adalah pembagian jumlah sampel bola merah tanpa pengembalian dari guci yang berisi bola merah dan putih.

Mari kita simulasikan pada sebuah contoh: kita mengambil sampel tanpa pengembalian 5 bola dari sebuah guci berisi 15 bola putih dan 5 bola merah dan kita menghitung jumlah bola putih

N <- 10000
n <- 5
urn <- c(rep(1,15),rep(0,5))
x <- NULL
for (i in 1:N) {
  x <- append(x, sum(sample( urn, n, replace=F )))
}
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Hypergeometric distribution, n=20, p=.75; k=5')
lines(density(x,bw=1), col='red', lwd=3)

Atau, Anda dapat langsung menggunakan fungsi "rhyper" (lebih cepat).
N <- 10000
n <- 5
x <- rhyper(N, 15, 5, 5)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Hypergeometric distribution, n=20, p=.75, k=5')
lines(density(x,bw=1), col='red', lwd=3)
N <- 10000
n <- 5
x <- rhyper(N, 300, 100, 100)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Hypergeometric distribution, n=400, p=.75, k=100')
lines(density(x,bw=1), col='red', lwd=3)

Distribusi Poisson

Ini adalah distribusi jumlah pelanggan yang mengantri (di toko, bank, layanan publik) dalam satuan waktu. Atau jumlah kesalahan ketik dalam teks. Atau jumlah atau disintegrasi radioaktif per detik. Atau segala jenis kejadian "langka" (sebenarnya, distribusi Poisson adalah kasus pembatas dari distribusi binomial).

Secara lebih formal, itu adalah distribusi probabilitas sedemikian rupa sehingga: (1) probabilitas mengamati suatu peristiwa (di sini, "peristiwa" dapat berupa: "ada pelanggan baru", "ada disintegrasi radioaktif baru", ada kesalahan ketik" , dll.) dalam interval "kecil" sebanding dengan ukuran interval ini (khususnya, tidak tergantung pada posisi interval ini pada sumbu waktu); (2) probabilitas bahwa suatu peristiwa terjadi dalam interval yang diberikan tidak tergantung pada probabilitas bahwa suatu peristiwa terjadi dalam interval terputus lainnya; (3) peristiwa tersebut tidak pernah simultan.
Pengaturan ini disebut "proses Poisson".

Seseorang dapat menunjukkan bahwa ini secara unik mendefinisikan distribusi probabilitas, dengan:
P( X=k ) = e^(-lambda) * lambda^k / k!
Dimana lambda adalah jumlah rata-rata peristiwa per unit waktu. Seseorang dapat mensimulasikan distribusi ini dengan fungsi "rpois".
N <- 10000
x <- rpois(N, 1)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Poisson distribution, lambda=1')
lines(density(x,bw=1), col='red', lwd=3)
N <- 10000
x <- rpois(N, 3)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Poisson distribution, lambda=3')
lines(density(x,bw=1), col='red', lwd=3)

N <- 10000
x <- rpois(N, 5)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Poisson distribution, lambda=5')
lines(density(x,bw=1), col='red', lwd=3)
N <- 10000
x <- rpois(N, 20)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Poisson distribution, lambda=20')
lines(density(x,bw=1), col='red', lwd=3)


Distribusi geometris

Itu adalah jumlah percobaan sebelum sukses dalam serangkaian acara Bernoulli. Misalnya, jika kita tertarik pada kemunculan 1s dan jika kita mendapatkan

0 0 0 1 0 1 0 0 1 0 0 1 0
kemudian, kami memiliki tiga percobaan (0 0 0, di awal) sebelum sukses (elemen keempat adalah "1").
Kita bisa mensimulasikannya dengan 
my.rgeom <- function (N, p) {
  bernoulli <- sample( c(0,1), N, replace=T, prob=c(1-p, p) )
  diff(c(0, which(bernoulli == 1))) - 1
}
hist( my.rgeom(10000, .5), col="light blue",
      main="Geometric distribution" )

tetapi lebih mudah menggunakan perintah "rgeom".

N <- 10000
x <- rgeom(N, .5)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Geometric distribution, p=.5')
lines(density(x,bw=1), col='red', lwd=3)
N <- 10000
x <- rgeom(N, .1)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Geometric distribution, p=.1')
lines(density(x,bw=1), col='red', lwd=3)

N <- 10000
x <- rgeom(N, .01)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=20,
     col='lightblue',
     main='Geometric distribution, p=.01')
lines(density(x), col='red', lwd=3)

Distribusi binomial negatif

Ini adalah distribusi jumlah kegagalan sebelum k sukses dalam serangkaian peristiwa Bernoulli.

Kita bisa mensimulasikannya dengan tangan (latihan diserahkan kepada pembaca). tetapi lebih mudah menggunakan fungsi "rnbinom".

N <- 100000
x <- rnbinom(N, 10, .25)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='Negative binomial distribution, n=10, p=.25')
lines(density(x,bw=1), col='red', lwd=3)
N <- 10000
x <- rnbinom(N, 10, .5)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='negative binomial distribution, n=10, p=.5')
lines(density(x,bw=1), col='red', lwd=3)

N <- 10000
x <- rnbinom(N, 10, .75)
hist(x, 
     xlim=c(min(x),max(x)), probability=T, nclass=max(x)-min(x)+1, 
     col='lightblue',
     main='negative binomial distribution, n=10, p=.75')
lines(density(x,bw=1), col='red', lwd=3)


Distribusi multinomial

Ini adalah analog dari distribusi binomial tetapi, kali ini, kejadiannya memiliki beberapa kemungkinan hasil.

P( (X1,X2,...,Xn)=(k1,k2,...,kn) ) = m! p1^k1 ... pn^kn / (k1! ... kn!)
Kita dapat mensimulasikannya sebagai berikut, masih dengan fungsi "sampel".
n <- 5
N <- 100
p <- c(.2,.5,.1,.1,.1)
x <- factor(sample(1:n, N, replace=T, prob=p), levels=1:n) 
table(x)
Kita mendapatkan:
x
 1  2  3  4  5
19 47 13  7 14



Distribusi Probabilitas Diskrit Menggunakan R Part 2 Distribusi Probabilitas Diskrit Menggunakan R Part 2 Reviewed by Jimmy Pujoseno on May 27, 2022 Rating: 5

No comments:

Recent Post

Powered by Blogger.