BELAJAR ANALISIS DAN BAHASA PEMROGRAMAN

Pemeriksaan Data (Outlier, Missing dan Kenormalan)

Assalamualaikum Wr Wb
Statistik Dapat didefinisikan sebagai ilmu yang dipergunakan untuk menyimpulkan kondisi populasi berdasarkan kondisi sampel, untuk melakukan hal ini biasanya dilakukan tahapan yang disebut pengujian hipotesis, hasil dari pengujian hipotesis ini dapat dikatakan valid jika beberapa syarat terpenuhi, syarat-syarat itu diantaranya, kenormalan, kehomogenan varians dan kelinearan.

Kali ini saya mau share terkait dengan pemeriksaan data, pembebasan data dari data missing dan data outlier serta pengujian data normal multivariat yok di cek dibawah ini
Datanya bisa di download di SINI
Berikut di bawah ini merupakan visualisasi data menggunakan tableau
Pemeriksaan data missing dan data outlier
1.     Praktikan Memindahkan data yang akan di uji dari excel ke Rstudio, dengan mengcopy data yaitu dari kolom ke 3 sampai 5 serta menulis syntax menulis syntax lap2 <- read.delim("clipboard") pada Rstudio
2.     Selanjutnya untuk melihat summary data, ketikkan syntax summary summary(lap2)
3.     Melihat struktur data dengan syntax str(lap2)
4.     Selanjutnya untuk menangani  data missing, salah satu cara yang dapat digunakan adalah menghapus baris data yang memuat data missing dengan cara ketikan syntax hk.lap2 <- na.omit(lap2)
5.     Kemudian untuk melihat summary data (tanpa data missing), maka ketikkan syntax summary (hk.lap2) pada program Rstudio.
6.     Selanjutnya untuk mendeteksi data outlier dengan cara ketikkan library(MVN. Apabila belum mempunyai package MVN maka diinstall terlebih dahulu dengan ketik install.packages("MVN"). Kemudian ketikkan syntax hasil <- mvOutlier(hk.lap2[,1:3], qqplot = T, method = "quan")
7.     Selanjutnya, untuk menangani data outlier, cara yang dapat digunakan adalah menghapus baris data yang membuat data outlier, dengan cara ketikkan syntax hk.lap2.baru <-hasil$newData
8.  Selanjutnya untuk melihat summary data (tanpa data missing dan outlier), maka ketikan syntax summary(hk.lap2.baru)
Pengujian data normal multivariat
1.    Untuk menguji normal multivariat dengan pendekatan grafis maka ketikkan hasil <- hzTest (hk.lap2.baru, qqplot = T). setelah itu panggil hasil.
2. Kemudian metode yang kedua dalam penentuan normal multivariat yaitu menggunakan syntax roy <- roystonTest(hk.lap2.baru, qqplot = T) kemudian panggil roy.
                 Lanjut Pembahasan dan interpretasi
Mungkin sekian terimakasih Wassalam

Pemeriksaan Data (Outlier, Missing dan Kenormalan) Pemeriksaan Data (Outlier, Missing dan Kenormalan) Reviewed by Jimmy Pujoseno on May 26, 2017 Rating: 5

No comments:

Recent Post

Powered by Blogger.