BELAJAR ANALISIS DAN BAHASA PEMROGRAMAN

Uji Normalitas Pada Data Tidak Normal Menggunakan R

Salah satu asumsi yang sering digunakan dalam analisis statistika secara umum adalah asumsi data mengikuti distribusi normal. Dalam melakukan pengujian kenormalan data, kita dapat menggunakan metode/pendekatan inferensi statistika dengan uji hipotesis.
Uji normalitas digunakan untuk menentukan data yang ingin kita uji berdistribusi normal atau tidak. Berdasarkan dari pengalaman empiris beberapa ahli statistik, data yang banyaknya lebih dari 30 dapat diasumsikan berdistribusi normal.
Namun sebaiknya digunakan uji statistik normalitas untuk memberikan kepastian data tersebut berdistribusi normal atau tidak. Karena bisa saja data yang banyaknya lebih dari 30 tidak berdistribusi normal atau data yang kurang dari 30 berdistribusi normal, oleh karena itu perlu siati uji untuk membuktikan kepastiannya. Uji yang bisanya digunakan diantaranya Chi-Square, Kolmogorov Smirnov, Lilliefors, Shapiro Wilk, Jarque Bera.

1. Import Data

Disini kita akan mencoba untuk melakukan uji normalitas terhadap data Jumlah Pengeluaran Rumah Tangga Per Kepala, download terlebih dahulu datanya dan full codenya di github saya, kemudian import kedalam R dengan menggunakan read.delim, kemudian tampilkan data menggunakan View.
Kita menggunakan data jumlah pengeluaran rumah tangga di suatu propinsi yang mempunyai 38 kabupaten.

2. Uji Normalitas

Selanjutnya melakukan uji normalitas menggunakan shpairo wilk. Syntax seperti gambar dibawah ini.
Dari pengujian diatas didapatkan output berikut


Berdasarkan gambar diatas adalah Output dari uji asumsi kenormalan dengan menggunakan Shapiro-Wilk. Berikut langkah pengujian normalitas
  • Uji Hipotesis 
  • H0 = Data berdistribusi normal 
  • H1 = Data berdistribusi tidak normal 
  • Tingkat signifikansi 5 % 
  • Statistic Uji yang digunakan adalah jika p-value < α maka tolak H0 dan sebaliknya jika p-value > α maka gagal tolak H0. 
  • Keputusan p-value < α yaitu 1.027e-05 < 0,05 maka tolak H0.
  • Kesimpulannya adalah berdasarkan keputusan yang diperoleh yaitu tolak H0 karena 1.027e-05 < 0,05 maka dapat dikatakan data yang diberikan tidak berdistribusi normal. 
Data yang didapat tidak berdistribusi normal, maka untuk studi kasus pertama terpenuhi. Karena data tidak berdistribusi normal maka selanjutnya transformasi data sehingga membentuk data yang berdistribusi normal.

3. Transformasi

Setelah data yang diperoleh tidak berdistribusi normal selanjutnya adalah mentransformasi data seperti syntax dibawah ini.
Kemudian didapatkan nilai lamda seperti gambar dibawah ini

Pada gambar diatas dapat dilihat bahwa hasil transformasi untuk jumlah pengeluaran rumah tangga di provinsi tersebut menghasilkan nilai sebesar -2.080853. Hasil tersebut merupakan nilai lambda. Karena nilai lambda maka kita bisa menggunakan rumus transformasi Y=X^lambda. Rumus tersebut digunakan untuk mencari uji nromalitas setalah data di transformasi. Kemudian bisa dilihat hasil transformasi dibawah ini.

4. Uji Normalitas Data Baru

Selanjutnya adalah uji normalitas dari data yang telah di transformasi pada langkah sebelumnya. Perhatikan syntax berikut ini.
Kemudian dibawah ini merupakan output dari pengujian normalitas di atas. Kita mencoba menggunakan uji yang berbeda dimana hasilnya akan kita uji hipotesis.
Berdasarkan gambar diatas, adalah Output dari uji asumsi normalitas dengan menggunakan Jarque-Bera, Shapiro-Francia, dan Anderson-Darling. Berikut langkah pengujian normalitas
  • Uji Hipotesis 
  • H0 = Data berdistribusi normal
  • H1 = Data berdistribusi tidak normal
  • Tingkat signifikansi : 5 %
  • Statistic Uji : p-value < α maka tolak H0 dan p-value > α maka gagal tolak H0. 
  • Keputusan : Jarque-Bera  p-value > α yaitu 0,438 > 0,05 maka gagal tolak H0. Shapiro-Francia  p-value > α yaitu 0,2369 > 0,05 maka gagal tolak H0. Anderson-Darling  p-value > α yaitu 0,106 > 0,05 maka gagal tolak H0.
  • Kesimpulannya adalah berdasarkan keputusan yang diperoleh yaitu gagal tolak H0 karena semua nilai p-value > 0,05. Dari ke-tiga metode uji normalitas menghasilkan keputusan sama, maka dapat dikatakan data yang diberikan telah berdistribusi normal setelah dilakukan transformasi.

5. Membuat Plot

Langkah selanjutnya melakukan plotting data dari data yang telah di transformasi dan juga telah diuji normalitas.
Berdasarkan plot pada gambar dibawah ini, dapat dikatakan berdistribusi normal, karena plot cenderung membentuk garis lurus jika dihubungkan dengan garis.

Kemudian kita juga bisa membuat qqplot menggunakan library qqplotr seperti syntax dibawah ini
Bisa dilihat Hasilnya sebagai berikut
Mungkin sekian untuk post kali ini, terimakasih

Uji Normalitas Pada Data Tidak Normal Menggunakan R Uji Normalitas Pada Data Tidak Normal Menggunakan R Reviewed by Jimmy Pujoseno on May 20, 2018 Rating: 5

4 comments:

  1. Untuk data multivariat gimana sintax nya?

    ReplyDelete
  2. Gimana kalo masih belum normal setelah transform data kak?

    ReplyDelete
  3. Kak kok di berikan pangkat lagi ya di bagian hasiltransformasinya

    ReplyDelete

Recent Post

Powered by Blogger.