Salah satu asumsi yang sering digunakan dalam analisis statistika secara umum adalah asumsi data mengikuti distribusi normal. Dalam melakukan pengujian kenormalan data, kita dapat menggunakan metode/pendekatan inferensi statistika dengan uji hipotesis.
Uji normalitas digunakan untuk menentukan data yang ingin kita uji berdistribusi normal atau tidak. Berdasarkan dari pengalaman empiris beberapa ahli statistik, data yang banyaknya lebih dari 30 dapat diasumsikan berdistribusi normal.
Namun sebaiknya digunakan uji statistik normalitas untuk memberikan kepastian data tersebut berdistribusi normal atau tidak. Karena bisa saja data yang banyaknya lebih dari 30 tidak berdistribusi normal atau data yang kurang dari 30 berdistribusi normal, oleh karena itu perlu siati uji untuk membuktikan kepastiannya. Uji yang bisanya digunakan diantaranya Chi-Square, Kolmogorov Smirnov, Lilliefors, Shapiro Wilk, Jarque Bera.
1. Import Data
Disini kita akan mencoba untuk melakukan uji normalitas terhadap data Jumlah Pengeluaran Rumah Tangga Per Kepala, download terlebih dahulu datanya dan full codenya di github saya, kemudian import kedalam R dengan menggunakan read.delim, kemudian tampilkan data menggunakan View.2. Uji Normalitas
Selanjutnya melakukan uji normalitas menggunakan shpairo wilk. Syntax seperti gambar dibawah ini.Berdasarkan gambar diatas adalah Output dari uji asumsi kenormalan dengan menggunakan Shapiro-Wilk. Berikut langkah pengujian normalitas
- Uji Hipotesis
- H0 = Data berdistribusi normal
- H1 = Data berdistribusi tidak normal
- Tingkat signifikansi 5 %
- Statistic Uji yang digunakan adalah jika p-value < α maka tolak H0 dan sebaliknya jika p-value > α maka gagal tolak H0.
- Keputusan p-value < α yaitu 1.027e-05 < 0,05 maka tolak H0.
- Kesimpulannya adalah berdasarkan keputusan yang diperoleh yaitu tolak H0 karena 1.027e-05 < 0,05 maka dapat dikatakan data yang diberikan tidak berdistribusi normal.
3. Transformasi
Setelah data yang diperoleh tidak berdistribusi normal selanjutnya adalah mentransformasi data seperti syntax dibawah ini.
Kemudian didapatkan nilai lamda seperti gambar dibawah ini
Pada gambar diatas dapat dilihat bahwa hasil transformasi untuk jumlah pengeluaran rumah tangga di provinsi tersebut menghasilkan nilai sebesar -2.080853. Hasil tersebut merupakan nilai lambda. Karena nilai lambda maka kita bisa menggunakan rumus transformasi Y=X^lambda. Rumus tersebut digunakan untuk mencari uji nromalitas setalah data di transformasi. Kemudian bisa dilihat hasil transformasi dibawah ini.
4. Uji Normalitas Data Baru
Selanjutnya adalah uji normalitas dari data yang telah di transformasi pada langkah sebelumnya. Perhatikan syntax berikut ini.
Berdasarkan gambar diatas, adalah Output dari uji asumsi normalitas dengan menggunakan Jarque-Bera, Shapiro-Francia, dan Anderson-Darling. Berikut langkah pengujian normalitas
- Uji Hipotesis
- H0 = Data berdistribusi normal
- H1 = Data berdistribusi tidak normal
- Tingkat signifikansi : 5 %
- Statistic Uji : p-value < α maka tolak H0 dan p-value > α maka gagal tolak H0.
- Keputusan : Jarque-Bera p-value > α yaitu 0,438 > 0,05 maka gagal tolak H0. Shapiro-Francia p-value > α yaitu 0,2369 > 0,05 maka gagal tolak H0. Anderson-Darling p-value > α yaitu 0,106 > 0,05 maka gagal tolak H0.
- Kesimpulannya adalah berdasarkan keputusan yang diperoleh yaitu gagal tolak H0 karena semua nilai p-value > 0,05. Dari ke-tiga metode uji normalitas menghasilkan keputusan sama, maka dapat dikatakan data yang diberikan telah berdistribusi normal setelah dilakukan transformasi.
5. Membuat Plot
Langkah selanjutnya melakukan plotting data dari data yang telah di transformasi dan juga telah diuji normalitas.Berdasarkan plot pada gambar dibawah ini, dapat dikatakan berdistribusi normal, karena plot cenderung membentuk garis lurus jika dihubungkan dengan garis.
Kemudian kita juga bisa membuat qqplot menggunakan library qqplotr seperti syntax dibawah ini
Bisa dilihat Hasilnya sebagai berikut
Mungkin sekian untuk post kali ini, terimakasih
Uji Normalitas Pada Data Tidak Normal Menggunakan R
Reviewed by Jimmy Pujoseno
on
May 20, 2018
Rating:
Untuk data multivariat gimana sintax nya?
ReplyDeletekok ga bisa dibua yah? :(
ReplyDeleteGimana kalo masih belum normal setelah transform data kak?
ReplyDeleteKak kok di berikan pangkat lagi ya di bagian hasiltransformasinya
ReplyDelete