BELAJAR ANALISIS DAN BAHASA PEMROGRAMAN

Exploratory Data Analysis (EDA) COVID19 Di INDONESIA Menggunakan Python

Udah lama gk update akibat lupa password wwkwkwkw 

Berhubung lagi WFH banyak waktu kosong jadi kita ngeblog aja la yak, nah kali ini mau share sedikit mengenai EDA(Exploratory Data Analysis). Analisis data eksplorasi ( EDA ) adalah pendekatan untuk menganalisis set data untuk merangkum karakteristik utama mereka, seringkali dengan metode visual. Model statistik dapat digunakan atau tidak, tetapi terutama EDA adalah untuk melihat apa yang dapat disampaikan oleh data di luar pemodelan formal atau tugas pengujian hipotesis.(wikipedia.com) 

Jadi EDA itu kayak yang di bilang wiki di atas, bingung yak wkwkw sama. Kalau bahasa simplenya sih EDA itu untuk memahami data yang kita punya. Pada umumnya EDA dilakukan dengan beberapa cara: 
  • Univariat Analysis — analisis deskriptif dengan satu variabel. 
  • Bivariat Analysis — analisis relasi dengan dua variabel yang biasanya dengan target variabel.
  • Multivariat Analysis — analisis yang menggunakan lebih dari atau sama dengan tiga variabel.
Kita coba saja EDA menggunakan data covid karena lagi pandemi sekalian kita coba liat perkembangan covid di Indonesia dan Dunia. Btw ini datanya saya dapat di kaggle.com (DISINI). Kalian bisa download sourcenya DISINI

Pertama kita input library dan panggil data yang akan kita pake.

Data yang kita punya itu cuma sampai tanggal 26-07-2020 ya, disini kita punya beberapa field (Province/State dll) dan punya 48806 row data.

 
Next kita rename nama fieldnya agar mudah nantinya untuk proses datanya pada code. case yang mau kita liat nantinya adalah confirmed, deaths, recovered, dan active. Dimana rumus dari case active = confirmed - deaths - recovered. Disini karena cina di bagi(mainland china, china) maka kita satukan saja menjadi china semua saja. kemudian menghapus data miss seperti yang kita lihat di atas kalau kolom province/state datanya banyak yang kosong. 

Disini kita coba visualisasikan perubahan confirmed Covid19 di dunia. Kita akan coba petakan berdasarkan negara yang terjangkit seperti output dibawah ini.


Dari output diatas bisa kita lihat perkembangan covid di dunia terkait case confirmed. Selanjutnya kita akan coba menggunakan data khusus negara indonesia.


Kita filter dulu data yang kita punya, kita hanya mengambil yang countrynya Indonesia. Data yang kita punya ada 187 row dan 11 colums.


Kita akan coba tampilkan case yang confirmed dan active di indonesia 


Bisa dilihat kalau kasus confirmed di indonesia terus meningkat dan kasus active hingga bulan awal bulan 7 masih meningkat, tapi setelahnya mulai datar.


Selanjutnya kita akan coba lihat perkembangan covid19 sejak PSBB di indonesia di laksanakan yaitu mulai tanggal 24 april 2020. Disini kita pake seaborn berikut hasilnya


Walaupun PSBB di jalankan kasus covid di indonesia tetap naik tinggi banget, banyak faktor yang menyebabkan hal tersebut seperti yang banyak di berita tv itu karena banyak yang melanggar PSBB.

Nextnya kita tampilkan secara keseluruhan dari case baru di indonesia.


Disini kita coba tampilkan menggunakan bar plot ya outputnya seperti dibawah ini.

Kalau kita lihat dari output diatas, new case di indonesia pernah lebih dari 2500 dalam 1 hari. Kemudian bisa dilihat juga belum ada tanda tanda bahwa pandemi akan mengalami penurunan karena trendnya masih naik terus. 

Selanjutnya kita lihat kasus yang udah sembuh dan yang meninggal


disini kita coba gabungkan data recovered dan deaths untuk menampilkan output di bawah ini

Dari output diatas yang sembuh sangat jauh meningkat saat memasuki bulan 7, sementara yang meninggal walaupun meningkat tapi tidak setajam pasien yang sembuh. Alhamdulillah.

Selanjutnya kita coba lihat perbandingan dari Case baru dan Case recovered

kita coba buat daily case terlebih dahulu selanjutnya dibawah kita buay daily recoverednya


 output dari code di atas sebagai berikut


Output diatas merupakan perbandingan daily case dan juga daily recovered. 
Bisa disimpulkan banyak cara untuk memahami data secara umum, bisa pake histogram, boxplot, correlation plot dll, tergantung apa yang kita ingin lihat. Untuk Covid di Indonesia semoga cepet kelar dan cabut wkwkwwk.



Exploratory Data Analysis (EDA) COVID19 Di INDONESIA Menggunakan Python Exploratory Data Analysis (EDA) COVID19 Di INDONESIA Menggunakan Python Reviewed by Jimmy Pujoseno on July 29, 2020 Rating: 5

No comments:

Recent Post

Powered by Blogger.