Data Wrangling and Visualization#

../_images/DWV.png

Bar plot#

Visualisasi berbentuk batang yang menyajikan perbandingan sebuah nilai dari beberapa kategori.

Box plot#

Visualisasi berbentuk kotak dan garis yang menyajikan distribusi data numerik berdasarkan nilai kuartil (Q). Informasi yang ditampilkan berupa five number summary (min, Q1, Q2/median, Q3, max) dan outlier.

Data Wrangling#

Salah satu tahapan dalam data preprocessing untuk melakukan transformasi data dari satu bentuk ke bentuk lainnya agar sesuai dengan kebutuhan, dalam kasus ini untuk visualisasi data.

Line plot#

Visualisasi berbentuk garis yang menggambarkan pergerakan nilai dari waktu ke waktu (data time series).

MultiIndex DataFrame#

Tabel yang memiliki indeks baris atau kolom lebih dari satu level, dikenal juga sebagai high-dimensional table. Dalam praktiknya, penggunaan MultiIndex DataFrame sangat tidak disarankan dalam proses analisis data tabular.

Outlier#

Nilai pencilan/ekstrim yang terdapat pada data numerik. Nilai ekstrim ini dapat dideteksi menggunakan Box plot.

Package dependencies#

Sekumpulan package yang dibutuhkan untuk menggunakan sebuah package atau aplikasi.

Contoh: pandas membutuhkan matplotlib untuk kebutuhan visualisasi, maka dapat dikatakan bahwa matplotlib adalah package dependencies dari pandas.

Pickle#

Sebuah library standar Python yang digunakan untuk menyimpan (serializing) dan membaca (deserializing) object ke dalam / dari sebuah file binary (byte stream). File pickle spesifik hanya untuk Python, tidak dapat digunakan pada bahasa pemrograman lainnya.

Reshaping#

Teknik mengubah bentuk DataFrame yang memanjang menjadi melebar (long to wide) maupun sebaliknya, melebar menjadi memanjang (wide to long).

Scatter plot#

Visualisasi berbentuk titik-titik tersebar yang digunakan untuk melihat hubungan pola antara dua data numerik.