Data Wrangling and Visualization#
Bar plot#
Visualisasi berbentuk batang yang menyajikan perbandingan sebuah nilai dari beberapa kategori.
Box plot#
Visualisasi berbentuk kotak dan garis yang menyajikan distribusi data numerik berdasarkan nilai kuartil (Q). Informasi yang ditampilkan berupa five number summary (min, Q1, Q2/median, Q3, max) dan outlier.
Data Wrangling#
Salah satu tahapan dalam data preprocessing untuk melakukan transformasi data dari satu bentuk ke bentuk lainnya agar sesuai dengan kebutuhan, dalam kasus ini untuk visualisasi data.
Line plot#
Visualisasi berbentuk garis yang menggambarkan pergerakan nilai dari waktu ke waktu (data time series).
MultiIndex DataFrame#
Tabel yang memiliki indeks baris atau kolom lebih dari satu level, dikenal juga sebagai high-dimensional table. Dalam praktiknya, penggunaan MultiIndex DataFrame sangat tidak disarankan dalam proses analisis data tabular.
Outlier#
Nilai pencilan/ekstrim yang terdapat pada data numerik. Nilai ekstrim ini dapat dideteksi menggunakan Box plot.
Package dependencies#
Sekumpulan package yang dibutuhkan untuk menggunakan sebuah package atau aplikasi.
Contoh: pandas
membutuhkan matplotlib
untuk kebutuhan visualisasi, maka dapat dikatakan bahwa matplotlib
adalah package dependencies dari pandas
.
Pickle#
Sebuah library standar Python yang digunakan untuk menyimpan (serializing) dan membaca (deserializing) object ke dalam / dari sebuah file binary (byte stream). File pickle spesifik hanya untuk Python, tidak dapat digunakan pada bahasa pemrograman lainnya.
Reshaping#
Teknik mengubah bentuk DataFrame yang memanjang menjadi melebar (long to wide) maupun sebaliknya, melebar menjadi memanjang (wide to long).
Scatter plot#
Visualisasi berbentuk titik-titik tersebar yang digunakan untuk melihat hubungan pola antara dua data numerik.