Exploratory Data Analysis#
Accessor#
Sebuah method yang digunakan untuk mengakses state, yaitu data yang tersembunyi dari sebuah object. Contoh accessor pada pandas Series adalah .dt, .cat, .str
Aggregation function (aggfunc)#
Function yang digunakan untuk merangkum kumpulan nilai menjadi satu nilai. Digunakan pada crosstab, pivot_table, atau groupby dalam membuat aggregation table.
Aggregation table#
Tabel yang berisi rangkuman informasi dari data. Pembuatan aggregation table wajib menggunakan aggregation function.
Contingency table#
Tabel yang berisi informasi berupa frekuensi, digunakan untuk menghitung jumlah kemunculan nilai terhadap kolom kategorinya.
Drop#
Proses penghapusan baris maupun kolom dari sebuah tabel.
Exploratory Data Analysis (EDA)#
Tahapan analisis data untuk memahami karakteristik dan menemukan pola yang terdapat pada data.
Imputation#
Cara untuk mengisi missing values dengan sebuah nilai berdasarkan metode tertentu.
Missing values#
Nilai yang hilang atau kosong pada data. Pada pandas, missing values dinotasikan dengan NaN (Not a Number) atau NaT (Not a Time) untuk data type datetime64.
Preprocessing#
Tahap pra-analisis yang dilakukan untuk mempersiapkan dan membersihkan data.
Type casting#
Proses mengubah sebuah data type ke tipe lainnya secara eksplisit, disebut juga sebagai explicit type conversion. Type casting merupakan salah satu proses dalam tahap preprocessing.