Exploratory Data Analysis#

../_images/EDA.png

Accessor#

Sebuah method yang digunakan untuk mengakses state, yaitu data yang tersembunyi dari sebuah object. Contoh accessor pada pandas Series adalah .dt, .cat, .str

Aggregation function (aggfunc)#

Function yang digunakan untuk merangkum kumpulan nilai menjadi satu nilai. Digunakan pada crosstab, pivot_table, atau groupby dalam membuat aggregation table.

Aggregation table#

Tabel yang berisi rangkuman informasi dari data. Pembuatan aggregation table wajib menggunakan aggregation function.

Contingency table#

Tabel yang berisi informasi berupa frekuensi, digunakan untuk menghitung jumlah kemunculan nilai terhadap kolom kategorinya.

Drop#

Proses penghapusan baris maupun kolom dari sebuah tabel.

Exploratory Data Analysis (EDA)#

Tahapan analisis data untuk memahami karakteristik dan menemukan pola yang terdapat pada data.

Imputation#

Cara untuk mengisi missing values dengan sebuah nilai berdasarkan metode tertentu.

Missing values#

Nilai yang hilang atau kosong pada data. Pada pandas, missing values dinotasikan dengan NaN (Not a Number) atau NaT (Not a Time) untuk data type datetime64.

Preprocessing#

Tahap pra-analisis yang dilakukan untuk mempersiapkan dan membersihkan data.

Type casting#

Proses mengubah sebuah data type ke tipe lainnya secara eksplisit, disebut juga sebagai explicit type conversion. Type casting merupakan salah satu proses dalam tahap preprocessing.