Exploratory Data Analysis#
Accessor#
Sebuah method yang digunakan untuk mengakses state, yaitu data yang tersembunyi dari sebuah object. Contoh accessor pada pandas
Series adalah .dt
, .cat
, .str
Aggregation function (aggfunc
)#
Function yang digunakan untuk merangkum kumpulan nilai menjadi satu nilai. Digunakan pada crosstab
, pivot_table
, atau groupby
dalam membuat aggregation table.
Aggregation table#
Tabel yang berisi rangkuman informasi dari data. Pembuatan aggregation table wajib menggunakan aggregation function.
Contingency table#
Tabel yang berisi informasi berupa frekuensi, digunakan untuk menghitung jumlah kemunculan nilai terhadap kolom kategorinya.
Drop#
Proses penghapusan baris maupun kolom dari sebuah tabel.
Exploratory Data Analysis (EDA)#
Tahapan analisis data untuk memahami karakteristik dan menemukan pola yang terdapat pada data.
Imputation#
Cara untuk mengisi missing values dengan sebuah nilai berdasarkan metode tertentu.
Missing values#
Nilai yang hilang atau kosong pada data. Pada pandas
, missing values dinotasikan dengan NaN
(Not a Number) atau NaT
(Not a Time) untuk data type datetime64
.
Preprocessing#
Tahap pra-analisis yang dilakukan untuk mempersiapkan dan membersihkan data.
Type casting#
Proses mengubah sebuah data type ke tipe lainnya secara eksplisit, disebut juga sebagai explicit type conversion. Type casting merupakan salah satu proses dalam tahap preprocessing.