# Python for Data Analysts

<img src="assets/P4DA/P4DA.png" width="100%" align="center"/>

## Argument
Nilai yang digunakan untuk mengisi [**parameter**](#parameter) yang terdapat pada sebuah function.

Contoh: `type(32)` → Nilai 32 adalah sebuah [**argument**](#argument).

## Assignment
Proses untuk mengisi nilai ke sebuah [**variable**](#variable). Pada Python, [**assignment**](#assignment) dilakukan dengan menggunakan tanda sama dengan (`=`).

Contoh: `activity = "programming"`

## Attribute
Nilai yang tersimpan di dalam sebuah [**object**](#object). Pengaksesan nilai [**attribute**](#attribute) dapat menggunakan perintah `<nama_object>.<nama_attribute>`

Contoh: `DataFrame.dtypes` → `.dtypes` adalah salah satu [**attribute**](#attribute) dari object [**DataFrame**](#dataframe) yang berisi informasi [**data type**](#data-type) di setiap kolom.

## Code
Rangkaian pernyataan untuk melakukan komputasi yang dituliskan dalam sebuah bahasa pemrograman.

## Code cell
Pada *Jupyter Notebook*, [**code cell**](#code-cell) adalah *cell* untuk menuliskan [**code**](#code) Python.

## Comment
Cara untuk memberikan tanda pada baris [**code**](#code) yang tidak akan dieksekusi, digunakan untuk memberikan keterangan pada [**code**](#code). Pada Python, [**comment**](#comment) diawali dengan tanda pagar (`#`).

## Conditional statement
Pernyataan yang digunakan untuk mengevaluasi dengan hasil `True` / `False`. Pada analisis data sering digunakan untuk melakukan [**subsetting**](#slicing-subsetting) berdasarkan kondisi tertentu ([**conditional subsetting**](#conditional-subsetting)).

## Conditional subsetting
Operasi untuk menyaring (*filter*) baris berdasarkan kondisi tertentu.

Contoh: `rice[rice.Sales > 5000]` → `rice.Sales > 5000` adalah sebuah [**conditional statement**](#conditional-statement) yang mengevaluasi baris mana yang nilai Salesnya lebih dari 5000 (`True`) dan mana yang bukan (`False`). Saat kondisi tersebut dimasukkan ke dalam `rice[ ]`, maka baris dengan nilai `True` akan tampil, sedangkan nilai `False` tidak ditampilkan.

## Copying
Cara untuk menduplikasi sebuah [**object**](#object) yang akan saling independen. Perubahan pada [**object**](#object) asli tidak mengubah [**object**](#object) hasil duplikasi, begitupun sebaliknya.

Contoh: `a = b.copy()` → Perubahan pada nilai `b` tidak mengubah `a`, begitupun sebaliknya.

## DataFrame
Struktur data dua dimensi berbentuk tabular yang mempunyai baris dan kolom. [**DataFrame**](#dataframe) terdiri dari satu atau lebih [**Series**](#series).

## Data type
Klasifikasi jenis data yang menunjukkan bagaimana sebuah bahasa pemrograman mengenali nilai pada sebuah [**object**](#object).

Berikut adalah jenis [**data type**](#data-type) yang digunakan dalam analisis data pada Python:

|  Pandas dtype |  Python type |                           NumPy type                           |                           Kegunaan                          |   |
|:-------------:|:------------:|:--------------------------------------------------------------:|:-----------------------------------------------------------:|---|
|     object    | str or mixed |                 string_, unicode_, mixed types                 | Berbentuk teks/tulisan atau campuran antara angka dan teks. |   |
|     int64     |      int     | int_, int8, int16, int32, int64, uint8, uint16, uint32, uint64 |                        Bilangan bulat                       |   |
|    float64    |     float    |                float_, float16, float32, float64               |                    Bilangan angka/desimal                   |   |
|      bool     |     bool     |                              bool_                             |                       Nilai True/False                      |   |
|   datetime64  |       -      |                         datetime64[ns]                         |                         Nilai waktu                         |   |
| timedelta[ns] |       -      |                                -                               |                Selisih antara dua nilai waktu               |   |
|    category   |       -      |                                -                               |        Nilai yang menjelaskan suatu kategori/kelompok       |   |

## Environment, Virtual Environment
Sebuah wadah yang digunakan untuk menampung [**library**](#library) (dan versinya) serta Python (dan versinya). [**Environment**](#environment-virtual-environment) digunakan agar setiap *project* dapat terisolasi satu sama lain.

## Function
Serangkaian perintah yang digunakan untuk melakukan suatu proses komputasi yang spesifik dan dapat digunakan berulang kali. [**Function**](#function) menerima *input* berupa [**argument**](#argument), memprosesnya, lalu mengembalikan *output* hasil komputasi.

## Indentation
Penulisan baris [**code**](#code) yang menjorok ke kanan. [**Indentation**](#indentation) dilakukan dengan cara menekan tombol Tab.

## Integrated Development Environment (IDE)
Sebuah aplikasi yang memfasilitasi pengembangan proyek dengan menggunakan bahasa pemrograman tertentu. [**IDE**](#integrated-development-environment-ide) biasanya dilengkapi dengan *source code editor* dan *debugger*.

## Jupyter kernel
Sebuah mediator yang digunakan untuk menyambungkan setiap [**virtual environment**](#environment-virtual-environment) ke *Jupyter Notebook* yang berada di base [**environment**](#environment-virtual-environment).

## Library
Kumpulan [**function**](#function) yang terkumpul pada sebuah [**module**](#module) yang dapat digunakan (*import*) di program lainnya.

## Lambda function
Ekspresi yang digunakan untuk membuat [**function**](#function) tanpa nama (*anonymous* [**function**](#function)).

## List
Struktur data yang digunakan untuk menyimpan lebih dari satu nilai dengan [**data type**](#data-type) yang berbeda. Pada Python, [**list**](#list) didefinisikan dengan lambang kurung siku `[ ]`

## Markdown
Sebuah *Lightweight Markup Language* yang digunakan untuk menuliskan teks dan dapat dikonversi menjadi format *Hyper Text Markup Language* (HTML).

## Markdown cell
Cell pada *Jupyter Notebook* yang digunakan untuk menuliskan teks dan melakukan *formatting* teks dengan menggunakan bahasa [**markdown**](#markdown).

## Method
[**Function**](#function) yang dimiliki oleh sebuah [**object**](#object).

Contoh: `DataFrame.head()` → `.head()` adalah salah satu [**method**](#method) yang menampilkan baris teratas dari sebuah [**DataFrame**](#dataframe).

## Module
File Python berekstensi .py yang berisikan kumpulan [**function**](#function).

## Object
Bagian fundamental dari *Object-Oriented Programming* (OOP) yang memiliki dua komponen dasar, yaitu [**attribute**](#attribute) dan [**method**](#method). Pada Python, semua nilai (misalnya integer, string, [**list**](#list), dll) disimpan dalam bentuk [**object**](#object).

## Package
Kontainer dari sebuah [**library**](#library); [**library**](#library) yang didistribusikan.

## Program
Serangkaian perintah untuk melakukan suatu fungsi spesifik pada komputer.

## Parameter
[**Variable**](#variable) yang berada di dalam sebuah [**function**](#function). [**Parameter**](#parameter) digunakan sebagai wadah yang dapat diisi saat pembuatan atau pemanggilan sebuah [**function**](#function).

Contoh: `DataFrame.head(n=10)` → `n` adalah [**Parameter**](#parameter) dari [**method**](#method) `.head()`

## Referencing
Cara untuk menunjuk sebuah [**object**](#object) yang sama dengan [**variable**](#variable) yang berbeda. Perubahan pada satu [**object**](#object) akan mengubah [**object**](#object) lainnya.

Contoh: `a = b` → Perubahan pada nilai `a` akan mengubah `b`. Untuk menghindari hal ini, gunakan konsep [**copying**](#copying).

## Regular Expression (RegEx)
Ekspresi yang digunakan untuk mencocokan sebuah string/teks terhadap pola yang didefinisikan.

## Slicing, Subsetting
Mengambil data pada baris atau kolom tertentu.

## Series
[**Object**](#object) yang berisi nilai dengan [**data type**](#data-type) yang sama (homogen). [**Series**](#series) merujuk pada sebuah kolom dalam [**DataFrame**](#dataframe).

## Variable
Nama dari sebuah [**object**](#object) yang merujuk pada suatu nilai.

Contoh: `activity = "programming"` → `activity` adalah sebuah [**variable**](#variable) yang menyimpan nilai teks "programming".