Python for Data Analysts#

../_images/P4DA.png

Argument#

Nilai yang digunakan untuk mengisi parameter yang terdapat pada sebuah function.

Contoh: type(32) → Nilai 32 adalah sebuah argument.

Assignment#

Proses untuk mengisi nilai ke sebuah variable. Pada Python, assignment dilakukan dengan menggunakan tanda sama dengan (=).

Contoh: activity = "programming"

Attribute#

Nilai yang tersimpan di dalam sebuah object. Pengaksesan nilai attribute dapat menggunakan perintah <nama_object>.<nama_attribute>

Contoh: DataFrame.dtypes.dtypes adalah salah satu attribute dari object DataFrame yang berisi informasi data type di setiap kolom.

Code#

Rangkaian pernyataan untuk melakukan komputasi yang dituliskan dalam sebuah bahasa pemrograman.

Code cell#

Pada Jupyter Notebook, code cell adalah cell untuk menuliskan code Python.

Comment#

Cara untuk memberikan tanda pada baris code yang tidak akan dieksekusi, digunakan untuk memberikan keterangan pada code. Pada Python, comment diawali dengan tanda pagar (#).

Conditional statement#

Pernyataan yang digunakan untuk mengevaluasi dengan hasil True / False. Pada analisis data sering digunakan untuk melakukan subsetting berdasarkan kondisi tertentu (conditional subsetting).

Conditional subsetting#

Operasi untuk menyaring (filter) baris berdasarkan kondisi tertentu.

Contoh: rice[rice.Sales > 5000]rice.Sales > 5000 adalah sebuah conditional statement yang mengevaluasi baris mana yang nilai Salesnya lebih dari 5000 (True) dan mana yang bukan (False). Saat kondisi tersebut dimasukkan ke dalam rice[ ], maka baris dengan nilai True akan tampil, sedangkan nilai False tidak ditampilkan.

Copying#

Cara untuk menduplikasi sebuah object yang akan saling independen. Perubahan pada object asli tidak mengubah object hasil duplikasi, begitupun sebaliknya.

Contoh: a = b.copy() → Perubahan pada nilai b tidak mengubah a, begitupun sebaliknya.

DataFrame#

Struktur data dua dimensi berbentuk tabular yang mempunyai baris dan kolom. DataFrame terdiri dari satu atau lebih Series.

Data type#

Klasifikasi jenis data yang menunjukkan bagaimana sebuah bahasa pemrograman mengenali nilai pada sebuah object.

Berikut adalah jenis data type yang digunakan dalam analisis data pada Python:

Pandas dtype

Python type

NumPy type

Kegunaan

object

str or mixed

string_, unicode_, mixed types

Berbentuk teks/tulisan atau campuran antara angka dan teks.

int64

int

int_, int8, int16, int32, int64, uint8, uint16, uint32, uint64

Bilangan bulat

float64

float

float_, float16, float32, float64

Bilangan angka/desimal

bool

bool

bool_

Nilai True/False

datetime64

-

datetime64[ns]

Nilai waktu

timedelta[ns]

-

-

Selisih antara dua nilai waktu

category

-

-

Nilai yang menjelaskan suatu kategori/kelompok

Environment, Virtual Environment#

Sebuah wadah yang digunakan untuk menampung library (dan versinya) serta Python (dan versinya). Environment digunakan agar setiap project dapat terisolasi satu sama lain.

Function#

Serangkaian perintah yang digunakan untuk melakukan suatu proses komputasi yang spesifik dan dapat digunakan berulang kali. Function menerima input berupa argument, memprosesnya, lalu mengembalikan output hasil komputasi.

Indentation#

Penulisan baris code yang menjorok ke kanan. Indentation dilakukan dengan cara menekan tombol Tab.

Integrated Development Environment (IDE)#

Sebuah aplikasi yang memfasilitasi pengembangan proyek dengan menggunakan bahasa pemrograman tertentu. IDE biasanya dilengkapi dengan source code editor dan debugger.

Jupyter kernel#

Sebuah mediator yang digunakan untuk menyambungkan setiap virtual environment ke Jupyter Notebook yang berada di base environment.

Library#

Kumpulan function yang terkumpul pada sebuah module yang dapat digunakan (import) di program lainnya.

Lambda function#

Ekspresi yang digunakan untuk membuat function tanpa nama (anonymous function).

List#

Struktur data yang digunakan untuk menyimpan lebih dari satu nilai dengan data type yang berbeda. Pada Python, list didefinisikan dengan lambang kurung siku [ ]

Markdown#

Sebuah Lightweight Markup Language yang digunakan untuk menuliskan teks dan dapat dikonversi menjadi format Hyper Text Markup Language (HTML).

Markdown cell#

Cell pada Jupyter Notebook yang digunakan untuk menuliskan teks dan melakukan formatting teks dengan menggunakan bahasa markdown.

Method#

Function yang dimiliki oleh sebuah object.

Contoh: DataFrame.head().head() adalah salah satu method yang menampilkan baris teratas dari sebuah DataFrame.

Module#

File Python berekstensi .py yang berisikan kumpulan function.

Object#

Bagian fundamental dari Object-Oriented Programming (OOP) yang memiliki dua komponen dasar, yaitu attribute dan method. Pada Python, semua nilai (misalnya integer, string, list, dll) disimpan dalam bentuk object.

Package#

Kontainer dari sebuah library; library yang didistribusikan.

Program#

Serangkaian perintah untuk melakukan suatu fungsi spesifik pada komputer.

Parameter#

Variable yang berada di dalam sebuah function. Parameter digunakan sebagai wadah yang dapat diisi saat pembuatan atau pemanggilan sebuah function.

Contoh: DataFrame.head(n=10)n adalah Parameter dari method .head()

Referencing#

Cara untuk menunjuk sebuah object yang sama dengan variable yang berbeda. Perubahan pada satu object akan mengubah object lainnya.

Contoh: a = b → Perubahan pada nilai a akan mengubah b. Untuk menghindari hal ini, gunakan konsep copying.

Regular Expression (RegEx)#

Ekspresi yang digunakan untuk mencocokan sebuah string/teks terhadap pola yang didefinisikan.

Slicing, Subsetting#

Mengambil data pada baris atau kolom tertentu.

Series#

Object yang berisi nilai dengan data type yang sama (homogen). Series merujuk pada sebuah kolom dalam DataFrame.

Variable#

Nama dari sebuah object yang merujuk pada suatu nilai.

Contoh: activity = "programming"activity adalah sebuah variable yang menyimpan nilai teks “programming”.