Python for Data Analysts#
Argument#
Nilai yang digunakan untuk mengisi parameter yang terdapat pada sebuah function.
Contoh: type(32)
→ Nilai 32 adalah sebuah argument.
Assignment#
Proses untuk mengisi nilai ke sebuah variable. Pada Python, assignment dilakukan dengan menggunakan tanda sama dengan (=
).
Contoh: activity = "programming"
Attribute#
Nilai yang tersimpan di dalam sebuah object. Pengaksesan nilai attribute dapat menggunakan perintah <nama_object>.<nama_attribute>
Contoh: DataFrame.dtypes
→ .dtypes
adalah salah satu attribute dari object DataFrame yang berisi informasi data type di setiap kolom.
Code#
Rangkaian pernyataan untuk melakukan komputasi yang dituliskan dalam sebuah bahasa pemrograman.
Code cell#
Pada Jupyter Notebook, code cell adalah cell untuk menuliskan code Python.
Comment#
Cara untuk memberikan tanda pada baris code yang tidak akan dieksekusi, digunakan untuk memberikan keterangan pada code. Pada Python, comment diawali dengan tanda pagar (#
).
Conditional statement#
Pernyataan yang digunakan untuk mengevaluasi dengan hasil True
/ False
. Pada analisis data sering digunakan untuk melakukan subsetting berdasarkan kondisi tertentu (conditional subsetting).
Conditional subsetting#
Operasi untuk menyaring (filter) baris berdasarkan kondisi tertentu.
Contoh: rice[rice.Sales > 5000]
→ rice.Sales > 5000
adalah sebuah conditional statement yang mengevaluasi baris mana yang nilai Salesnya lebih dari 5000 (True
) dan mana yang bukan (False
). Saat kondisi tersebut dimasukkan ke dalam rice[ ]
, maka baris dengan nilai True
akan tampil, sedangkan nilai False
tidak ditampilkan.
Copying#
Cara untuk menduplikasi sebuah object yang akan saling independen. Perubahan pada object asli tidak mengubah object hasil duplikasi, begitupun sebaliknya.
Contoh: a = b.copy()
→ Perubahan pada nilai b
tidak mengubah a
, begitupun sebaliknya.
DataFrame#
Struktur data dua dimensi berbentuk tabular yang mempunyai baris dan kolom. DataFrame terdiri dari satu atau lebih Series.
Data type#
Klasifikasi jenis data yang menunjukkan bagaimana sebuah bahasa pemrograman mengenali nilai pada sebuah object.
Berikut adalah jenis data type yang digunakan dalam analisis data pada Python:
Pandas dtype |
Python type |
NumPy type |
Kegunaan |
|
---|---|---|---|---|
object |
str or mixed |
string_, unicode_, mixed types |
Berbentuk teks/tulisan atau campuran antara angka dan teks. |
|
int64 |
int |
int_, int8, int16, int32, int64, uint8, uint16, uint32, uint64 |
Bilangan bulat |
|
float64 |
float |
float_, float16, float32, float64 |
Bilangan angka/desimal |
|
bool |
bool |
bool_ |
Nilai True/False |
|
datetime64 |
- |
datetime64[ns] |
Nilai waktu |
|
timedelta[ns] |
- |
- |
Selisih antara dua nilai waktu |
|
category |
- |
- |
Nilai yang menjelaskan suatu kategori/kelompok |
Environment, Virtual Environment#
Sebuah wadah yang digunakan untuk menampung library (dan versinya) serta Python (dan versinya). Environment digunakan agar setiap project dapat terisolasi satu sama lain.
Function#
Serangkaian perintah yang digunakan untuk melakukan suatu proses komputasi yang spesifik dan dapat digunakan berulang kali. Function menerima input berupa argument, memprosesnya, lalu mengembalikan output hasil komputasi.
Indentation#
Penulisan baris code yang menjorok ke kanan. Indentation dilakukan dengan cara menekan tombol Tab.
Integrated Development Environment (IDE)#
Sebuah aplikasi yang memfasilitasi pengembangan proyek dengan menggunakan bahasa pemrograman tertentu. IDE biasanya dilengkapi dengan source code editor dan debugger.
Jupyter kernel#
Sebuah mediator yang digunakan untuk menyambungkan setiap virtual environment ke Jupyter Notebook yang berada di base environment.
Library#
Kumpulan function yang terkumpul pada sebuah module yang dapat digunakan (import) di program lainnya.
Lambda function#
Ekspresi yang digunakan untuk membuat function tanpa nama (anonymous function).
List#
Struktur data yang digunakan untuk menyimpan lebih dari satu nilai dengan data type yang berbeda. Pada Python, list didefinisikan dengan lambang kurung siku [ ]
Markdown#
Sebuah Lightweight Markup Language yang digunakan untuk menuliskan teks dan dapat dikonversi menjadi format Hyper Text Markup Language (HTML).
Markdown cell#
Cell pada Jupyter Notebook yang digunakan untuk menuliskan teks dan melakukan formatting teks dengan menggunakan bahasa markdown.
Method#
Function yang dimiliki oleh sebuah object.
Contoh: DataFrame.head()
→ .head()
adalah salah satu method yang menampilkan baris teratas dari sebuah DataFrame.
Module#
File Python berekstensi .py yang berisikan kumpulan function.
Object#
Bagian fundamental dari Object-Oriented Programming (OOP) yang memiliki dua komponen dasar, yaitu attribute dan method. Pada Python, semua nilai (misalnya integer, string, list, dll) disimpan dalam bentuk object.
Package#
Kontainer dari sebuah library; library yang didistribusikan.
Program#
Serangkaian perintah untuk melakukan suatu fungsi spesifik pada komputer.
Parameter#
Variable yang berada di dalam sebuah function. Parameter digunakan sebagai wadah yang dapat diisi saat pembuatan atau pemanggilan sebuah function.
Contoh: DataFrame.head(n=10)
→ n
adalah Parameter dari method .head()
Referencing#
Cara untuk menunjuk sebuah object yang sama dengan variable yang berbeda. Perubahan pada satu object akan mengubah object lainnya.
Contoh: a = b
→ Perubahan pada nilai a
akan mengubah b
. Untuk menghindari hal ini, gunakan konsep copying.
Regular Expression (RegEx)#
Ekspresi yang digunakan untuk mencocokan sebuah string/teks terhadap pola yang didefinisikan.
Slicing, Subsetting#
Mengambil data pada baris atau kolom tertentu.
Series#
Object yang berisi nilai dengan data type yang sama (homogen). Series merujuk pada sebuah kolom dalam DataFrame.
Variable#
Nama dari sebuah object yang merujuk pada suatu nilai.
Contoh: activity = "programming"
→ activity
adalah sebuah variable yang menyimpan nilai teks “programming”.