Fungsi SELECT , DISTINCT dan COUNT di SQL

Viony Wijaya
2 min readAug 12, 2021

--

SQL (Structured Query Language) merupakan skill krusial yang perlu dimiliki dan dipahami tidak hanya oleh data scientist tapi juga bagi siapapun yang ingin berkecimpung di industri data science. SQL umumnya digunakan untuk mengakses data yang berada di database. Pada artikel kali ini, kita akan membahas mengenai fungsi SELECT dan COUNT.

Sesuai dengan namanya, SELECT digunakan untuk memilih suatu data tertentu dari tabel yang diminta. Contohnya sebagai berikut:

SELECT name

FROM people;

Meskipun statement query di atas menggunakan huruf besar untuk statement SELECT dan FROM namun kita juga bisa menggunakan huruf kecil untuk kedua keyword tersebut karena keyword di SQL tidak bersifat case-sensitive. Namun, penggunaan huruf besar memang direkomendasikan guna membedakan antara keyword dengan nama kolom/tabel. Semicolon (;) digunakan untuk memberitahu SQL dimana akhir query kita.

Statement query di atas merupakan statement yang digunakan untuk mengakses kolom tunggal, bagaimana jika kita perlu mengakses beberapa kolom sekaligus? SQL menjadikan hal ini cukup mudah dimana kita hanya perlu menambahkan koma untuk setiap kolom yang ingin kita akses dan menambahkan * jika kita ingin mengakses semua kolom yang ada. Contohnya sebagai berikut:

SELECT name, birthdate

FROM people;

dan

SELECT *

FROM people;

Jika kita ingin membatasi jumlah kolom yang ingin diakses, keyword LIMIT merupakan solusinya.

SELECT *

FROM people

LIMIT 10;

Biasanya pada data yang kita gunakan terdapat cukup banyak duplicate value dan seringkali kita hanya membutuhkan data yang bersifat unik saja. Untuk menampilkan value unik yang dibutuhkan, kita dapat menggunakan keyword DISTINCT. Contohnya sebagai berikut:

SELECT DISTINCT language

FROM films;

Setelah mengambil data unik yang diperlukan maka saatnya kita mengetahui ada berapa jumlah data unik tersebut dalam bentuk angka. Disini kita mengkombinasikan fungsi DISTINCT dan COUNT sekaligus.

SELECT COUNT(DISTINCT birthdate)

FROM people;

Namun bagaimana jika kita hanya ingin mengetahui berapa banyak jumlah non-missing value di kolom tertentu? Fungsi COUNT tetap bisa digunakan secara tunggal.

SELECT COUNT(birthdate)

FROM people;

Jika ada yang kurang tepat, feel free to comment ya!

--

--