JavaScript - Unicode: Panduan Lengkap untuk Pemula

Hai sana, para pemula pemrogram! Hari ini, kita akan melangkah ke dalam dunia Unicode di JavaScript. Jangan khawatir jika Anda masih baru dalam pemrograman - saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini secara bertahap. Jadi, ambil secangkir kopi (atau teh, jika itu hal Anda), dan mari kita masuk ke dalamnya!

JavaScript - Unicode

Apa Itu Unicode?

Imaginasi Anda menulis surat kepada teman tulis Anda di China, tetapi papan ketik Anda hanya memiliki huruf Inggris. Frustrasi, kan? Ini adalah tempat Unicode datang untuk menyelamatkan!

Unicode seperti kamus magis yang memberikan nomor unik (disebut "code point") untuk setiap karakter di setiap sistem tulisan di seluruh dunia. Itu tidak hanya tentang huruf dan angka - itu termasuk simbol, emoji, dan bahkan naskah kuno!

Sebagai contoh, huruf 'A' memiliki code point Unicode U+0041, sedangkan karakter Cina '中' (berarti "tengah") memiliki code point U+4E2D.

Intuisi di Balik Unicode

Pikirkan Unicode sebagai bahasa universal untuk komputer. Sebelum Unicode, berbagai wilayah di dunia menggunakan sistem pengkodean yang berbeda, yang menyebabkan banyak kebingungan dan masalah kompatibilitas. Itu seperti memiliki menara Babel di dunia digital!

Unicode menyelesaikan ini dengan menciptakan sistem standar yang dapat mewakili karakter dari semua sistem tulisan. Itu seperti memberikan setiap karakter dalam setiap bahasa kartu ID unik yang dapat diakui oleh komputer di mana saja.

Unicode di JavaScript

Sekarang, mari kita lihat bagaimana JavaScript menangani Unicode. JavaScript menggunakan pengkodean UTF-16, yang berarti itu dapat mewakili langsung 65,536 karakter Unicode pertama (juga dikenal sebagai Basic Multilingual Plane atau BMP).

Berikut adalah tabel metode yang disediakan oleh JavaScript untuk bekerja dengan Unicode:

Metode Deskripsi
String.fromCharCode() Membuat string dari nilai Unicode
String.fromCodePoint() Membuat string dari code point
charCodeAt() Mengembalikan nilai Unicode karakter
codePointAt() Mengembalikan code point karakter

Mari kita lihat beberapa contoh untuk melihat ini dalam aksi!

Contoh

1. Membuat string dari nilai Unicode

let heart = String.fromCharCode(9829);
console.log(heart); // ♥

Dalam contoh ini, kita menggunakan String.fromCharCode() untuk membuat simbol hati. Nomor 9829 adalah nilai Unicode untuk hati hitam (♥). Itu seperti mengatakan ke JavaScript, "Hey, berikan saya karakter yang memiliki nomor ID 9829!"

2. Mendapatkan nilai Unicode karakter

let str = "Hello, 世界!";
console.log(str.charCodeAt(7)); // 19990

Di sini, kita menggunakan charCodeAt() untuk mendapatkan nilai Unicode karakter pada indeks 7 di string kita (yang adalah '世'). Itu seperti bertanya, "Apa nomor ID karakter ke-8 di string ini?"

3. Bekerja dengan karakter di luar BMP

let emoji = "?";
console.log(emoji.codePointAt(0)); // 128640
console.log(String.fromCodePoint(128640)); // ?

Untuk karakter di luar Basic Multilingual Plane (seperti banyak emoji), kita perlu menggunakan codePointAt() dan String.fromCodePoint(). Dalam contoh ini, kita bekerja dengan emoji roket. Itu seperti menghadapi karakter khusus yang memiliki nomor ID yang sangat tinggi!

4. Menghitung karakter dengan benar

let text = "? Rainbow";
console.log(text.length); // 9
console.log([...text].length); // 8

Ini adalah yang sulit! JavaScript menganggap karakter di luar BMP sebagai dua karakter. Jadi, emoji彩虹 (?) dihitung sebagai dua karakter. Jika kita ingin menghitungnya sebagai satu, kita dapat menggunakan operator spread (...) untuk memecah string menjadi array karakter.

5. Urutan pelarian Unicode

console.log("\u{1F600}"); // ?
console.log("\u{1F64B}\u{200D}\u{2640}\u{FE0F}"); // ?‍♀️

Urutan pelarian Unicode memungkinkan kita mewakili karakter Unicode dalam kode kita. Itu seperti menulis nomor ID kartu instead of the actual character. Syntax \u{...} digunakan untuk semua code point Unicode.

Kesimpulan

Dan di sana Anda punya nya, teman-teman! Kita telah melakukan perjalanan singkat melalui Unicode di JavaScript. Dari memahami apa itu Unicode, melihat bagaimana JavaScript menanganinya, hingga bermain dengan beberapa contoh menarik - saya harap Anda menikmati perjalanan ini seperti saya.

Ingat, Unicode adalah apa yang memungkinkan kita menulis perangkat lunak yang dapat digunakan oleh orang di seluruh dunia, dalam bahasa mana saja. Itu adalah contoh indah tentang bagaimana teknologi dapat membawa kita bersama dan membongkar batasan.

Sebagai Anda terus melanjutkan perjalanan pemrograman Anda, terus menjelajahi dan mencoba Unicode. Cobalah menulis pesan dalam bahasa yang berbeda, atau bersenang-senang dengan emoji dalam kode Anda. Dunia pemrograman luas dan menarik, dan Unicode adalah paspor Anda ke komunikasi global!

Selamat pemrograman, dan sampaijumpa lagi - semoga kode Anda bebas bug dan kopi Anda kuat! ?☕

Credits: Image by storyset