JavaScript - Unicode: Panduan Komprehensif untuk Pemula

Hai teman-teman yang sedang belajar! Hari ini, kita akan mengemban sebuah perjalanan menarik ke dunia Unicode dalam JavaScript. Jangan khawatir jika Anda baru dalam programming – saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini satu demi satu. Jadi, ambil secangkir kopi (atau teh, jika itu hal Anda suka), dan mari kita masuk ke dalam!

JavaScript - Unicode

Apa Itu Unicode?

Imaginasi Anda mencoba menulis surat kepada teman tulis Anda di China, tetapi papan ketik Anda hanya memiliki huruf Inggris. Frustrasi, kan? Ini adalah tempat Unicode datang ke bantuan!

Unicode adalah seperti sebuah kamus ajaib yang memberikan nomor unik (disebut "code point") untuk setiap karakter di setiap sistem penulisan bahasa di dunia. Itu tidak hanya tentang huruf dan angka – itu termasuk simbol, emoji, dan bahkan naskah kuno!

Misalnya, huruf 'A' memiliki code point Unicode U+0041, sedangkan karakter Cina '中' (berarti "tengah") memiliki code point U+4E2D.

Intuisi dibalik Unicode

Pikirkan Unicode sebagai bahasa universal untuk komputer. Sebelum Unicode, berbagai wilayah di dunia menggunakan sistem pengkodean yang berbeda, yang menyebabkan banyak kebingungan dan masalah kompatibilitas. Itu seperti memiliki Menara Babel di dunia digital!

Unicode menyelesaikan ini dengan menciptakan sistem standar yang dapat mewakili karakter dari semua sistem penulisan. Itu seperti memberikan setiap karakter di setiap bahasa kartu ID unik yang komputer mana pun dapat mengenal.

Unicode dalam JavaScript

Sekarang, mari kita lihat bagaimana JavaScript menangani Unicode. JavaScript menggunakan pengkodean UTF-16, yang berarti itu dapat secara langsung mewakili 65,536 karakter Unicode pertama (juga dikenal sebagai Basic Multilingual Plane atau BMP).

Berikut adalah tabel metode yang disediakan oleh JavaScript untuk bekerja dengan Unicode:

Metode Deskripsi
String.fromCharCode() Membuat string dari nilai Unicode
String.fromCodePoint() Membuat string dari code point
charCodeAt() Mengembalikan nilai Unicode dari karakter
codePointAt() Mengembalikan code point dari karakter

Mari kita lihat beberapa contoh untuk melihat ini dalam aksi!

Contoh

1. Membuat string dari nilai Unicode

let heart = String.fromCharCode(9829);
console.log(heart); // ♥

Dalam contoh ini, kita menggunakan String.fromCharCode() untuk membuat simbol hati. Nilai 9829 adalah nilai Unicode untuk hati hitam (♥). Itu seperti mengatakan ke JavaScript, "Hey, berikan saya karakter yang memiliki nomor ID 9829!"

2. Mendapatkan nilai Unicode dari karakter

let str = "Hello, 世界!";
console.log(str.charCodeAt(7)); // 19990

Di sini, kita menggunakan charCodeAt() untuk mendapatkan nilai Unicode dari karakter pada indeks 7 di string kita (yang adalah '世'). Itu seperti bertanya, "Nomor ID karakter ke-8 di string ini adalah apa?"

3. Bekerja dengan karakter di luar BMP

let emoji = "?";
console.log(emoji.codePointAt(0)); // 128640
console.log(String.fromCodePoint(128640)); // ?

Untuk karakter di luar Basic Multilingual Plane (seperti banyak emoji), kita perlu menggunakan codePointAt() dan String.fromCodePoint(). Dalam contoh ini, kita bekerja dengan emoji roket. Itu seperti berurusan dengan karakter khusus yang memiliki nomor ID yang sangat tinggi!

4. Menghitung karakter dengan benar

let text = "? Rainbow";
console.log(text.length); // 9
console.log([...text].length); // 8

Ini adalah contoh yang sulit! JavaScript menganggap karakter di luar BMP sebagai dua karakter. Jadi, emoji彩虹 (?) dihitung sebagai dua karakter. Jika kita ingin menghitungnya sebagai satu, kita dapat menggunakan operator spread (...) untuk memecah string menjadi array karakter.

5. Urutan escape Unicode

console.log("\u{1F600}"); // ?
console.log("\u{1F64B}\u{200D}\u{2640}\u{FE0F}"); // ?‍♀️

Urutan escape Unicode memungkinkan kita untuk mewakili karakter Unicode dalam kode kita. Itu seperti menulis nomor ID kartu instead of the actual character. Syntax \u{...} digunakan untuk semua code point Unicode.

Kesimpulan

Dan begitu saja, teman-teman! Kita telah melakukan perjalanan singkat melalui Unicode dalam JavaScript. Dari memahami apa itu Unicode, melihat bagaimana JavaScript menangani itu, hingga bermain dengan beberapa contoh menarik – saya harap Anda menikmati perjalanan ini seolah-olah saya.

Ingat, Unicode adalah yang memungkinkan kita menulis software yang dapat digunakan oleh orang di seluruh dunia, dalam semua bahasa. Itu adalah contoh indah tentang bagaimana teknologi dapat membawa kita bersama dan membongkar batas-batas.

Sebagai Anda terus mengemban perjalanan coding Anda, terus eksplorasi dan eksperimen dengan Unicode. Cobalah menulis pesan dalam bahasa yang berbeda, atau bersenang-senang dengan emoji dalam kode Anda. Dunia programming luas dan menarik, dan Unicode adalah paspor Anda ke komunikasi global!

Selamat coding, dan sampai jumpa lagi – semoga kode Anda bebas bug dan kopi Anda kuat! ?☕

Credits: Image by storyset