JavaScript - Unicode: Panduan Komprehensif untuk Pemula
Hai teman-teman yang sedang belajar! Hari ini, kita akan mengemban sebuah perjalanan menarik ke dunia Unicode dalam JavaScript. Jangan khawatir jika Anda baru dalam programming – saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini satu demi satu. Jadi, ambil secangkir kopi (atau teh, jika itu hal Anda suka), dan mari kita masuk ke dalam!
Apa Itu Unicode?
Imaginasi Anda mencoba menulis surat kepada teman tulis Anda di China, tetapi papan ketik Anda hanya memiliki huruf Inggris. Frustrasi, kan? Ini adalah tempat Unicode datang ke bantuan!
Unicode adalah seperti sebuah kamus ajaib yang memberikan nomor unik (disebut "code point") untuk setiap karakter di setiap sistem penulisan bahasa di dunia. Itu tidak hanya tentang huruf dan angka – itu termasuk simbol, emoji, dan bahkan naskah kuno!
Misalnya, huruf 'A' memiliki code point Unicode U+0041, sedangkan karakter Cina '中' (berarti "tengah") memiliki code point U+4E2D.
Intuisi dibalik Unicode
Pikirkan Unicode sebagai bahasa universal untuk komputer. Sebelum Unicode, berbagai wilayah di dunia menggunakan sistem pengkodean yang berbeda, yang menyebabkan banyak kebingungan dan masalah kompatibilitas. Itu seperti memiliki Menara Babel di dunia digital!
Unicode menyelesaikan ini dengan menciptakan sistem standar yang dapat mewakili karakter dari semua sistem penulisan. Itu seperti memberikan setiap karakter di setiap bahasa kartu ID unik yang komputer mana pun dapat mengenal.
Unicode dalam JavaScript
Sekarang, mari kita lihat bagaimana JavaScript menangani Unicode. JavaScript menggunakan pengkodean UTF-16, yang berarti itu dapat secara langsung mewakili 65,536 karakter Unicode pertama (juga dikenal sebagai Basic Multilingual Plane atau BMP).
Berikut adalah tabel metode yang disediakan oleh JavaScript untuk bekerja dengan Unicode:
Metode | Deskripsi |
---|---|
String.fromCharCode() |
Membuat string dari nilai Unicode |
String.fromCodePoint() |
Membuat string dari code point |
charCodeAt() |
Mengembalikan nilai Unicode dari karakter |
codePointAt() |
Mengembalikan code point dari karakter |
Mari kita lihat beberapa contoh untuk melihat ini dalam aksi!
Contoh
1. Membuat string dari nilai Unicode
let heart = String.fromCharCode(9829);
console.log(heart); // ♥
Dalam contoh ini, kita menggunakan String.fromCharCode()
untuk membuat simbol hati. Nilai 9829 adalah nilai Unicode untuk hati hitam (♥). Itu seperti mengatakan ke JavaScript, "Hey, berikan saya karakter yang memiliki nomor ID 9829!"
2. Mendapatkan nilai Unicode dari karakter
let str = "Hello, 世界!";
console.log(str.charCodeAt(7)); // 19990
Di sini, kita menggunakan charCodeAt()
untuk mendapatkan nilai Unicode dari karakter pada indeks 7 di string kita (yang adalah '世'). Itu seperti bertanya, "Nomor ID karakter ke-8 di string ini adalah apa?"
3. Bekerja dengan karakter di luar BMP
let emoji = "?";
console.log(emoji.codePointAt(0)); // 128640
console.log(String.fromCodePoint(128640)); // ?
Untuk karakter di luar Basic Multilingual Plane (seperti banyak emoji), kita perlu menggunakan codePointAt()
dan String.fromCodePoint()
. Dalam contoh ini, kita bekerja dengan emoji roket. Itu seperti berurusan dengan karakter khusus yang memiliki nomor ID yang sangat tinggi!
4. Menghitung karakter dengan benar
let text = "? Rainbow";
console.log(text.length); // 9
console.log([...text].length); // 8
Ini adalah contoh yang sulit! JavaScript menganggap karakter di luar BMP sebagai dua karakter. Jadi, emoji彩虹 (?) dihitung sebagai dua karakter. Jika kita ingin menghitungnya sebagai satu, kita dapat menggunakan operator spread (...) untuk memecah string menjadi array karakter.
5. Urutan escape Unicode
console.log("\u{1F600}"); // ?
console.log("\u{1F64B}\u{200D}\u{2640}\u{FE0F}"); // ?♀️
Urutan escape Unicode memungkinkan kita untuk mewakili karakter Unicode dalam kode kita. Itu seperti menulis nomor ID kartu instead of the actual character. Syntax \u{...}
digunakan untuk semua code point Unicode.
Kesimpulan
Dan begitu saja, teman-teman! Kita telah melakukan perjalanan singkat melalui Unicode dalam JavaScript. Dari memahami apa itu Unicode, melihat bagaimana JavaScript menangani itu, hingga bermain dengan beberapa contoh menarik – saya harap Anda menikmati perjalanan ini seolah-olah saya.
Ingat, Unicode adalah yang memungkinkan kita menulis software yang dapat digunakan oleh orang di seluruh dunia, dalam semua bahasa. Itu adalah contoh indah tentang bagaimana teknologi dapat membawa kita bersama dan membongkar batas-batas.
Sebagai Anda terus mengemban perjalanan coding Anda, terus eksplorasi dan eksperimen dengan Unicode. Cobalah menulis pesan dalam bahasa yang berbeda, atau bersenang-senang dengan emoji dalam kode Anda. Dunia programming luas dan menarik, dan Unicode adalah paspor Anda ke komunikasi global!
Selamat coding, dan sampai jumpa lagi – semoga kode Anda bebas bug dan kopi Anda kuat! ?☕
Credits: Image by storyset