JavaScript - Unicode: Panduan Lengkap untuk Pemula
Hai sana, para pemula pemrogram! Hari ini, kita akan melangkah ke dalam dunia Unicode di JavaScript. Jangan khawatir jika Anda masih baru dalam pemrograman - saya akan menjadi panduan ramah Anda, dan kita akan mengambil langkah ini secara bertahap. Jadi, ambil secangkir kopi (atau teh, jika itu hal Anda), dan mari kita masuk ke dalamnya!
Apa Itu Unicode?
Imaginasi Anda menulis surat kepada teman tulis Anda di China, tetapi papan ketik Anda hanya memiliki huruf Inggris. Frustrasi, kan? Ini adalah tempat Unicode datang untuk menyelamatkan!
Unicode seperti kamus magis yang memberikan nomor unik (disebut "code point") untuk setiap karakter di setiap sistem tulisan di seluruh dunia. Itu tidak hanya tentang huruf dan angka - itu termasuk simbol, emoji, dan bahkan naskah kuno!
Sebagai contoh, huruf 'A' memiliki code point Unicode U+0041, sedangkan karakter Cina '中' (berarti "tengah") memiliki code point U+4E2D.
Intuisi di Balik Unicode
Pikirkan Unicode sebagai bahasa universal untuk komputer. Sebelum Unicode, berbagai wilayah di dunia menggunakan sistem pengkodean yang berbeda, yang menyebabkan banyak kebingungan dan masalah kompatibilitas. Itu seperti memiliki menara Babel di dunia digital!
Unicode menyelesaikan ini dengan menciptakan sistem standar yang dapat mewakili karakter dari semua sistem tulisan. Itu seperti memberikan setiap karakter dalam setiap bahasa kartu ID unik yang dapat diakui oleh komputer di mana saja.
Unicode di JavaScript
Sekarang, mari kita lihat bagaimana JavaScript menangani Unicode. JavaScript menggunakan pengkodean UTF-16, yang berarti itu dapat mewakili langsung 65,536 karakter Unicode pertama (juga dikenal sebagai Basic Multilingual Plane atau BMP).
Berikut adalah tabel metode yang disediakan oleh JavaScript untuk bekerja dengan Unicode:
Metode | Deskripsi |
---|---|
String.fromCharCode() |
Membuat string dari nilai Unicode |
String.fromCodePoint() |
Membuat string dari code point |
charCodeAt() |
Mengembalikan nilai Unicode karakter |
codePointAt() |
Mengembalikan code point karakter |
Mari kita lihat beberapa contoh untuk melihat ini dalam aksi!
Contoh
1. Membuat string dari nilai Unicode
let heart = String.fromCharCode(9829);
console.log(heart); // ♥
Dalam contoh ini, kita menggunakan String.fromCharCode()
untuk membuat simbol hati. Nomor 9829 adalah nilai Unicode untuk hati hitam (♥). Itu seperti mengatakan ke JavaScript, "Hey, berikan saya karakter yang memiliki nomor ID 9829!"
2. Mendapatkan nilai Unicode karakter
let str = "Hello, 世界!";
console.log(str.charCodeAt(7)); // 19990
Di sini, kita menggunakan charCodeAt()
untuk mendapatkan nilai Unicode karakter pada indeks 7 di string kita (yang adalah '世'). Itu seperti bertanya, "Apa nomor ID karakter ke-8 di string ini?"
3. Bekerja dengan karakter di luar BMP
let emoji = "?";
console.log(emoji.codePointAt(0)); // 128640
console.log(String.fromCodePoint(128640)); // ?
Untuk karakter di luar Basic Multilingual Plane (seperti banyak emoji), kita perlu menggunakan codePointAt()
dan String.fromCodePoint()
. Dalam contoh ini, kita bekerja dengan emoji roket. Itu seperti menghadapi karakter khusus yang memiliki nomor ID yang sangat tinggi!
4. Menghitung karakter dengan benar
let text = "? Rainbow";
console.log(text.length); // 9
console.log([...text].length); // 8
Ini adalah yang sulit! JavaScript menganggap karakter di luar BMP sebagai dua karakter. Jadi, emoji彩虹 (?) dihitung sebagai dua karakter. Jika kita ingin menghitungnya sebagai satu, kita dapat menggunakan operator spread (...) untuk memecah string menjadi array karakter.
5. Urutan pelarian Unicode
console.log("\u{1F600}"); // ?
console.log("\u{1F64B}\u{200D}\u{2640}\u{FE0F}"); // ?♀️
Urutan pelarian Unicode memungkinkan kita mewakili karakter Unicode dalam kode kita. Itu seperti menulis nomor ID kartu instead of the actual character. Syntax \u{...}
digunakan untuk semua code point Unicode.
Kesimpulan
Dan di sana Anda punya nya, teman-teman! Kita telah melakukan perjalanan singkat melalui Unicode di JavaScript. Dari memahami apa itu Unicode, melihat bagaimana JavaScript menanganinya, hingga bermain dengan beberapa contoh menarik - saya harap Anda menikmati perjalanan ini seperti saya.
Ingat, Unicode adalah apa yang memungkinkan kita menulis perangkat lunak yang dapat digunakan oleh orang di seluruh dunia, dalam bahasa mana saja. Itu adalah contoh indah tentang bagaimana teknologi dapat membawa kita bersama dan membongkar batasan.
Sebagai Anda terus melanjutkan perjalanan pemrograman Anda, terus menjelajahi dan mencoba Unicode. Cobalah menulis pesan dalam bahasa yang berbeda, atau bersenang-senang dengan emoji dalam kode Anda. Dunia pemrograman luas dan menarik, dan Unicode adalah paspor Anda ke komunikasi global!
Selamat pemrograman, dan sampaijumpa lagi - semoga kode Anda bebas bug dan kopi Anda kuat! ?☕
Credits: Image by storyset