Java - Sistem Unicode

Helo di sini, penyihir Java masa depan! Hari ini, kita akan melakukan perjalanan yang menarik ke dunia Unicode di Java. Sebagai guru sains komputer yang ramah ini, saya sangat gembira untuk menjawab anda melalui topik yang menarik ini. Jadi, rakitkan wands virtual anda (papan ketik), dan mari kita melompat!

Java - Unicode System

Apa itu Unicode?

Sebelum kita melompat ke spesifikasi Java, mari kita fahami apa itu Unicode. Bayangkan dunia di mana setiap komputer berbicara dalam bahasa yang berbeda - kesusahan, kan? Unicode adalah seperti penerjemah universal untuk komputer, memastikan bahwa teks secara konsisten direpresentasikan dan ditangani di atas platform dan bahasa yang berbeda.

Mengapa Unicode Penting di Java

Java, sebagai penjelajah global yang keren itu, dirancang dengan penggunaan internasional di hati. Ini menggunakan Unicode untuk merepresentasikan karakter, yang berarti program Java anda dapat menangani teks dalam hampir semua bahasa. Apakah itu keren?

Unicode di Java: Dasar-dasar

Di Java, setiap char adalah 16 bit panjang, yang berarti itu dapat merepresentasikan 65,536 karakter yang berbeda. Ini menutupi sebagian besar dari karakter yang ditetapkan Unicode.

Mari kita mulai dengan contoh sederhana:

char hati = '\u2665';
System.out.println("Saya " + hati + " Java!");

Ketika anda menjalankan ini, anda akan melihat: Saya ♥ Java!

Apakah itu lucu? \u2665 adalah sebuah urutan penyelamatan Unicode yang mewakili simbol hati.

Bekerja dengan Karakter Unicode

1. Urutan Penyelamatan Unicode

Seperti yang kita lihat di atas, Java memungkinkan anda untuk menggunakan urutan penyelamatan Unicode untuk merepresentasikan karakter. Ini adalah contoh lain:

String hai = "\u0048\u0065\u006C\u006C\u006F";
System.out.println(hai); // Menghasilkan: Hai

Setiap \uXXXX mewakili sebuah titik kode Unicode dalam heksadesimal.

2. Literal Karakter

Anda juga dapat menggunakan literal karakter langsung:

char omega = 'Ω';
System.out.println("Huruf terakhir dari abjad Yunani adalah: " + omega);

3. Menangani Pasangan Surrogate

Beberapa karakter Unicode (seperti banyak emoji) direpresentasikan oleh pasangan surrogate - dua nilai char. Mari kita lihat bagaimana menangani mereka:

String rakit = "?";
int titikKode = rakit.codePointAt(0);
System.out.println("Titik kode untuk emoji rakit adalah: " + titikKode);

Metode Unicode di Java

Java menyediakan beberapa metode untuk bekerja dengan Unicode. Mari kita lihat beberapa diantaranya:

Metode Keterangan
Character.isLetter(char ch) Menentukan jika char yang ditentukan adalah huruf
Character.isDigit(char ch) Menentukan jika char yang ditentukan adalah angka
Character.isWhitespace(char ch) Menentukan jika char yang ditentukan adalah ruang putih
Character.toUpperCase(char ch) Mengubah char menjadi huruf besar
Character.toLowerCase(char ch) Mengubah char menjadi huruf kecil

Mari kita lihat ini dalam aksi:

char ch = 'A';
System.out.println(Character.isLetter(ch)); // true
System.out.println(Character.isDigit(ch)); // false
System.out.println(Character.toLowerCase(ch)); // a

Menangani Bahasa yang Berbeda

Salah satu hal yang paling keren tentang Unicode adalah bagaimana ia memungkinkan kita untuk bekerja dengan bahasa yang berbeda dengan mudah. Lihat ini:

String[] ucapan = {
"Helo", // Bahasa Inggeris
"Bonjour", // Perancis
"こんにちは", // Jepang
"مرحبا", // Arab
"Здравствуйте" // Rusia
};

for (String penyapa : ucapan) {
System.out.println(penyapa);
}

Jalankan ini, dan anda akan melihat ucapan dalam lima bahasa yang berbeda!

Unicode dan Enkoding File

Ketika bekerja dengan file, penting untuk mempertimbangkan enkoding karakter. UTF-8 adalah pilihan populer karena dapat merepresentasikan semua karakter Unicode:

try (BufferedWriter penulis = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream("ucapan.txt"), StandardCharsets.UTF_8))) {
penulis.write("Helo, 世界!");
} catch (IOException e) {
e.printStackTrace();
}

Ini menulis "Helo, 世界!" (Helo, Dunia! dalam Bahasa Inggeris dan Cina) ke file menggunakan enkoding UTF-8.

Kesimpulan

Dan itu untuk saat ini, orang! Kita telah melakukan perjalanan yang cepat melalui sistem Unicode di Java. Dari representasi karakter dasar hingga menangani bahasa dan enkoding file yang berbeda, anda sekarang memiliki persediaan untuk membuat program Java anda benar-benar global.

Ingat, dunia pemrograman adalah luas dan menarik, sama seperti karakter yang ditetapkan Unicode. Tetap untuk menjelajah, tetap untuk mengkodekan, dan siapa tahu? Mungkin suatu hari anda akan membuat aplikasi yang membawa orang dari semua sudut dunia bersama-sama, memecahkan barier bahasa satu karakter pada satu waktu.

Sampaijumpa waktu berikutnya, coding yang bahagia! Dan ingat, di dunia pemrograman, anda adalah ? (itu Unicode untuk "bintang", by the way)!

Credits: Image by storyset