JavaScript - Unicode: Ein umfassender Leitfaden für Anfänger
Hallo da draußen, angehende Programmierer! Heute machen wir uns auf eine aufregende Reise in die Welt der Unicode in JavaScript. Machen Sie sich keine Sorgen, wenn Sie neu im Programmieren sind – ich werde Ihr freundlicher Guide sein, und wir gehen das Schritt für Schritt durch. Also holen Sie sich eine Tasse Kaffee (oder Tee, wenn das Ihr Ding ist) und tauchen wir ein!
Was ist Unicode?
Stellen Sie sich vor, Sie versuchen, einen Brief an Ihren Brieffreund in China zu schreiben, aber Ihre Tastatur hat nur englische Buchstaben. Frustrierend, oder? Hier kommt Unicode zur Rettung!
Unicode ist wie ein magisches Wörterbuch, das jedem Zeichen in jedem Schriftsystem der Welt eine eindeutige Zahl zuweist (genannt "Codepoint"). Es geht nicht nur um Buchstaben und Zahlen – es umfasst Symbole, Emojis und sogar alte Schriften!
Zum Beispiel hat der Buchstabe 'A' den Unicode-Codepunkt U+0041, während der chinesische Buchstabe '中' (bedeutet "mitte") den Codepunkt U+4E2D hat.
Intuition hinter Unicode
Denken Sie an Unicode als eine universelle Sprache für Computer. Bevor Unicode existierte, verwendeten verschiedene Regionen der Welt unterschiedliche Kodierungssysteme, was zu vielen Verwirrungen und Kompatibilitätsproblemen führte. Es war wie der Turm von Babel in der digitalen Welt!
Unicode hat dies gelöst, indem es ein standardisiertes System geschaffen hat, das Zeichen aus allen Schriftsystemen darstellen kann. Es ist so, als würde man jedem Zeichen in jeder Sprache eine eindeutige ID-Karte geben, die von überall auf der Welt erkannt werden kann.
Unicode in JavaScript
Nun sehen wir, wie JavaScript Unicode handhabt. JavaScript verwendet UTF-16-Kodierung, was bedeutet, dass es direkt die ersten 65.536 Unicode-Zeichen darstellen kann (auch bekannt als der Basic Multilingual Plane oder BMP).
Hier ist eine kleine Tabelle der Methoden, die JavaScript zum Arbeiten mit Unicode bietet:
Methode | Beschreibung |
---|---|
String.fromCharCode() |
Erstellt eine Zeichenkette aus Unicode-Werten |
String.fromCodePoint() |
Erstellt eine Zeichenkette aus Codepunkten |
charCodeAt() |
Gibt den Unicode-Wert eines Zeichens zurück |
codePointAt() |
Gibt den Codepunkt eines Zeichens zurück |
Schauen wir uns einige Beispiele an, um das in die Praxis umzusetzen!
Beispiele
1. Erstellen einer Zeichenkette aus Unicode-Werten
let heart = String.fromCharCode(9829);
console.log(heart); // ♥
In diesem Beispiel verwenden wir String.fromCharCode()
um ein Herzsymbol zu erstellen. Die Zahl 9829 ist der Unicode-Wert für die schwarze Herzfigur (♥). Es ist so, als würde man JavaScript sagen: "Hey, gib mir das Zeichen, das die ID-Karte Nummer 9829 hat!"
2. Herausfinden des Unicode-Werts eines Zeichens
let str = "Hello, 世界!";
console.log(str.charCodeAt(7)); // 19990
Hier verwenden wir charCodeAt()
um den Unicode-Wert des Zeichens an Index 7 in unserer Zeichenkette zu erhalten (das ist '世'). Es ist so, als würden wir fragen: "Was ist die ID-Karte Nummer des achten Zeichens in dieser Zeichenkette?"
3. Arbeiten mit Zeichen außerhalb des BMP
let emoji = "?";
console.log(emoji.codePointAt(0)); // 128640
console.log(String.fromCodePoint(128640)); // ?
Für Zeichen außerhalb des Basic Multilingual Plane (wie viele Emojis) müssen wir codePointAt()
und String.fromCodePoint()
verwenden. In diesem Beispiel arbeiten wir mit dem Raketen-Emoji. Es ist so, als würde man mit einem besonderen Zeichen umgehen, das eine wirklich hohe ID-Nummer hat!
4. Korrekte Zeichenanzahl
let text = "? Rainbow";
console.log(text.length); // 9
console.log([...text].length); // 8
Dies ist ein kniffliges Thema! JavaScript zählt Zeichen außerhalb des BMP als zwei Zeichen. Also wird das Regenbogen-Emoji (?) als zwei Zeichen gezählt. Wenn wir es als eins zählen möchten, können wir den Operator ... verwenden, um die Zeichenkette in ein Array von Zeichen zu teilen.
5. Unicode-Escape-Sequenzen
console.log("\u{1F600}"); // ?
console.log("\u{1F64B}\u{200D}\u{2640}\u{FE0F}"); // ?♀️
Unicode-Escape-Sequenzen erlauben es uns, Unicode-Zeichen in unserem Code darzustellen. Es ist so, als würde man die ID-Kartennummer anstelle des tatsächlichen Zeichens schreiben. Die Syntax \u{...}
wird für alle Unicode-Codepunkte verwendet.
Schlussfolgerung
Und das war's, Leute! Wir haben eine wilde Reise durch Unicode in JavaScript unternommen. Vom Verständnis, was Unicode ist, bis hin zur Handhabung durch JavaScript und dem Spielen mit einigen coolen Beispielen – ich hoffe, Sie haben diese Reise so sehr genossen wie ich.
Denken Sie daran, Unicode ist das, was es uns ermöglicht, Software zu schreiben, die von Menschen auf der ganzen Welt in jeder Sprache verwendet werden kann. Es ist ein wunderschönes Beispiel dafür, wie Technologie uns näher zusammenbringen und Barrieren überwinden kann.
Wenn Sie Ihre Programmierreise fortsetzen, erkunden und experimentieren Sie weiterhin mit Unicode. Versuchen Sie, Nachrichten in verschiedenen Sprachen zu schreiben, oder haben Sie Spaß mit Emojis in Ihrem Code. Die Welt der Programmierung ist riesig und aufregend, und Unicode ist Ihr Pass für die globale Kommunikation!
Frohes Coden und bis zum nächsten Mal – möge Ihr Code frei von Bugs sein und Ihr Kaffee stark! ?☕
Credits: Image by storyset