0

Hasil Decode

Unicode Escape

Hasil Encode

Unicode Escape
Format
A-F

Tentang Urutan Escape Unicode

Mengonversi string ke format urutan escape Unicode.

Urutan escape Unicode mengonversi 1 karakter ke format titik kode heksadesimal 4 digit seperti \uXXXX. Misalnya "あ" menjadi "\u3042".

Di DenCode, selain format \uXXXX, notasi format berikut juga didukung.

FormatHasil konversi "ABC"Deskripsi / Bahasa Pemrograman
\uXXXX\u0041\u0042\u0043Urutan escape Unicode umum
\u{X}\u{41}\u{42}\u{43}Lua
\x{X}\x{41}\x{42}\x{43}Perl
\X\41\42\43CSS
&#xX;ABCHTML, XML
%uXXXX%u0041%u0042%u0043Percent-encoding (Non-standar)
U+XXXXU+0041 U+0042 U+0043Notasi standar Unicode titik kode (dipisahkan spasi)
0xX0x41 0x42 0x43Notasi heksadesimal titik kode (dipisahkan spasi)

Beberapa format di atas disebutkan sebagai BEST CURRENT PRACTICE dalam RFC 5137 (ASCII Escaping of Unicode Characters), tetapi tidak ada standar internasional, dll.

Format %uXXXX didukung oleh Microsoft IIS, tetapi merupakan format non-standar. Anda dapat mengkodekan ke format %u dengan System.Web.HttpUtility.UrlEncodeUnicode di C#, tetapi metode ini tidak lagi disarankan sejak .NET Framework 4.5.

Perhatikan bahwa format \X diperlakukan sebagai pembatas dan diabaikan jika diikuti oleh satu spasi half-width saat mendekode, sebagai spesifikasi CSS. Dalam format U+XXXX atau 0xX, setiap karakter dipisahkan oleh spasi half-width saat mengkodekan, dan satu spasi half-width yang berurutan diabaikan saat mendekode, sama seperti format \X.

Escape dengan Nama Unicode

Sebagai urutan escape Unicode, escape dengan nama Unicode juga didukung.

FormatHasil konversi "A"Deskripsi / Bahasa Pemrograman
\N{name}\N{LATIN CAPITAL LETTER A}C++23, Python, Perl

Nama Unicode dapat dikonfirmasi di Names List Charts - Unicode atau NamesList.txt - Unicode.

Karakter di luar rentang BMP Unicode dalam urutan escape Unicode

Untuk karakter non-BMP Unicode, karena titik kode tidak muat dalam 4 digit, mereka direpresentasikan dalam notasi format berikut untuk setiap bahasa pemrograman.

Misalnya, hasil konversi "😀" (U+1F600) adalah sebagai berikut.

FormatHasil konversi "😀" (U+1F600)Bahasa Pemrograman
\uXXXX\uD83D\uDE00Java, Kotlin, Scala
\u{X}\u{1F600}C++23, Rust, Swift, JavaScript, PHP, Ruby, Dart, Lua
\U00XXXXXX\U0001F600C, C++, Objective-C, C#, Go, Python, R
\x{X}\x{1F600}Perl
\X\1F600CSS
&#xX;😀HTML, XML
%uXXXX%uD83D%uDE00-
U+XXXXU+1F600-
0xX0x1F600-
\N{name}\N{GRINNING FACE}C++23, Python, Perl

Dalam format \uXXXX dan %uXXXX, karakter non-BMP direpresentasikan oleh dua unit kode sebagai pasangan pengganti UTF-16. Dalam format lain, 1 karakter direpresentasikan oleh 1 titik kode.