Koder / Dekoder Unicode Escape (\u %u \x &#x U+ 0x \N) Online

Wynik dekodowania

Unicode Escape

Wynik kodowania

Unicode Escape	Format A-F

Inne konwertery ciągów znaków

O Sekwencjach Ucieczki Unicode

Konwertuje ciąg znaków na sekwencje ucieczki Unicode.

Podstawowy format to \uXXXX, gdzie XXXX to 4-cyfrowy kod szesnastkowy znaku. Np. „あ” to „\u3042”.

DenCode obsługuje również inne formaty:

Format	Przykład „ABC”	Opis / Język programowania
\uXXXX	\u0041\u0042\u0043	Typowa sekwencja ucieczki Unicode
\u{X}	\u{41}\u{42}\u{43}	Lua
\x{X}	\x{41}\x{42}\x{43}	Perl
\X	\41\42\43	CSS
&#xX;	ABC	HTML, XML
%uXXXX	%u0041%u0042%u0043	Percent-encoding (Niestandardowy)
U+XXXX	U+0041 U+0042 U+0043	Standardowa notacja Unicode (rozdzielona spacjami)
0xX	0x41 0x42 0x43	Notacja szesnastkowa (rozdzielona spacjami)

Niektóre formaty są wspomniane w RFC 5137 jako „Best Current Practice”, ale nie ma jednego międzynarodowego standardu.

Format %uXXXX jest obsługiwany przez Microsoft IIS, ale jest niestandardowy. W C# metoda System.Web.HttpUtility.UrlEncodeUnicode koduje do %u, ale jest przestarzała od .NET Framework 4.5.

W formacie CSS (\X), spacja po sekwencji jest traktowana jako separator i ignorowana. W formatach U+XXXX i 0xX, podczas kodowania znaki są oddzielane spacją, a przy dekodowaniu, podobnie jak w \X, pojedyncza spacja po sekwencji jest ignorowana.

Eskapowanie przy użyciu nazwy Unicode

Obsługiwane jest również eskapowanie przy użyciu nazwy znaku Unicode:

Format	Przykład „A”	Opis / Język programowania
\N{name}	\N{LATIN CAPITAL LETTER A}	C++23, Python, Perl

Nazwy Unicode można sprawdzić w Names List Charts - Unicode lub NamesList.txt - Unicode.

Znaki spoza zakresu BMP (Basic Multilingual Plane)

Dla znaków spoza BMP (kod powyżej U+FFFF), które nie mieszczą się w 4 cyfrach, stosuje się różne zapisy w zależności od języka:

Przykład dla „😀” (U+1F600):

Format	Przykład „😀”	Język programowania
\uXXXX	\uD83D\uDE00	Java, Kotlin, Scala
\u{X}	\u{1F600}	C++23, Rust, Swift, JavaScript, PHP, Ruby, Dart, Lua
\U00XXXXXX	\U0001F600	C, C++, Objective-C, C#, Go, Python, R
\x{X}	\x{1F600}	Perl
\X	\1F600	CSS
&#xX;	😀	HTML, XML
%uXXXX	%uD83D%uDE00	-
U+XXXX	U+1F600	-
0xX	0x1F600	-
\N{name}	\N{GRINNING FACE}	C++23, Python, Perl

W formatach \uXXXX i %uXXXX, znaki spoza BMP są reprezentowane jako para surogatów UTF-16 (dwa kody). W pozostałych formatach pojedynczy znak jest reprezentowany przez pojedynczy kod.