Unicode转义 (\u %u \x &#x U+ 0x \N) 编码器 / 解码器在线

解码结果

Unicode转义

Unicode转义	格式 A-F

将字符串转换为 Unicode 转义序列的格式。

Unicode 转义序列将 1 个字符转换为类似 \uXXXX 的 4 位十六进制码点格式。例如“あ”转换为“\u3042”。

DenCode 除了 \uXXXX 格式外，还支持以下格式的表示法的转换。

以上几种格式在 RFC 5137 (ASCII Escaping of Unicode Characters) 中作为 BEST CURRENT PRACTICE 被提及，但并没有国际标准。

%uXXXX 格式虽然被 Microsoft IIS 支持，但是是非标准格式。虽然 C# 的 System.Web.HttpUtility.UrlEncodeUnicode 可以转换为 %u 格式，但该方法从 .NET Framework 4.5 起已不推荐使用。

请注意 \X 格式作为 CSS 的规范，在解码时后接的 1 个半角空格会被视为分隔符而被忽略。在 U+XXXX 或 0xX 格式中，编码时每个字符用半角空格分隔，解码时与 \X 格式一样，后接的 1 个连续半角空格会被忽略。

作为 Unicode 转义序列，也支持通过 Unicode 名称进行转义。

格式	“A”的转换结果	说明 / 编程语言
\N{name}	\N{LATIN CAPITAL LETTER A}	C++23, Python, Perl

对于 Unicode 的非 BMP 字符，由于码点无法容纳在 4 位中，因此根据编程语言不同，使用以下格式表示。

例如“😀”(U+1F600) 的转换结果如下。

格式	“😀”(U+1F600) 的转换结果	编程语言
\uXXXX	\uD83D\uDE00	Java, Kotlin, Scala
\u{X}	\u{1F600}	C++23, Rust, Swift, JavaScript, PHP, Ruby, Dart, Lua
\U00XXXXXX	\U0001F600	C, C++, Objective-C, C#, Go, Python, R
\x{X}	\x{1F600}	Perl
\X	\1F600	CSS
&#xX;	😀	HTML, XML
%uXXXX	%uD83D%uDE00	-
U+XXXX	U+1F600	-
0xX	0x1F600	-
\N{name}	\N{GRINNING FACE}	C++23, Python, Perl

在 \uXXXX 和 %uXXXX 格式中，非 BMP 字符作为 UTF-16 的代理对用 2 个代码单元表示。在其他格式中，1 个字符用 1 个码点表示。