Conversor de Normalização Unicode (NFC, NFKC, NFD, NFKD) Online

Resultado da Decodificação

Unicode NFD
Unicode NFKD

Resultado da Codificação

Unicode NFC
Unicode NFKC

Outros conversores de string aqui

Sobre Normalização Unicode

Normalização Unicode refere-se à decomposição e composição de caracteres. Alguns caracteres Unicode têm a mesma aparência, mas várias representações. Por exemplo, "â" pode ser representado como um único ponto de código "â" (U+00E2), ou como dois pontos de código decompostos (caractere base + caractere de combinação) "a" (U+0061) e " ̂" (U+0302). O primeiro é chamado de caractere pré-composto e o último é chamado de sequência de caracteres de combinação (CCS).

Os seguintes tipos de normalização Unicode estão disponíveis.

Forma de Normalização	Descrição	Exemplo
Normalization Form D (NFD)	Decomposição canônica	"â"(U+00E2) -> "a"(U+0061) + " ̂"(U+0302)
Normalization Form KD (NFKD)	Decomposição de compatibilidade	"ﬁ"(U+FB01) -> "f"(U+0066) + "i"(U+0069)
Normalization Form C (NFC)	Decomposição canônica seguida de composição canônica	"â"(U+00E2) -> "a"(U+0061) + " ̂"(U+0302) -> "â"(U+00E2)
Normalization Form KC (NFKC)	Decomposição de compatibilidade seguida de composição canônica	"ﬁ"(U+FB01) -> "f"(U+0066) + "i"(U+0069) -> "f"(U+0066) + "i"(U+0069)

A equivalência canônica normaliza preservando caracteres visualmente e funcionalmente equivalentes. Ex. "â" <-> "a" + " ̂"

A equivalência de compatibilidade inclui caracteres que tomam formas semanticamente diferentes além da equivalência canônica para normalização. Ex. "ﬁ" -> "f" + "i"