0

Resultado da Decodificação

Unicode NFD
Unicode NFKD

Resultado da Codificação

Unicode NFC
Unicode NFKC

Sobre Normalização Unicode

Normalização Unicode refere-se à decomposição e composição de caracteres. Alguns caracteres Unicode têm a mesma aparência, mas várias representações. Por exemplo, "â" pode ser representado como um único ponto de código "â" (U+00E2), ou como dois pontos de código decompostos (caractere base + caractere de combinação) "a" (U+0061) e " ̂" (U+0302). O primeiro é chamado de caractere pré-composto e o último é chamado de sequência de caracteres de combinação (CCS).

Os seguintes tipos de normalização Unicode estão disponíveis.

Forma de NormalizaçãoDescriçãoExemplo
Normalization Form D (NFD)Decomposição canônica"â"(U+00E2) -> "a"(U+0061) + " ̂"(U+0302)
Normalization Form KD (NFKD)Decomposição de compatibilidade"fi"(U+FB01) -> "f"(U+0066) + "i"(U+0069)
Normalization Form C (NFC)Decomposição canônica seguida de composição canônica"â"(U+00E2) -> "a"(U+0061) + " ̂"(U+0302) -> "â"(U+00E2)
Normalization Form KC (NFKC)Decomposição de compatibilidade seguida de composição canônica"fi"(U+FB01) -> "f"(U+0066) + "i"(U+0069) -> "f"(U+0066) + "i"(U+0069)

A equivalência canônica normaliza preservando caracteres visualmente e funcionalmente equivalentes. Ex. "â" <-> "a" + " ̂"

A equivalência de compatibilidade inclui caracteres que tomam formas semanticamente diferentes além da equivalência canônica para normalização. Ex. "fi" -> "f" + "i"