0

Wynik dekodowania

Unicode NFD
Unicode NFKD

Wynik kodowania

Unicode NFC
Unicode NFKC

O Normalizacji Unicode

Normalizacja Unicode to proces rozkładu (dekompozycji) i składania (kompozycji) znaków. W Unicode ten sam znak może być reprezentowany na różne sposoby. Np. „â” może być jednym kodem (U+00E2) lub sekwencją „a” (U+0061) + „ ̂” (U+0302).

Dostępne są następujące formy normalizacji:

FormaOpisPrzykład
Normalization Form D (NFD)Rozkład kanoniczny„â”(U+00E2) -> „a”(U+0061) + „ ̂”(U+0302)
Normalization Form KD (NFKD)Rozkład kompatybilności„fi”(U+FB01) -> „f”(U+0066) + 「i」(U+0069)
Normalization Form C (NFC)Rozkład kanoniczny, następnie złożenie kanoniczne„â”(U+00E2) -> ... -> „â”(U+00E2)
Normalization Form KC (NFKC)Rozkład kompatybilności, następnie złożenie kanoniczne„fi”(U+FB01) -> ... -> „f”(U+0066) + „i”(U+0069)

Równoważność kanoniczna dotyczy znaków, które są wizualnie i funkcjonalnie identyczne.

Równoważność kompatybilności dotyczy znaków, które mogą różnić się wizualnie lub semantycznie, ale reprezentują ten sam znak podstawowy (np. ligatury).