0

Hasil Decode

Denormalisasi
Denormalisasi (Kompatibel)

Hasil Encode

Normalisasi
Normalisasi (Kompatibel)

Tentang Normalisasi Unicode

Normalisasi Unicode adalah proses penguraian dan penggabungan karakter. Beberapa karakter Unicode memiliki beberapa representasi meskipun terlihat sama. Misalnya, "â" dapat direpresentasikan sebagai satu titik kode "â" (U+00E2), atau sebagai dua titik kode terurai (karakter dasar + karakter penggabung) "a" (U+0061) dan " ̂" (U+0302). Yang pertama disebut karakter prakomposisi, dan yang terakhir disebut urutan karakter penggabung (combining character sequence, CCS).

Ada jenis normalisasi Unicode berikut.

Bentuk NormalisasiDeskripsiContoh
Normalization Form D (NFD)Penguraian dengan ekuivalensi kanonik"â"(U+00E2) -> "a"(U+0061) + " ̂"(U+0302)
Normalization Form KD (NFKD)Penguraian dengan ekuivalensi kompatibilitas"fi"(U+FB01) -> "f"(U+0066) + "i"(U+0069)
Normalization Form C (NFC)Penguraian dengan ekuivalensi kanonik dan penggabungan kembali"â"(U+00E2) -> "a"(U+0061) + " ̂"(U+0302) -> "â"(U+00E2)
Normalization Form KC (NFKC)Penguraian dengan ekuivalensi kompatibilitas dan penggabungan kembali dengan ekuivalensi kanonik"fi"(U+FB01) -> "f"(U+0066) + "i"(U+0069) -> "f"(U+0066) + "i"(U+0069)

Ekuivalensi kanonik menormalkan sambil mempertahankan karakter yang ekuivalen secara visual dan fungsional. Contoh: "â" <-> "a" + " ̂"

Ekuivalensi kompatibilitas menargetkan karakter yang memiliki bentuk berbeda secara semantik selain ekuivalensi kanonik. Contoh: "fi" -> "f" + "i"