Unicode सामान्यीकरण (NFC, NFKC, NFD, NFKD) रूपांतरण ऑनलाइन

डिकोड परिणाम

Unicode NFD
Unicode NFKD

एन्कोड परिणाम

Unicode NFC
Unicode NFKC

अन्य स्ट्रिंग रूपांतरण यहाँ

Unicode Normalization के बारे में

Unicode Normalization का अर्थ है वर्णों का अपघटन (decomposition) और संरचना (composition)। Unicode के कुछ वर्ण दृष्टिगत रूप से समान होते हैं लेकिन उनके प्रतिनिधित्व के कई तरीके होते हैं। उदाहरण के लिए, "â" को "â" (U+00E2) के 1 कोडपॉइंट के रूप में भी दर्शाया जा सकता है, और "a" (U+0061) और "̂" (U+0302) के 2 अपघटित कोडपॉइंट्स (आधार वर्ण + संयोजन वर्ण) के रूप में भी दर्शाया जा सकता है। पहले वाले को पूर्व-संयोजित वर्ण (precomposed character) और बाद वाले को संयोजन वर्ण अनुक्रम (combining character sequence, CCS) कहा जाता है।

Unicode Normalization के निम्नलिखित प्रकार हैं।

Normalization Form	विवरण	उदाहरण
Normalization Form D (NFD)	Canonical Equivalence द्वारा अपघटन	"â"(U+00E2) -> "a"(U+0061) + "̂"(U+0302)
Normalization Form KD (NFKD)	Compatibility Equivalence द्वारा अपघटन	"ﬁ"(U+FB01) -> "f"(U+0066) + "i"(U+0069)
Normalization Form C (NFC)	Canonical Equivalence द्वारा अपघटन और पुन: संयोजन	"â"(U+00E2) -> "a"(U+0061) + "̂"(U+0302) -> "â"(U+00E2)
Normalization Form KC (NFKC)	Compatibility Equivalence द्वारा अपघटन, और Canonical Equivalence द्वारा पुन: संयोजन	"ﬁ"(U+FB01) -> "f"(U+0066) + "i"(U+0069) -> "f"(U+0066) + "i"(U+0069)

Canonical Equivalence उन वर्णों को सामान्य (normalize) करता है जो दृष्टिगत और कार्यात्मक रूप से समान हैं। उदाहरण: "â" <-> "a" + "̂"

Compatibility Equivalence में, Canonical Equivalence के अलावा, अर्थगत रूप से भिन्न रूप लेने वाले वर्ण भी सामान्यीकरण का विषय होते हैं। उदाहरण: "ﬁ" -> "f" + "i"