- Загрузка из текстовый файла
- Загрузка из изображения (OCR)
- Отсканировать QR-код
- UTF-16LE
- UTF-32LE
- US-ASCII
- ISO-8859-1 (Latin-1)
- ISO-8859-15 (Latin-9)
- Windows-1252
- ISO-8859-2 (Latin-2)
- Windows-1250
- ISO-8859-3 (Latin-3)
- ISO-8859-4 (Latin-4)
- ISO-8859-13 (Latin-7)
- Windows-1257
- Shift_JIS
- EUC-JP
- ISO-2022-JP (JIS)
- GB2312 (EUC-CN)
- GB18030
- Big5-HKSCS
- EUC-KR (KS X 1001)
- ISO-2022-KR
- ISO-8859-5
- Windows-1251
- KOI8-R
- KOI8-U
- ISO-8859-6
- Windows-1256
- ISO-8859-7
- Windows-1253
- ISO-8859-8
- Windows-1255
- ISO-8859-9 (Latin-5)
- Windows-1254
- TIS-620
- Windows-874
- Windows-1258
Декодировано
Unicode NFD | |
---|---|
Unicode NFKD |
Закодировано
Unicode NFC | |
---|---|
Unicode NFKC |
О Нормализации Unicode
Нормализация Unicode - это декомпозиция и композиция символов. Некоторые символы Unicode имеют одинаковый внешний вид, но имеют несколько представлений. Например, «â» может быть представлен как одна кодовая точка для «â» (U+00E2) и две разложенные кодовые точки для «a» (U+0061) и « ̂» (U+0302). Его также можно выразить как (базовый символ + объединяющий символ). Первый называется предварительно составленным символом, а второй - последовательностью комбинируемых символов (combining character sequence, CCS).
Существуют следующие типы нормализации Unicode:
Форма нормализации | Описание | пример |
---|---|---|
Normalization Form D (NFD) | Персонажи разлагаются по канонической эквивалентности | «â» (U+00E2) -> «a» (U+0061) + « ̂» (U+0302) |
Normalization Form KD (NFKD) | Персонажи разложены по совместимости | «fi» (U+FB01) -> «f» (U+0066) + «i» (U+0069) |
Normalization Form C (NFC) | Персонажи раскладываются, а затем перекомпоновываются в соответствии с канонической эквивалентностью | «â» (U+00E2) -> «a» (U+0061) + « ̂» (U+0302) -> «â» (U+00E2) |
Normalization Form KC (NFKC) | Символы разлагаются по совместимости, а затем перекомпоновываются в соответствии с канонической эквивалентностью | «fi» (U+FB01) -> «f» (U+0066) + «i» (U+0069) -> «f» (U+0066) + «i» (U+0069) |
Каноническая эквивалентность нормализуется при сохранении визуально и функционально эквивалентных символов. например «â» <-> «a» + « ̂»
Помимо канонической эквивалентности, эквивалентность совместимости также нормализует символы, имеющие разные семантические формы. например «fi» -> «f» + «i»