powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / ansi, utf8
6 сообщений из 6, страница 1 из 1
ansi, utf8
    #32764985
Серж
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Всем привет!

Кто-нибудь может популярно объяснить в чем разница между этими кодировками? В обеих символ представляется один байтом... А в чем отличие тогда?
...
Рейтинг: 0 / 0
ansi, utf8
    #32765226
Фотография ziktuw
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ansi - это просто набор символов и таблица соответствия значение байта - отображаемый символ.

А utf-8 - это результат кодирования юникода (2-х байтовых символов). При этом латинские символы представлены одним байтом совпадающим с их кодом, а вот все прочие преобразуются в последовательность нескольких байтов. Так русское "Г" кодируется 2-мя байтами D0 и 93, а какой-нибудь корейский символ будет закодирован 6-тью байтами.
Код: plaintext
1.
 _________
Свет в конце тоннеля временно потушен по техническим причинам. 
...
Рейтинг: 0 / 0
ansi, utf8
    #32765311
Серж
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Стоп. Один символ в utf8 занимает один байт. Два байта - это utf16.

А если у меня русский и англисйкий текст в одной строке перемешан, то что часть символов будет кодироваться одним байтом, часть тремя, а часть вообще 6-и. Абсурд...
...
Рейтинг: 0 / 0
ansi, utf8
    #32765393
Shultze
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
СержСтоп. Один символ в utf8 занимает один байт. Два байта - это utf16.

А если у меня русский и англисйкий текст в одной строке перемешан, то что часть символов будет кодироваться одним байтом, часть тремя, а часть вообще 6-и. Абсурд...

Не абсурд, а именно так оно и работает, не верите? сохраните русский и английский текст из блокнота в кодировке Utf-8
...
Рейтинг: 0 / 0
ansi, utf8
    #32765531
Фотография ziktuw
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторСтоп. Один символ в utf8 занимает один байт. Два байта - это utf16.
А три - это utf32 :-)

авторА если у меня русский и англисйкий текст в одной строке перемешан, то что часть символов будет кодироваться одним байтом, часть тремя, а часть вообще 6-и. Абсурд...
Отнюдь. Именно так дело и обстоит. Трудно сомнения разрешить? Срочно в блокноте напиши требуемую строку, сохрани как utf8 и любым hexed посмотри что получается.
Код: plaintext
1.
 _________
Свет в конце тоннеля временно потушен по техническим причинам. 
...
Рейтинг: 0 / 0
ansi, utf8
    #32771657
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Utf-8 использует технологию расширяющегося префиксного кода. Это очень похоже на то как работают архиваторы. Префиксный код позволяет однозначно декодировать из потока байтов цепочки в 1,2,3, и т.д. байтов если даже они будут смешаны.
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / Программирование [игнор отключен] [закрыт для гостей] / ansi, utf8
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]