Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Программирование [игнор отключен] [закрыт для гостей] / ansi, utf8 / 6 сообщений из 6, страница 1 из 1
02.11.2004, 14:01
    #32764985
Серж
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
ansi, utf8
Всем привет!

Кто-нибудь может популярно объяснить в чем разница между этими кодировками? В обеих символ представляется один байтом... А в чем отличие тогда?
...
Рейтинг: 0 / 0
02.11.2004, 16:07
    #32765226
ziktuw
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
ansi, utf8
ansi - это просто набор символов и таблица соответствия значение байта - отображаемый символ.

А utf-8 - это результат кодирования юникода (2-х байтовых символов). При этом латинские символы представлены одним байтом совпадающим с их кодом, а вот все прочие преобразуются в последовательность нескольких байтов. Так русское "Г" кодируется 2-мя байтами D0 и 93, а какой-нибудь корейский символ будет закодирован 6-тью байтами.
Код: plaintext
1.
 _________
Свет в конце тоннеля временно потушен по техническим причинам. 
...
Рейтинг: 0 / 0
02.11.2004, 16:48
    #32765311
Серж
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
ansi, utf8
Стоп. Один символ в utf8 занимает один байт. Два байта - это utf16.

А если у меня русский и англисйкий текст в одной строке перемешан, то что часть символов будет кодироваться одним байтом, часть тремя, а часть вообще 6-и. Абсурд...
...
Рейтинг: 0 / 0
02.11.2004, 17:33
    #32765393
Shultze
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
ansi, utf8
СержСтоп. Один символ в utf8 занимает один байт. Два байта - это utf16.

А если у меня русский и англисйкий текст в одной строке перемешан, то что часть символов будет кодироваться одним байтом, часть тремя, а часть вообще 6-и. Абсурд...

Не абсурд, а именно так оно и работает, не верите? сохраните русский и английский текст из блокнота в кодировке Utf-8
...
Рейтинг: 0 / 0
02.11.2004, 18:37
    #32765531
ziktuw
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
ansi, utf8
авторСтоп. Один символ в utf8 занимает один байт. Два байта - это utf16.
А три - это utf32 :-)

авторА если у меня русский и англисйкий текст в одной строке перемешан, то что часть символов будет кодироваться одним байтом, часть тремя, а часть вообще 6-и. Абсурд...
Отнюдь. Именно так дело и обстоит. Трудно сомнения разрешить? Срочно в блокноте напиши требуемую строку, сохрани как utf8 и любым hexed посмотри что получается.
Код: plaintext
1.
 _________
Свет в конце тоннеля временно потушен по техническим причинам. 
...
Рейтинг: 0 / 0
06.11.2004, 11:09
    #32771657
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
ansi, utf8
Utf-8 использует технологию расширяющегося префиксного кода. Это очень похоже на то как работают архиваторы. Префиксный код позволяет однозначно декодировать из потока байтов цепочки в 1,2,3, и т.д. байтов если даже они будут смешаны.
...
Рейтинг: 0 / 0
Форумы / Программирование [игнор отключен] [закрыт для гостей] / ansi, utf8 / 6 сообщений из 6, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]