powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / XML: список всех кодировок ANSI и кодовых страниц
6 сообщений из 6, страница 1 из 1
XML: список всех кодировок ANSI и кодовых страниц
    #37750917
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть задача определить кодовую страницу, имея кодировку в строке ?xml

к примеру кодировке windows-1251 соответствует страница 1251
а кодировке latin-1 (вроде так) соответствует страница 1252
и т.д.
...
Рейтинг: 0 / 0
XML: список всех кодировок ANSI и кодовых страниц
    #37751111
Фотография Antonariy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
википедияВ последнее время имеется путаница между термином «кодовая страница» и более общим понятием набора символов (кодировки).Кажется, это ваш случай)

1252 не соответствует Latin-1.
1252 это кодовая страница кодировки "windows-", то есть Windows-1252, a Latin-1 это другое название ISO 8859-1. 8859-1 это страница, а просто 8859 это кодировка. А ISO 8859-5 это вообще Latin/Cyrillic.

В процессинговой инструкции пишется именно кодовая страница, а не кодировка. Курите терминологию.
...
Рейтинг: 0 / 0
XML: список всех кодировок ANSI и кодовых страниц
    #37751135
Фотография Antonariy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AntonariyВ процессинговой инструкции пишется именно кодовая страница, а не кодировка.Вернее кодировка вместе со страницей.
...
Рейтинг: 0 / 0
XML: список всех кодировок ANSI и кодовых страниц
    #37752294
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В общем какая задача

Задача - имея имя кодировки получить массив символов utf16
т.е. массив из 256 символов, ну или 128, потому что первые 128 повторяются

В Windows есть прекрасная функция MultiByteToWideChar, скорее всего в других ОСях есть аналоги
так вот здесь надо указывать номер страницы

Поэтому в принципе задача сводится к определению кода страницы по имени колировки

Нашёл один замечательный список http://msdn.microsoft.com/en-us/library/dd317756.aspx
но в этом списке например нет "latin-1"
я понимаю, что это iso-8859-1, но тем не менее "latin-1" в таблице нет
поэтому мне нужна наиболее полная таблица, с учётом всех альтернативных имён
...
Рейтинг: 0 / 0
XML: список всех кодировок ANSI и кодовых страниц
    #37752430
Фотография Antonariy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SOFT FOR YOUПоэтому в принципе задача сводится к определению кода страницы по имени колировкиЕще раз повторяю: всегда и везде указывается именно кодовая страница.

Windows-1251 это кодовая страница 1251 кодировки Windows.
iso-8859-1 это кодовая страница 1 кодировки iso-8859.
x-mac-ukrainian это кодовая страница ukrainian кодировки x-mac.
Дошло?

Таким образом, задача у вас была поставлена не правильно, разницы между кодировкой и кодовой страницей вы не знали, поэтому правильный вопрос яндексу вы задать не смогли. Посмотрев ссылку, могу поставить вам задачу в нужную позу: вам требуется определять идентификатор (Identifier) кодовой страницы по названию (.NET Name) кодовой страницы. Вот правильный вопрос . Что характерно, правильный ответ присутствует.

Курите терминологию.
Иначе поисковики буду посылать вас в бобруйск.

SOFT FOR YOUно в этом списке например нет "latin-1"Еще как есть. Ровно напротив iso-8859-1. Но latin-1 это не идентификатор и не "номер" (кто вообще этот термин выдумал?) страницы, а ее "человеческое" название. Поиск не смог мне выдать ни одного примера использования текста "latin-1" в паре с разнообразными инструкциями указания кодировки, зато по тем же самым запросам невозбранно выдавал например Content-Type: text/plain;charset=iso-8859-1, что символизирует. Короче, компьютер не знает что такое latin-1, но знает что такое iso-8859-1.

Таблица годная, можете смело на нее ориентироваться. Шанс наткнуться на отсутствующую там кодировку настолько мал, что его можно игнорировать. В любом случае, это все кодировки, поддерживаемые виндой, а если вам попадется неподдерживаемая, то и MultiByteToWideChar вам не поможет, придется писать свой декодировщик.
...
Рейтинг: 0 / 0
XML: список всех кодировок ANSI и кодовых страниц
    #37752793
SOFT FOR YOU
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
int MultiByteToWideChar( UINT CodePage , DWORD dwFlags, LPCSTR lpMultiByteStr, int cbMultiByte, LPWSTR lpWideCharStr, int cchWideChar);

Поиск не смог мне выдать ни одного примера использования текста "latin-1" в паре с разнообразными инструкциями указания кодировки, зато по тем же самым запросам невозбранно выдавал например Content-Type: text/plain;charset=iso-8859-1, что символизирует. Короче, компьютер не знает что такое latin-1, но знает что такое iso-8859-1.
спасибо
видимо меня неправильно информировали

Таблица годная, можете смело на нее ориентироваться. Шанс наткнуться на отсутствующую там кодировку настолько мал, что его можно игнорировать. В любом случае, это все кодировки, поддерживаемые виндой, а если вам попадется неподдерживаемая, то и MultiByteToWideChar вам не поможет, придется писать свой декодировщик.

отлично!
значит всё ништяк
спасибо за участие
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / XML: список всех кодировок ANSI и кодовых страниц
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]