|
XML: список всех кодировок ANSI и кодовых страниц
|
|||
---|---|---|---|
#18+
Есть задача определить кодовую страницу, имея кодировку в строке ?xml к примеру кодировке windows-1251 соответствует страница 1251 а кодировке latin-1 (вроде так) соответствует страница 1252 и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
12.04.2012, 16:55 |
|
XML: список всех кодировок ANSI и кодовых страниц
|
|||
---|---|---|---|
#18+
википедияВ последнее время имеется путаница между термином «кодовая страница» и более общим понятием набора символов (кодировки).Кажется, это ваш случай) 1252 не соответствует Latin-1. 1252 это кодовая страница кодировки "windows-", то есть Windows-1252, a Latin-1 это другое название ISO 8859-1. 8859-1 это страница, а просто 8859 это кодировка. А ISO 8859-5 это вообще Latin/Cyrillic. В процессинговой инструкции пишется именно кодовая страница, а не кодировка. Курите терминологию. ... |
|||
:
Нравится:
Не нравится:
|
|||
12.04.2012, 18:27 |
|
XML: список всех кодировок ANSI и кодовых страниц
|
|||
---|---|---|---|
#18+
AntonariyВ процессинговой инструкции пишется именно кодовая страница, а не кодировка.Вернее кодировка вместе со страницей. ... |
|||
:
Нравится:
Не нравится:
|
|||
12.04.2012, 18:36 |
|
XML: список всех кодировок ANSI и кодовых страниц
|
|||
---|---|---|---|
#18+
В общем какая задача Задача - имея имя кодировки получить массив символов utf16 т.е. массив из 256 символов, ну или 128, потому что первые 128 повторяются В Windows есть прекрасная функция MultiByteToWideChar, скорее всего в других ОСях есть аналоги так вот здесь надо указывать номер страницы Поэтому в принципе задача сводится к определению кода страницы по имени колировки Нашёл один замечательный список http://msdn.microsoft.com/en-us/library/dd317756.aspx но в этом списке например нет "latin-1" я понимаю, что это iso-8859-1, но тем не менее "latin-1" в таблице нет поэтому мне нужна наиболее полная таблица, с учётом всех альтернативных имён ... |
|||
:
Нравится:
Не нравится:
|
|||
13.04.2012, 13:08 |
|
XML: список всех кодировок ANSI и кодовых страниц
|
|||
---|---|---|---|
#18+
SOFT FOR YOUПоэтому в принципе задача сводится к определению кода страницы по имени колировкиЕще раз повторяю: всегда и везде указывается именно кодовая страница. Windows-1251 это кодовая страница 1251 кодировки Windows. iso-8859-1 это кодовая страница 1 кодировки iso-8859. x-mac-ukrainian это кодовая страница ukrainian кодировки x-mac. Дошло? Таким образом, задача у вас была поставлена не правильно, разницы между кодировкой и кодовой страницей вы не знали, поэтому правильный вопрос яндексу вы задать не смогли. Посмотрев ссылку, могу поставить вам задачу в нужную позу: вам требуется определять идентификатор (Identifier) кодовой страницы по названию (.NET Name) кодовой страницы. Вот правильный вопрос . Что характерно, правильный ответ присутствует. Курите терминологию. Иначе поисковики буду посылать вас в бобруйск. SOFT FOR YOUно в этом списке например нет "latin-1"Еще как есть. Ровно напротив iso-8859-1. Но latin-1 это не идентификатор и не "номер" (кто вообще этот термин выдумал?) страницы, а ее "человеческое" название. Поиск не смог мне выдать ни одного примера использования текста "latin-1" в паре с разнообразными инструкциями указания кодировки, зато по тем же самым запросам невозбранно выдавал например Content-Type: text/plain;charset=iso-8859-1, что символизирует. Короче, компьютер не знает что такое latin-1, но знает что такое iso-8859-1. Таблица годная, можете смело на нее ориентироваться. Шанс наткнуться на отсутствующую там кодировку настолько мал, что его можно игнорировать. В любом случае, это все кодировки, поддерживаемые виндой, а если вам попадется неподдерживаемая, то и MultiByteToWideChar вам не поможет, придется писать свой декодировщик. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.04.2012, 13:55 |
|
XML: список всех кодировок ANSI и кодовых страниц
|
|||
---|---|---|---|
#18+
int MultiByteToWideChar( UINT CodePage , DWORD dwFlags, LPCSTR lpMultiByteStr, int cbMultiByte, LPWSTR lpWideCharStr, int cchWideChar); Поиск не смог мне выдать ни одного примера использования текста "latin-1" в паре с разнообразными инструкциями указания кодировки, зато по тем же самым запросам невозбранно выдавал например Content-Type: text/plain;charset=iso-8859-1, что символизирует. Короче, компьютер не знает что такое latin-1, но знает что такое iso-8859-1. спасибо видимо меня неправильно информировали Таблица годная, можете смело на нее ориентироваться. Шанс наткнуться на отсутствующую там кодировку настолько мал, что его можно игнорировать. В любом случае, это все кодировки, поддерживаемые виндой, а если вам попадется неподдерживаемая, то и MultiByteToWideChar вам не поможет, придется писать свой декодировщик. отлично! значит всё ништяк спасибо за участие ... |
|||
:
Нравится:
Не нравится:
|
|||
13.04.2012, 15:44 |
|
|
start [/forum/topic.php?fid=14&fpage=23&tid=1332742]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
39ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
52ms |
get tp. blocked users: |
2ms |
others: | 11ms |
total: | 148ms |
0 / 0 |