|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
Документы искал и не нашел. Собствено вопрос в следующем. Нужно разбирать файлы, содержащие xml-заголовок известной структуры и следующие за ним двоичные данные. И нужно их отделить друг от друга. Предполагается искать в массиве байт второе вхождение самого внешнего тега (строку "ВНЕШНИЙ_ТЕГ>", байтовое представление которой зависит от кодировки). Если есть пролог, кодировка будет читаться из него, но в какой кодировке записан он сам? Допустимо ли считать, что при отсутствии Byte Order Mark его кодировка байтовая? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.04.2016, 15:08 |
|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
22.04.2016, 16:36 |
|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
Спасибо, это я видел, но, возможно не сделал всех выводов. Может это и искусственная ситуация, но правильно ли я понимаю, что по по первым символам определяется кодировка пролога, а кодировка самого xml - по encoding? Сделал файл с прологом в кодировке UTF-16 (с BOM = 0xFF 0xFE и без него) и содержимым в windows-1251: Код: xml 1.
С <A> начинается байтовая кодировка. FireFox ругается (XML Parsing Error: not well-formed), xerces-c нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.04.2016, 17:43 |
|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
*Может это и искусственная ситуация, но правильно ли я понимаю, что по по первым символам определяется кодировка пролога, а кодировка самого xml - по encoding?Нет. По первым символам можно определить класс кодировок. А потом на основании этого класса можно начинать читать пролог. И если пролог найден, то доуточнить кодировку. Если пролог отсутствует, то кодировка XML - UTF-8 Если кодировка XML в (отсутствующем) прологе, не совпадает с предолагаемым классом кодировок, то парсинг прекращается с ошибкой *кодировка самого xml - по encoding?это как? *Сделал файл с прологом в кодировке UTF-16 (с BOM = 0xFF 0xFE и без него) и содержимым в windows-1251:Что за бред? Содержимое одного XML-файла не может біть в разных кодировках ... |
|||
:
Нравится:
Не нравится:
|
|||
22.04.2016, 18:02 |
|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
А я и не говорил, что это нормально. Но тогда почему анализатор не ругается на encoding? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.04.2016, 18:23 |
|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
*Но тогда почему анализатор не ругается на encoding?Почему он должен ругаться? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.04.2016, 18:39 |
|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
VasiliskНет. По первым символам можно определить класс кодировок. А потом на основании этого класса можно начинать читать пролог. И если пролог найден, то доуточнить кодировку. По идее наличие BOM и указание байтовой кодировки windows-1251 противоречат друг другу. Но xerces-с похоже выполняет переключение. Его исходный код есть, но так сразу разобраться не получилось. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.04.2016, 18:59 |
|
В какой кодировке пишется пролог?
|
|||
---|---|---|---|
#18+
*По идее наличие BOM и указание байтовой кодировки windows-1251 противоречат друг другуИменно! *Но xerces-с похоже выполняет переключение.Есть такой абзац авторF.2 Priorities in the Presence of External Encoding Information The second possible case occurs when the XML entity is accompanied by encoding information, as in some file systems and some network protocols. When multiple sources of information are available, their relative priority and the preferred method of handling conflict should be specified as part of the higher-level protocol used to deliver XML . In particular, please refer to [IETF RFC 3023] or its successor, which defines the text/xml and application/xml MIME types and provides some useful guidance. In the interests of interoperability, however, the following rule is recommended. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.04.2016, 21:37 |
|
|
start [/forum/topic.php?fid=14&msg=39222580&tid=1332102]: |
0ms |
get settings: |
11ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
169ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
46ms |
get tp. blocked users: |
1ms |
others: | 13ms |
total: | 274ms |
0 / 0 |