|
русский язык в xml?
|
|||
---|---|---|---|
#18+
Код: plaintext 1. 2. 3. 4.
возвращает: "<foo bar="скобки <> english русский текст""/>" как бы ей сказать что у меня везде UTF-8 и можно выдавать русский язык прямо как он есть, без оверхеда? ... |
|||
:
Нравится:
Не нравится:
|
|||
16.07.2010, 23:22 |
|
русский язык в xml?
|
|||
---|---|---|---|
#18+
хаха, форум пропарсил ввод как если бы это был html :) приложил картинкой вывод как он есть ... |
|||
:
Нравится:
Не нравится:
|
|||
16.07.2010, 23:26 |
|
русский язык в xml?
|
|||
---|---|---|---|
#18+
Weedкак бы ей сказать что у меня везде UTF-8 и можно выдавать русский язык прямо как он есть, без оверхеда?Никак, текущая реализация PG и libxml2 иногда друг друга не совсем понимают :-\ ... |
|||
:
Нравится:
Не нравится:
|
|||
17.07.2010, 01:16 |
|
русский язык в xml?
|
|||
---|---|---|---|
#18+
Ёш, а какова природа этого бага? (о нём, кстати, репортили?) очень обидная проблема - такой классный способ генерировать сайты вообще без написания кода обламывается!.. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.07.2010, 11:10 |
|
русский язык в xml?
|
|||
---|---|---|---|
#18+
Weed, Почему обламывается? То, что браузер его (полученный код) правильно интерпретировал, говорит как раз о другом. Потом можно переписать libxml :D ... |
|||
:
Нравится:
Не нравится:
|
|||
17.07.2010, 11:20 |
|
русский язык в xml?
|
|||
---|---|---|---|
#18+
Weedа какова природа этого бага?Если взять вот этот вот пример: http://www.xmlsoft.org/examples/testWriter.c можно заметить что перед тем как писать атрибут в выходной поток с помощью xmlTextWriterWriteAttribute сначала устанавливается кодировка выходного потока через xmlTextWriterStartDocument(writer, NULL, MY_ENCODING, NULL) postgres этого не делает. И libxml2 почему-то считает что хотя кодировка по умолчанию UTF8 ей нужно экранировать все значения атрибута не попадающие в latin1 если не указана кодировка выходного документа, не знаю почему... Это можно проверить если закоментировать xmlTextWriterStartDocument в примере, получится такой же вывод как и у Вас. Всё это вместе накладывается и приводит к такому результату. Но просто вызывать что-то типа xmlTextWriterStartDocument(writer, NULL, pg_server_encoding(), NULL) перед xmlTextWriterWriteAttribute — мало, потому что после xmlTextWriterStartDocument выходной поток станет полным документом, с заголовком <?xml version="1.0" encoding="КОДИРОВКА"?> который postgres'у совершено не нужен, его нужно будет вырезать из результата перед возвращением из xmlattributes. Weed(о нём, кстати, репортили?)Я писал об этом в pgsql-hackers но не в виде бага, просто как замечание, на исправлении не настаивал :) Лучше напишите pgsql-bugs. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.07.2010, 15:24 |
|
русский язык в xml?
|
|||
---|---|---|---|
#18+
Big AndyWeed, Почему обламывается? То, что браузер его (полученный код) правильно интерпретировал, говорит как раз о другом. говорит о том что на форуме не испольузется xml при возврате постов и вообще не парсится юзерский пост при выдаче на предмет этих символов :) ... |
|||
:
Нравится:
Не нравится:
|
|||
18.07.2010, 13:14 |
|
русский язык в xml?
|
|||
---|---|---|---|
#18+
ЁшWeedа какова природа этого бага?Если взять вот этот вот пример: http://www.xmlsoft.org/examples/testWriter.c можно заметить что перед тем как писать атрибут в выходной поток с помощью xmlTextWriterWriteAttribute сначала устанавливается кодировка выходного потока через xmlTextWriterStartDocument(writer, NULL, MY_ENCODING, NULL) postgres этого не делает. И libxml2 почему-то считает что хотя кодировка по умолчанию UTF8 ей нужно экранировать все значения атрибута не попадающие в latin1 если не указана кодировка выходного документа, не знаю почему... Это можно проверить если закоментировать xmlTextWriterStartDocument в примере, получится такой же вывод как и у Вас. Всё это вместе накладывается и приводит к такому результату. Но просто вызывать что-то типа xmlTextWriterStartDocument(writer, NULL, pg_server_encoding(), NULL) перед xmlTextWriterWriteAttribute — мало, потому что после xmlTextWriterStartDocument выходной поток станет полным документом, с заголовком <?xml version="1.0" encoding="КОДИРОВКА"?> который postgres'у совершено не нужен, его нужно будет вырезать из результата перед возвращением из xmlattributes. Weed(о нём, кстати, репортили?)Я писал об этом в pgsql-hackers но не в виде бага, просто как замечание, на исправлении не настаивал :) Лучше напишите pgsql-bugs. но и кодировку выходного документа указывать не ясно как в принципе баг не мешает но текстовый трафик рискует увеличиться на треть или даже на половину что неприятно багрепорт напишу наверно как жара спадёт :) ... |
|||
:
Нравится:
Не нравится:
|
|||
18.07.2010, 13:16 |
|
|
start [/forum/topic.php?fid=53&fpage=73&tid=1996484]: |
0ms |
get settings: |
9ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
30ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
48ms |
get tp. blocked users: |
1ms |
others: | 326ms |
total: | 450ms |
0 / 0 |