|
|
|
StAX и кодировки xml-файлов
|
|||
|---|---|---|---|
|
#18+
Пишу класс, в котором вручную с помощью StAX буду парсить xml-ки. Код вида: Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. Некоторые xml-ки идут с маркером последовательности (BOM) в заголовке файла, и тогда получаю ошибку. Код: html 1. 2. 3. 4. 5. 6. Но некоторые без BOM, поэтому мне нужно бы и так и эдак работать. Как быть? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.11.2014, 16:27 |
|
||
|
StAX и кодировки xml-файлов
|
|||
|---|---|---|---|
|
#18+
mesier, 1) У вас в конструкторе InputStreamReader не указана кодировка. 2) Возможно подключение сторонней реализации StAX в classpath решит проблему. BOM достаточно стандартная штука. Должна поддерживаться. 3) Можно InputStream обернуть в откатываемый Stream из Apache Commons IO, вычитывать первый, если он <, то откатывать. Если BOM - то скипать 3 символа, тогда парсер начнет читать с < ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.11.2014, 16:48 |
|
||
|
StAX и кодировки xml-файлов
|
|||
|---|---|---|---|
|
#18+
mesier, посмотрите тут: http://commons.apache.org/proper/commons-io/apidocs/org/apache/commons/io/input/BOMInputStream.html ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.11.2014, 16:57 |
|
||
|
|

start [/forum/topic.php?fid=59&fpage=152&tid=2126267]: |
0ms |
get settings: |
7ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
318ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
38ms |
get tp. blocked users: |
1ms |
| others: | 229ms |
| total: | 628ms |

| 0 / 0 |
