|
|
|
тэги ушли на север ! HTMLEditorKit Parser handleStartTag / handleEndTag
|
|||
|---|---|---|---|
|
#18+
Отлаживаю прогу для получения данных из ХТМЛ страниц (преобразование в строковый двухмерный массив - ну а его родимого уже элементарно проанализировать) и встретил интересную особенность. У себя на компе все работает на ура - JRE 1.5, 1.3 (взял из клиентского инстала Oracle), 1.2. То есть: тэги таблицы (<table>, <tr>, <td>) обрабатываются handleStartTag / handleEndTag. Довольный собой и проделанной работой, пренес это в хранимую процедуру на Oracle. Получил следующее: тэги таблицы обрабатываются handleSimpleTag и не всегда - через сайт ЦБ на одной из страниц они вообще не видны (http://www.cbr.ru/currency_base/D_print.asp?date_req=15.11.2005). По поводу ХМЛ на ЦБ я знаю, но шеф настаивает на разборе ХТМЛ. К тому же это только одна из задач. Версия Oracle: Oracle9i Enterprise Edition Release 9.2.0.6.0 – Production На сервере через System.getProperties().list(System.out); пишет: java.version=1.3.1 ?!? В форуме по Oracle мне ничего не ответили (ничего не сказала Золотая Рыбка, махнула хвостом и уплыла в синее море...) Кто встречался с подобной проблемой ? Может кто уже решил ее другим парсером (врсию Явы на сервере обновить нельзя по условию). Может кто знает какая версия Явы стоит на сервере и почему такой результат ? Привожу простенький пример: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.11.2005, 18:18 |
|
||
|
|

start [/forum/topic.php?fid=59&tid=2150955]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
173ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
18ms |
get tp. blocked users: |
1ms |
| others: | 223ms |
| total: | 451ms |

| 0 / 0 |
