|
|
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
вот этот код не работает , ВНЕ ЗАВИСИМОСТИ от префиксов классов объектов XML или HTML в обоих случаях doc просто не инициализируется Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.06.2017, 02:11:44 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
keyword: internettools ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.06.2017, 07:24:42 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
BlackGnomeГуест Код: pascal 1. Пробовал связку XMLRead, XMLWrite, DOM? Я с ними работаю на убунту и винде одинаково. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.06.2017, 08:39:41 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
Не всякий HTML является валидным XML BlackGnomeГуестdoc просто не инициализируетсяСмотрите, как добыть текст ошибки BlackGnomeГуест Код: pascal 1. Ладно, забьем на утечки. Чему равен Position у созданного таким образом стрима? В какой он создается кодировке? Не противоречит ли это прологу документа? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.06.2017, 14:35:57 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
_Vasilisk_Не всякий HTML является валидным XML BlackGnomeГуестdoc просто не инициализируетсяСмотрите, как добыть текст ошибки BlackGnomeГуест Код: pascal 1. Ладно, забьем на утечки. Чему равен Position у созданного таким образом стрима? В какой он создается кодировке? Не противоречит ли это прологу документа? пока отложил сабж. гипертекст беру от webkit. Этот гад нарочито выкидывает закрывающую палку у <LINK> - это к примеру... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.06.2017, 20:29:01 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
BlackGnomeГуестЭтот гад нарочито выкидывает закрывающую палкуТогда забудьте про XML парсеры ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.06.2017, 15:16:56 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
_Vasilisk_BlackGnomeГуестЭтот гад нарочито выкидывает закрывающую палкуТогда забудьте про XML парсеры При парсинге HTML из реального мира лучше сразу забыть про XML, только специально заточенный HTML парсер который будет переваривать любой хардкор, незакрытые теги, перепутанные теги, отсутствие кавычек и прочее. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.06.2017, 15:47:35 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
asviridenkov_Vasilisk_пропущено... Тогда забудьте про XML парсеры При парсинге HTML из реального мира лучше сразу забыть про XML, только специально заточенный HTML парсер который будет переваривать любой хардкор, незакрытые теги, перепутанные теги, отсутствие кавычек и прочее. Ну не знаю, вполне можно парсить в XML с некоторыми допущениями. Я себе на основе http://htmlp.sourceforge.net/ вполне быстрый конвертер HTML в XML сварганил с XPATH-ом и поэтессами. И с исправлением незакрытых тегов, незакрытых символов <> итд. Ессесно придётся немного руками повозится, ну а куда без этого? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.06.2017, 16:06:09 |
|
||
|
Lazarus, Чем парсить HTML (полноценный со всеми делами) ,когда не факт, что Windows?
|
|||
|---|---|---|---|
|
#18+
Dimonkaasviridenkovпропущено... При парсинге HTML из реального мира лучше сразу забыть про XML, только специально заточенный HTML парсер который будет переваривать любой хардкор, незакрытые теги, перепутанные теги, отсутствие кавычек и прочее. Ну не знаю, вполне можно парсить в XML с некоторыми допущениями. Я себе на основе http://htmlp.sourceforge.net/ вполне быстрый конвертер HTML в XML сварганил с XPATH-ом и поэтессами. И с исправлением незакрытых тегов, незакрытых символов <> итд. Ессесно придётся немного руками повозится, ну а куда без этого? Там допущений слишком много. Особенно когда касается HTML e-mail-ов. Я в свое время отлаживал парсер на базе из нескольких тысяч HTML писем, и такого адища насмотрелся, сейчас уже даже всего не вспомнить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.06.2017, 16:09:17 |
|
||
|
|

start [/forum/topic.php?fid=58&msg=39471889&tid=2042136]: |
0ms |
get settings: |
6ms |
get forum list: |
11ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
151ms |
get topic data: |
35ms |
get forum data: |
2ms |
get page messages: |
85ms |
get tp. blocked users: |
2ms |
| others: | 191ms |
| total: | 487ms |

| 0 / 0 |
