powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / Caché, Ensemble, DeepSee, MiniM, IRIS, GT.M [игнор отключен] [закрыт для гостей] / HTML parsing
7 сообщений из 7, страница 1 из 1
HTML parsing
    #36711224
mys123
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Есть ли в Cache готовый функционал для парсинга HTML, чтобы на выходе получить данные в виде DOM-дерева, как в XML или может как-то можно адаптировать для этих целей XML-парсер?
...
Рейтинг: 0 / 0
Период между сообщениями больше года.
HTML parsing
    #37911555
Petr0vi4444
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Тоже интересует этот вопрос, неужели никто не знает?
...
Рейтинг: 0 / 0
HTML parsing
    #37911576
Фотография DAiMor
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
XML парсер может не подойти из-за того что теги могут быть не закрыты либо переставлены неправильно
поэтому можно попробовать сначала обработать с помощью XSLT там может получиться лучше, а дальше XML парсер если хотите
...
Рейтинг: 0 / 0
HTML parsing
    #37911688
Valeriu
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Можете заглянуть сюда в этот форум. Правда это для GT.M

http://groups.google.co.uk/group/enterprise-web-developer-community/browse_thread/thread/36c7503939bbc460/96ed5f913bddc79b
...
Рейтинг: 0 / 0
HTML parsing
    #37912023
servit
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Petr0vi4444Тоже интересует этот вопрос, неужели никто не знает? 5195179 (html -> xml)
...
Рейтинг: 0 / 0
HTML parsing
    #37912754
Petr0vi4444
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Попробовал XSLT, в нем можно не парсить, сразу выдернуть текст.
Однако все отваливается на незакрытых тегах и коде вида
Код: sql
1.
<TABLE class=main></TABLE>


Хочет чтобы было
Код: sql
1.
<TABLE class="main"></TABLE>


Cобственно, задача выдернуть кусок текста, если все так печально, буду решать ее ручным парсингом нужного мне куска текста.
Всем спасибо.
...
Рейтинг: 0 / 0
HTML parsing
    #37936374
mys
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
mys
Гость
В конечном итоге решил эту проблему с помощью внешнего .NET сервиса.
Берет у каше урл, читает, парсит и сохраняет результат обратно в каше.
Для .NET использовал SGMLReader.
...
Рейтинг: 0 / 0
7 сообщений из 7, страница 1 из 1
Форумы / Caché, Ensemble, DeepSee, MiniM, IRIS, GT.M [игнор отключен] [закрыт для гостей] / HTML parsing
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]