Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / Новый парсер HTML для .Net / 10 сообщений из 10, страница 1 из 1
14.11.2012, 12:56
    #38037760
Jovanny
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
http://www.ssa-outsourcing.com/products/xparser/

Корректно обрабатывает атрибуты без кавычек, незакрытые теги и т.п.
Будем рады замечаниям и предложениям.
...
Рейтинг: 0 / 0
14.11.2012, 13:36
    #38037848
Antonariy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
И что, что новый? Меня старый устраивает на 146%.
Где список азартных игрищ и ветрениц, которыми он отличается от стандартного? Где красивые графики сравнения производительности?

Просто так тестировать вашу поделку нет интереса.
...
Рейтинг: 0 / 0
14.11.2012, 13:43
    #38037876
Jovanny
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
Antonariy,

А какой старый, если не секрет? Я в своё время более подходящего, чем SgmlReader, не нашёл.
Но и тот напрямую в XDocument парсить не мог, приходилось заливать через XmlDocument.
...
Рейтинг: 0 / 0
14.11.2012, 16:13
    #38038302
Antonariy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
Чью-то допиленную самоделку, разбирающую текст в простой массив тегов :)
Большего мне не требовалось.
...
Рейтинг: 0 / 0
14.11.2012, 17:28
    #38038466
_Vasilisk_
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
Я стесняюсь спросить, чем mshtml не угодил?
...
Рейтинг: 0 / 0
14.11.2012, 17:41
    #38038503
Antonariy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
_Vasilisk_Я стесняюсь спросить, чем mshtml не угодил?Лично мне он не угодил например тем, что считал своим долгом из <table><td></td></table> сделать <table><tbody><tr><td></td></tr></tbody></table>. Или при использовании document.write переколбасить относительные ссылки, напихав в них about:blank default.aspx.
...
Рейтинг: 0 / 0
14.11.2012, 18:34
    #38038602
Jovanny
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
_Vasilisk_Я стесняюсь спросить, чем mshtml не угодил?

Не поддерживает XPath, а если сайт содержит фреймы или контент заполняется JavaScript'ами, так вообще извлечь конкретные данные из сайта часто бывает просто невозможно. Кроме того, привязан к WinForms.
...
Рейтинг: 0 / 0
14.11.2012, 19:17
    #38038662
Antonariy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
JovannyНе поддерживает XPath
Зато поддерживает querySelector , он немногим уступает xpath. А может и не уступает.
Jovanny а если сайт содержит фреймы или контент заполняется JavaScript'ами, так вообще извлечь конкретные данные из сайта часто бывает просто невозможноИфреймы не проверял, но можно js интерпретировать и извлечь сенеренные им данные.
JovannyКроме того, привязан к WinForms.А это вообще не соответствует действительности. MSHTML является неотъемлемой частью системы на равных с WinForms. Даже более того, WinForms уйдет, а MSHTML останется.
...
Рейтинг: 0 / 0
14.11.2012, 19:19
    #38038665
Antonariy
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
AntonariyJovanny а если сайт содержит фреймы или контент заполняется JavaScript'ами, так вообще извлечь конкретные данные из сайта часто бывает просто невозможноИфреймы не проверял, но можно js интерпретировать и извлечь сенеренные им данные.Кстати, сомневаюсь, что ваш парсер это умеет.
...
Рейтинг: 0 / 0
14.11.2012, 19:41
    #38038702
Jovanny
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Новый парсер HTML для .Net
AntonariyКстати, сомневаюсь, что ваш парсер это умеет.
Нет, конечно, но там как параметр можно использовать HttpWebRequest, или просто использовать текст, который он возвращает.
А HttpWebRequest имеет кучу настроек.
...
Рейтинг: 0 / 0
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / Новый парсер HTML для .Net / 10 сообщений из 10, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]