Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
13.01.2018, 20:28
|
|||
---|---|---|---|
|
|||
Парсинг одинаковых тегов |
|||
#18+
Доброго времени суток! Подскажите как вытащить нужный текст из приложенного ниже тега Код: vbnet 1.
Таких тегов куча на странице, все их надо парсить и потом добавить в листбокс. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
13.01.2018, 20:35
|
|||
---|---|---|---|
|
|||
Парсинг одинаковых тегов |
|||
#18+
Рекомендуют Html Agility Pack ... |
|||
:
Нравится:
Не нравится:
|
|||
|
13.01.2018, 20:38
|
|||
---|---|---|---|
|
|||
Парсинг одинаковых тегов |
|||
#18+
Shocker.Pro,Судя по инфе в инете я так и понял что он нужен, только годных примеров найти не могу, понимаю только VB.net и то только как "новичек" поэтому и обратился на форум ... |
|||
:
Нравится:
Не нравится:
|
|||
|
13.01.2018, 21:03
|
|||
---|---|---|---|
|
|||
Парсинг одинаковых тегов |
|||
#18+
Если пока новичок, учи сразу C# А то ни на что годных примеров не найдешь ... |
|||
:
Нравится:
Не нравится:
|
|||
|
13.01.2018, 22:03
|
|||
---|---|---|---|
Парсинг одинаковых тегов |
|||
#18+
Spartak19Shocker.Pro,Судя по инфе в инете я так и понял что он нужен, только годных примеров найти не могу, понимаю только VB.net и то только как "новичек" поэтому и обратился на форум так в чём именно проблема? Библиотека достаточно простая. Страницу можно скачать самостоятельно каким-нибудь HtmlClient или же можно взять из этой библиотеки класс HtmlWeb. Дальше собственно работа с классом HtmlDocument. В зависимости от страницы, либо через DOM разбирать, либо XPath использовать, либо всё вместе. XPath может быть, например, таким: .//a[@class="123456"] тогда вызов HtmlDocument.DocumentNode.SelectNodes c этим xpath вернёт коллекцию тэгов a, у которых класс "123456". Дальше уже у каждого тэга можно забирать свойство InnerText и получать то, что нужно. как это на барсике синтаксически выглядит не знаю. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
13.01.2018, 22:47
|
|||
---|---|---|---|
|
|||
Парсинг одинаковых тегов |
|||
#18+
Pu4koff, Спасибо, процесс пошел, только смотрю что класс там везде разный. Как с этим быть? ... |
|||
:
Нравится:
Не нравится:
|
|||
|
13.01.2018, 23:17
|
|||
---|---|---|---|
Парсинг одинаковых тегов |
|||
#18+
Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения? ... |
|||
:
Нравится:
Не нравится:
|
|||
|
14.01.2018, 00:04
|
|||
---|---|---|---|
Парсинг одинаковых тегов |
|||
#18+
Spartak19Pu4koff, Спасибо, процесс пошел, только смотрю что класс там везде разный. Как с этим быть? Смотреть за какой элемент еще можно зацепиться. Может все ссылки лежат в одном div, который можно по классу, id,... найти. Не знаю как в других браузерах, а в опере открываем разбираемую страницу, находим нужный элемент, по нему правый клик и "просмотреть код элемента". откроется исходник страницы, там правый клик по своему элементу и копировать -> xpath. сгенерируется корявый xpath для текущего элемента. то же самое можно сделать для другого элемента и найти общее в их xpath. В этом же окне с исходником страницы жмём Ctrl+F и внизу появится строка поиска. Туда можно вбить XPath и смотреть какие элементы по нему найдутся (справа там приписка типа первый элемент из десяти или 1 из 1). Соответственно мудрить до тех пор, пока не подберётся XPath для всех нужных ссылок. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
14.01.2018, 00:08
|
|||
---|---|---|---|
Парсинг одинаковых тегов |
|||
#18+
Cat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения? Можно конечно и на регулярках, но они для парсинга html - это таки моветон. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
14.01.2018, 02:59
|
|||
---|---|---|---|
Парсинг одинаковых тегов |
|||
#18+
Cat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения? Пробовал и так, и так. Через HTML Agility Pack получилось лучше ... |
|||
:
Нравится:
Не нравится:
|
|||
|
14.01.2018, 13:02
|
|||
---|---|---|---|
|
|||
Парсинг одинаковых тегов |
|||
#18+
Cat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения? обычно отвечают этой ссылкой )) You can't parse [X]HTML with regex: http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top ... |
|||
:
Нравится:
Не нравится:
|
|||
|
14.01.2018, 13:23
|
|||
---|---|---|---|
Парсинг одинаковых тегов |
|||
#18+
Shocker.ProCat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения? обычно отвечают этой ссылкой )) You can't parse [X]HTML with regex: http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top Может быть. Наверное у меня не встречалось задач, когда регулярки не справлялись. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
|
start [/forum/topic.php?fid=20&mobile=1&tid=1399535]: |
0ms |
get settings: |
8ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
31ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
56ms |
get tp. blocked users: |
1ms |
others: | 315ms |
total: | 439ms |
0 / 0 |