powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Парсинг одинаковых тегов
13 сообщений из 13, страница 1 из 1
Парсинг одинаковых тегов
    #39583777
Spartak19
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Доброго времени суток!
Подскажите как вытащить нужный текст из приложенного ниже тега

Код: vbnet
1.
<a href="Этот текст не нужен" class="123456">Текст который нужно скопировать</a>


Таких тегов куча на странице, все их надо парсить и потом добавить в листбокс.
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583780
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Рекомендуют Html Agility Pack
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583781
Spartak19
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Shocker.Pro,Судя по инфе в инете я так и понял что он нужен, только годных примеров найти не могу, понимаю только VB.net и то только как "новичек" поэтому и обратился на форум
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583784
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если пока новичок, учи сразу C#
А то ни на что годных примеров не найдешь
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583795
Pu4koff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Spartak19Shocker.Pro,Судя по инфе в инете я так и понял что он нужен, только годных примеров найти не могу, понимаю только VB.net и то только как "новичек" поэтому и обратился на форум
так в чём именно проблема? Библиотека достаточно простая.
Страницу можно скачать самостоятельно каким-нибудь HtmlClient или же можно взять из этой библиотеки класс HtmlWeb.
Дальше собственно работа с классом HtmlDocument. В зависимости от страницы, либо через DOM разбирать, либо XPath использовать, либо всё вместе.
XPath может быть, например, таким: .//a[@class="123456"]
тогда вызов HtmlDocument.DocumentNode.SelectNodes c этим xpath вернёт коллекцию тэгов a, у которых класс "123456". Дальше уже у каждого тэга можно забирать свойство InnerText и получать то, что нужно.
как это на барсике синтаксически выглядит не знаю.
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583804
Spartak19
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Pu4koff, Спасибо, процесс пошел, только смотрю что класс там везде разный. Как с этим быть?
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583810
Фотография Cat2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения?
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583818
Pu4koff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Spartak19Pu4koff, Спасибо, процесс пошел, только смотрю что класс там везде разный. Как с этим быть?
Смотреть за какой элемент еще можно зацепиться. Может все ссылки лежат в одном div, который можно по классу, id,... найти.
Не знаю как в других браузерах, а в опере открываем разбираемую страницу, находим нужный элемент, по нему правый клик и "просмотреть код элемента". откроется исходник страницы, там правый клик по своему элементу и копировать -> xpath. сгенерируется корявый xpath для текущего элемента. то же самое можно сделать для другого элемента и найти общее в их xpath. В этом же окне с исходником страницы жмём Ctrl+F и внизу появится строка поиска. Туда можно вбить XPath и смотреть какие элементы по нему найдутся (справа там приписка типа первый элемент из десяти или 1 из 1). Соответственно мудрить до тех пор, пока не подберётся XPath для всех нужных ссылок.
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583820
Pu4koff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Cat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения?
Можно конечно и на регулярках, но они для парсинга html - это таки моветон.
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583836
Arm79
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Cat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения?
Пробовал и так, и так. Через HTML Agility Pack получилось лучше
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583895
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Cat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения? обычно отвечают этой ссылкой ))
You can't parse [X]HTML with regex:
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583902
Фотография Cat2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
Shocker.ProCat2Что, реально надо скачивать библиотеку вместо того, что бы по простому сделать через регулярные выражения? обычно отвечают этой ссылкой ))
You can't parse [X]HTML with regex:
http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags?page=1&tab=votes#tab-top
Может быть. Наверное у меня не встречалось задач, когда регулярки не справлялись.
...
Рейтинг: 0 / 0
Парсинг одинаковых тегов
    #39583919
Фотография Shocker.Pro
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Cat2Может быть. Наверное у меня не встречалось задач, когда регулярки не справлялись.А я вот помню, что когда-то давно парсил регулярками и прыгал по каким-то граблям....
...
Рейтинг: 0 / 0
13 сообщений из 13, страница 1 из 1
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Парсинг одинаковых тегов
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]