powered by simpleCommunicator - 2.0.53     © 2025 Programmizd 02
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Парсер на C#
5 сообщений из 30, страница 2 из 2
Парсер на C#
    #39029720
Сон Веры Павловны
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ЕвгенийВБред какой то.
Это не бред, это опыт набитых шишек. Регэксы - это конечные автоматы, вложенные конструкции произвольной глубины автоматным языком не являются. Никто никогда в здравом уме парсить xml/html регэксами не будет, для этого есть более соответствующие средства. В случае html, например, HTML agility pack.
Автор того постинга на SOF примерно на это и намекал.
...
Рейтинг: 0 / 0
Парсер на C#
    #39029744
Фотография Antonariy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сон Веры ПавловныЕвгенийВБред какой то.
Это не бред, это опыт набитых шишек. Регэксы - это конечные автоматы, вложенные конструкции произвольной глубины автоматным языком не являются. Никто никогда в здравом уме парсить xml/html регэксами не будет, для этого есть более соответствующие средства. В случае html, например, HTML agility pack.
Автор того постинга на SOF примерно на это и намекал.парсить html регекспами полностью это конечно бред. но обычно весь html не нужен. выковыривается уникальный блок с нужными данными, из него из него следующий уникальный блок, и т.д.

выковырять те линковские спрятанные инпуты вообще не проблема, даже сужать область поиска не нужно.
...
Рейтинг: 0 / 0
Парсер на C#
    #39029827
Arm79
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
VadimkaaaЯ авторизируюсь через компонент WebBrowser а парсю через WebClient
А что мешает парсить через "компонент WebBrowser"?
...
Рейтинг: 0 / 0
Парсер на C#
    #39029924
Фотография VSVLAD
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vadimkaaa,

Здесь показано, как получить куки и запихнуть в тип CookieContainer
http://stackoverflow.com/questions/15049877/getting-webbrowser-cookies-to-log-in

А здесь, как расширить класс WebClient, чтобы работать можно было с куки
http://stackoverflow.com/questions/14551345/accept-cookies-in-webclient
...
Рейтинг: 0 / 0
Парсер на C#
    #39031234
Ermak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Для парсеров на c# пользуюсь HttpWebRequest, HttpWebResponse

http://rsdn.ru/article/inet/httpweb.xml

для анализа авторизации и нюансов работы использую отладочный прокси Fiddler
...
Рейтинг: 0 / 0
5 сообщений из 30, страница 2 из 2
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Парсер на C#
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]