|
Парсер на C#
|
|||
---|---|---|---|
#18+
ЕвгенийВБред какой то. Это не бред, это опыт набитых шишек. Регэксы - это конечные автоматы, вложенные конструкции произвольной глубины автоматным языком не являются. Никто никогда в здравом уме парсить xml/html регэксами не будет, для этого есть более соответствующие средства. В случае html, например, HTML agility pack. Автор того постинга на SOF примерно на это и намекал. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 18:36 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Сон Веры ПавловныЕвгенийВБред какой то. Это не бред, это опыт набитых шишек. Регэксы - это конечные автоматы, вложенные конструкции произвольной глубины автоматным языком не являются. Никто никогда в здравом уме парсить xml/html регэксами не будет, для этого есть более соответствующие средства. В случае html, например, HTML agility pack. Автор того постинга на SOF примерно на это и намекал.парсить html регекспами полностью это конечно бред. но обычно весь html не нужен. выковыривается уникальный блок с нужными данными, из него из него следующий уникальный блок, и т.д. выковырять те линковские спрятанные инпуты вообще не проблема, даже сужать область поиска не нужно. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 19:08 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
VadimkaaaЯ авторизируюсь через компонент WebBrowser а парсю через WebClient А что мешает парсить через "компонент WebBrowser"? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 22:35 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Vadimkaaa, Здесь показано, как получить куки и запихнуть в тип CookieContainer http://stackoverflow.com/questions/15049877/getting-webbrowser-cookies-to-log-in А здесь, как расширить класс WebClient, чтобы работать можно было с куки http://stackoverflow.com/questions/14551345/accept-cookies-in-webclient ... |
|||
:
Нравится:
Не нравится:
|
|||
15.08.2015, 11:33 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Для парсеров на c# пользуюсь HttpWebRequest, HttpWebResponse http://rsdn.ru/article/inet/httpweb.xml для анализа авторизации и нюансов работы использую отладочный прокси Fiddler ... |
|||
:
Нравится:
Не нравится:
|
|||
18.08.2015, 08:13 |
|
|
start [/forum/topic.php?fid=20&msg=39031234&tid=1401280]: |
0ms |
get settings: |
8ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
36ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
39ms |
get tp. blocked users: |
1ms |
others: | 331ms |
total: | 445ms |
0 / 0 |