|
Парсер на C#
|
|||
---|---|---|---|
#18+
Стоит задача спарсить ссылки на все профили из заданной группы на linkedin Код: c# 1. 2. 3. 4. 5. 6. 7. 8. 9.
Но беда в том что нужна авторизация. Я авторизируюсь через компонент WebBrowser а парсю через WebClient И получается что WebClient заходя на линкед не авторизирован и кидает на стр. авторизации. Помогите решить проблему. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 15:14 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
VadimkaaaСтоит задача спарсить ссылки на все профили из заданной группы на linkedin Код: c# 1. 2. 3. 4. 5. 6. 7. 8. 9.
Но беда в том что нужна авторизация. Я авторизируюсь через компонент WebBrowser а парсю через WebClient И получается что WebClient заходя на линкед не авторизирован и кидает на стр. авторизации. Помогите решить проблему.это все равно что авторизироваться в хроме, а заходить через оперу. сюда копай: 11365485 ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 15:25 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Antonariy, я понимаю) можно как то куки передать с WebBrowser в WebClient ? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 15:27 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
VadimkaaaAntonariy, я понимаю) можно как то куки передать с WebBrowser в WebClient ?не пробовал выдирать из WB куки, но думаю, что геморой тот еще. что мешает посмотреть отправляемый на авторизацию запрос и отправить такой же через WebClient? куки в него и вернутся. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 15:34 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Antonariyчто мешает посмотреть отправляемый на авторизацию запрос и отправить такой же через WebClient? куки в него и вернутся. Не ясно только под какой браузер эти куки создадутся. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 15:36 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Vadimkaaa Код: c# 1. 2. 3. 4. 5. 6. 7. 8. 9.
И еще раз про парсинг html регэксами . ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 15:40 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Antonariy, кстати, возможно как-то через WebClient пройти авторизацию? если да, то подскажите как? спасибо! ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 15:48 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
AxeleronAntonariyчто мешает посмотреть отправляемый на авторизацию запрос и отправить такой же через WebClient? куки в него и вернутся. Не ясно только под какой браузер эти куки создадутся.Они не "под браузер", они вернутся в веб-клиент в http-заголовках, ты их оттуда заберешь и будешь цеплять к заголовкам при последующих запросах. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:36 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Antonariy, а как все это сделать? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:40 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
VadimkaaaAntonariy, кстати, возможно как-то через WebClient пройти авторизацию? если да, то подскажите как? спасибо!открыть хром, зайти на сайт, нажать f12, авторизироваться. в закладке network найти запрос, в котором отправлялись авторизационные данные, изучить его, создать такой же через веб-клиент. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:44 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Сон Веры Павловны И еще раз про парсинг html регэксами . Бред какой то. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:44 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
ЕвгенийВСон Веры Павловны И еще раз про парсинг html регэксами . Бред какой то.+1 что мешает парсить не за один проход, а по кускам? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:48 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
ЕвгенийВVadimkaaa, https://msdn.microsoft.com/ru-ru/library/system.net.webclient.credentials(v=vs.110).aspx Это не то, это позволяет доменные крендели ставить, а у linkedin своя аутентификация. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:52 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
AntonariyVadimkaaaAntonariy, кстати, возможно как-то через WebClient пройти авторизацию? если да, то подскажите как? спасибо!открыть хром, зайти на сайт, нажать f12, авторизироваться. в закладке network найти запрос, в котором отправлялись авторизационные данные, изучить его, создать такой же через веб-клиент.в самом примитивном случае нужно просто отправить post'ом текст типа login=xxx&pass=yyy, вернется заголовок типа Set-Cookie:STATEID=900d8c6f-50c0-4826-8025-ed0d9a074661; path=/ это ответ на авторизацию в моем текущем проекте, смысловая часть тут STATEID=900d8c6f-50c0-4826-8025-ed0d9a074661 ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:53 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
AntonariyЕвгенийВпропущено... Бред какой то.+1 что мешает парсить не за один проход, а по кускам? Ну вот, еще не залогинились, а уже парсить пытаемся :) ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:55 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
petalvik, читал. не могу никак связать WebClient... ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:57 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Вообще поддерживаю вариант skyANA 18018910 Не делал под WinForms, но именно так когда-то писал Single Sign On аутентификацию. Я бы первым делом именно так и в данном случае пробовал бы. Куки вытаскиваются после первого запроса на аутентификацию, а потом посалаются при каждом запросе к сайту. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:58 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Vadimkaaapetalvik, читал. не могу никак связать WebClient... Думается, ни WebClient, ни WebBrowser тут вообще не нужны. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 16:59 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
Axeleron, я просто не знаю как потом данные спарсить ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 17:00 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
VadimkaaaAxeleron, я просто не знаю как потом данные спарсить Получите страницу со всеми тэгами в HttpWebResponse и будете парсить. Других вариантов нет, раз хочется захватывать данные нелегально ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 17:02 |
|
Парсер на C#
|
|||
---|---|---|---|
#18+
попробовал войти в линкедин, там передаваемый текст сложнее. 1й параметр это логин, 2й - пароль, 3й и последний наверное не обязательны (последний точно), а чтобы получить 4 и 5, нужно предварительно веб-клиентом сделать get https://www.linkedin.com/ и выдрать из формы: Код: html 1. 2.
хотя может и они не обязательны. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2015, 17:02 |
|
|
start [/forum/topic.php?fid=20&msg=39029641&tid=1401280]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
36ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
58ms |
get tp. blocked users: |
1ms |
others: | 18ms |
total: | 153ms |
0 / 0 |