|
Regex. Спарсить строки таблицы.
|
|||
---|---|---|---|
#18+
Доброго времени суток. Есть код: Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
Все работает. Вот только появилась необходимость спарсить полностью строку, т.е. теги tr и все между ними. Никак не могу переписать выражение. Помогите пожалуйста. И еще, подскажите быть может имеет смысл сделать вообще без регулярных выражений? Направьте в нужное русло. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.03.2015, 04:59 |
|
Regex. Спарсить строки таблицы.
|
|||
---|---|---|---|
#18+
black_height, регулярные выражение придумали, не для парсинга HTML. При определенном уровне мастерства, сделать это реально, но задача не стоит свеч и работать будет 1 фиг криво. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.03.2015, 08:18 |
|
Regex. Спарсить строки таблицы.
|
|||
---|---|---|---|
#18+
Спасибо, переписал код, использую Html Agility Pack. Смысл программы: из базы выдергиваются сайты с параметрами, которые необходимо спарсить. написал след. код: Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26.
При работе модуля все данные в базу заносятся нормально. Если строку изменить на: Код: vbnet 1.
То вылетает в этой строке ошибка: Необработанное исключение типа "System.NullReferenceException" в parser from main.exe Дополнительные сведения: Ссылка на объект не указывает на экземпляр объекта. Подозреваю это происходит в том случае, если не найдены элементы на сайте. Как решить проблему? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.03.2015, 16:06 |
|
Regex. Спарсить строки таблицы.
|
|||
---|---|---|---|
#18+
black_height, А точно на этой строке, а не на следующей? Как-бы если коллекции нет, то и должна возвратиться пустая коллекция, и цикл просто сразу завершится без проблем. Как вариант там-же проверять, типо Код: c# 1.
или так Код: c# 1. 2. 3.
Но вообще не должно быть такого, хотя не проверял ... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2015, 12:22 |
|
Regex. Спарсить строки таблицы.
|
|||
---|---|---|---|
#18+
VSVLAD, точнее Код: vbnet 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2015, 12:30 |
|
Regex. Спарсить строки таблицы.
|
|||
---|---|---|---|
#18+
А возвращается Nothing, всё потому... что если нет ни одного элемента, разработчики решили возвращать Nothing/null Можно возвращать тогда пустую коллекцию: New HtmlNodeCollection(Nothing) Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13.
... |
|||
:
Нравится:
Не нравится:
|
|||
15.03.2015, 21:45 |
|
Regex. Спарсить строки таблицы.
|
|||
---|---|---|---|
#18+
Спасибо, уже сделал через Try Catch. Возник еще один вопрос: Есть переменная с адресом: http://www.site.com/textpars.php. В парсеном с этой страницы тексте расположены ссылки в виде Код: html 1.
Каким образом можно проверить ссылки, и если они начинаются с Код: html 1.
, а не Код: html 1.
вставлять Код: html 1.
? Надеюсь понятно изъяснил. :) ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2015, 14:09 |
|
|
start [/forum/topic.php?fid=20&fpage=91&tid=1401794]: |
0ms |
get settings: |
7ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
27ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
43ms |
get tp. blocked users: |
2ms |
others: | 333ms |
total: | 443ms |
0 / 0 |