|
|
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
Здравствуйте. я нуб в яве. Хочу распарсить простую http://example.com/about.html#contacts и получить в процессе буковки строчками со странички в консоль. Нагуглил пару десятков разных примеров и слепил нечто, но оно не работает. буду очень благодарен за наводящие подсказки и точечную отправку к нужному источнику. Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2016, 19:34 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
python Код: python 1. 2. 3. 4. 5. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2016, 19:38 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioНагуглил пару десятков разных примеров и слепил нечто, но оно не работает http://stackoverflow.com/questions/4328711/read-url-to-string-in-few-lines-of-java-code ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2016, 19:39 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
grasoff.net, а причем тут питон? сайт stackoverflow.com действительно очень клевый, когда ты уже прожженный и искушенный кодер. но мне там многое не понятно, и возможности задать там вопрос не имею - ограничен интернет. вариант, который там набрал макс. голосов мне не ясен - я не вижу куда введена ссылка. Так же мне среда говорит, что класса URLConnectionReader нет в ней (это если смотреть самый заплюсованный вариант). В общем, на примерах других у меня получается каша. Если можно, я хотел бы критики именно моего примера. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2016, 20:16 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
Jsoup можно попробовать: Код: java 1. 2. 3. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2016, 23:09 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioвариант, который там набрал макс. голосов мне не ясен - я не вижу куда введена ссылка. Так же мне среда говорит, что класса URLConnectionReader нет в ней (это если смотреть самый заплюсованный вариант).ссылка передаётся параметром командной строки класс там есть 1. cd c:\ 2. mkdir .\temp\urlreader 3. notepad.exe 4. [Ctrl + A] [Ctrl + C] [Ctrl + V] вот того самого примера Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 5. Save as c:\temp\urlreader\URLConnectionReader.java 6. javac URLConnectionReader.java 7. java URLConnectionReader 8. и получаешь в процессе буковки строчками со странички в консоль ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 06:10 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioа причем тут питон?java не очень хороший язык для обучения ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 06:12 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
grasoff.net, спасибо, я попробую. а почему не очень хорош для обучения? у меня по ходу обучения пока что все получалось :/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 10:20 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
grasoff.netpython Код: python 1. 2. 3. 4. 5. +1 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 10:21 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioа почему не очень хорош для обучения? видимо у кого-то вызывает трудности ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 10:25 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
на питоне очень здорово на коленке прототипы делать или мелкие утилиты, которые можно хоть в консоли python, запускать и отлаживать. over 1000 библиотек и биндингов ко всему ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 10:25 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioу меня по ходу обучения пока что все получалосьну, вот с получением контента по ссылке не очень ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 10:26 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioа почему не очень хорош для обучения?по статистике ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 11:26 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
Существуют три вида лжи: ложь, наглая ложь и статистика ( С ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 11:34 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
Попробуй так - Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.03.2016, 14:45 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
grasoff.net, спасибо! получилось благодаря вашему разъяснению. Только настройки прокси вставил еще, иначе нет подключения. Ребят, вот знаете есть баян, про то, что на иностранных форумах задаешь ответ, и тебе пытаются сразу помочь, а на наших форумах, первые три скажут что тебе это не нужно, еще 5ро скажут что надо делать совсем не так или это бессмысленно, и только последний поможет, когда уже тема потеряет актуальность) это не про мой случай, конечно, но все же правда) всем спасиба!)) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 10:30 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
ааа ребят (( подключение то работает, но только для http://, а я хочу данные выгрести из https:// на stackoverflow пожалуйста не посылайте ( ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 15:50 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioааа ребят (( подключение то работает, но только для http://, а я хочу данные выгрести из https:// на stackoverflow пожалуйста не посылайте ( По HTTPS тоже будет работать, если на сервере валидный сертификат. В противном случае надо сертификат качнуть самому и добавить в JKS, либо отключить валидацию SSL в HTTP вообще. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 15:56 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
Blazkowicz, вы не могли бы поподробнее немного? не силен в веб разработке пока. 1. где качнуть сертификат, и что такое JKS? 2. как отключить SSL в HTTP? и на чем, кроме работы консольной проги это скажется? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 16:04 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfio, Вот такой грязных хак http://stackoverflow.com/a/19723687 Влияет на всю JVM, если вы только свою консоль запускаете, то больше ни на что не повлияет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 16:08 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
Blazkowicz, действительно, какая грязь ) ну а если серьезно, вы не могли бы мне как новичку немного больше воды дать? Если я отключаю таким хаком (точнее меняю SSL на TLS), я типа перевожу трафик в незашифрованный? Т.е. если инфу тяну не конфиденциальную, то угрозы как бы нет, условно говоря. Верно? В результате у меня вышел вот такой код Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. В результате, программка выдает мне ошибочку NullPointerException , ссылающуюся на строку while (!tmp.isEmpty()) почему? что-то написано не верно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 16:19 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfioя типа перевожу трафик в незашифрованный? трафик остаётся зашифрованным, проверка достоверности источника отключается что касается NullPointerException - readLine возвращает null в конце потока ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 16:40 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
Изопропил, спасибо ра разьяснение. Уважаемые знатоки, можете еще подсказаньку дать - страничка выгрузилась в XML виде. Про парсинг сходу ничего не знаю пока, скопировал в блокнот с поддержкой XML, и он говорит, что распарсить не может по тегам. Есть ли в яве средства для парсинга битого XML? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 16:59 |
|
||
|
распарсить страничку, вытянуть данные. HALP
|
|||
|---|---|---|---|
|
#18+
wolfio, HTML не является подмножством XML. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.03.2016, 17:04 |
|
||
|
|

start [/forum/topic.php?fid=59&msg=39185182&tid=2124267]: |
0ms |
get settings: |
8ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
48ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
73ms |
get tp. blocked users: |
2ms |
| others: | 212ms |
| total: | 378ms |

| 0 / 0 |
