Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Java [игнор отключен] [закрыт для гостей] / Уменьшение трафика при загрузке html / 20 сообщений из 20, страница 1 из 1
07.07.2016, 11:31
    #39269553
JDS
JDS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
Читаем, парсим сайт.
Использую HttpURLConnection с чтением из потока в буфер ну и на выходе получаем строку с html-страницей.
Вопрос. Есть ли возможность как-то уменьшить трафик, если на странице например есть огромные скрипты, которые нам вообще не нужны? Может есть некий вариант, чтобы сервер с их стороны отправлял страницу в некоем сжатом виде (сам понимаю, что маловероятно, но вдруг чего-то не знаю).
...
Рейтинг: 0 / 0
07.07.2016, 11:45
    #39269573
am_sasa
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDS,

Подозреваю, что HttpURLConnection за "огромные скрипты" не полезет.
На сервер влиять не получится ИМХО
...
Рейтинг: 0 / 0
07.07.2016, 11:53
    #39269584
JDS
JDS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
am_sasaПодозреваю, что HttpURLConnection за "огромные скрипты" не полезет.
На сервер влиять не получится ИМХО
Что значит не полезет?
Вот и тоже уверен, что не получится конечно
...
Рейтинг: 0 / 0
07.07.2016, 12:14
    #39269603
am_sasa
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDS,

а, ну если в тексте, то дело дрянь...
я имел ввиду если скрипт подключен ссылкой
...
Рейтинг: 0 / 0
07.07.2016, 12:19
    #39269607
забыл ник
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
ну во-первых использовать HttpURLConnection вместо HTTPClient или JSoup это мощно. Во-вторых единственное что можно сделать это выставить заголовок что ты accept gzip и вычитывать сжатый контент через GzipInputStream
...
Рейтинг: 0 / 0
07.07.2016, 13:45
    #39269754
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSЧитаем, парсим сайт.
Использую HttpURLConnection с чтением из потока в буфер ну и на выходе получаем строку с html-страницей.
Вопрос. Есть ли возможность как-то уменьшить трафик, если на странице например есть огромные скрипты, которые нам вообще не нужны? Может есть некий вариант, чтобы сервер с их стороны отправлял страницу в некоем сжатом виде (сам понимаю, что маловероятно, но вдруг чего-то не знаю).
Эта оптимизация натолько странная что лучше ей вообще не заниматься ибо выгоды мало.

Вобщем всё упирается в тип сервера и его возможности. Ты может запросить HTTP Range header

http://stackoverflow.com/questions/3303029/http-range-header

и проверить код ошибки. Если ты точно знаешь что твой полезный
контент начинаеися с такого-то смещения байтов то делаешь "перемотку".

Не уверен что это сработает для динамического контента но вобщем нужно
пробовать.

Скорее всего это будет опциональная возможность. Не 100%.
...
Рейтинг: 0 / 0
07.07.2016, 13:55
    #39269765
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
mayton,
действительно странная оптимизация.
JDS дай пример сайта.
Движок эксплорера загружает сайт в потоках за n секунд.
Сначала выключи JS и посмотри, будет ли сайт отображаться корректно. Есть ведь динамический контент.
Как вариант можно не загружать картинки.
...
Рейтинг: 0 / 0
07.07.2016, 14:24
    #39269803
JDS
JDS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
Petro123действительно странная оптимизация.
JDS дай пример сайта.
Движок эксплорера загружает сайт в потоках за n секунд.
Сначала выключи JS и посмотри, будет ли сайт отображаться корректно. Есть ведь динамический контент.
Как вариант можно не загружать картинки.
Пример не могу дать, мопед не мой )
Насчет выключи JS, дин. контента и картинок, то речь же не о браузере, который сначала грузит страницу и потом начинает выполнять скрипты по onload-у например, подгружать параллельно картинки по ссылкам и тд.
Я просто запрашиваю html-страничку, получаю ее, но вопрос не в скорости загрузки, а в трафике.
Когда дергаешь тысячи страниц в день набегает неск гиг трафика, это как минимум, не очень гуманно )
И когда авторы сайта запихивают килобайтовые скрипты в страницу, то... ну молодцы конечно, ибо нефиг )
забыл никну во-первых использовать HttpURLConnection вместо HTTPClient или JSoup это мощно. Во-вторых единственное что можно сделать это выставить заголовок что ты accept gzip и вычитывать сжатый контент через GzipInputStream
Вот это интересно. Спасибо. Поищу. Хорошо, если найдутся примеры.
...
Рейтинг: 0 / 0
07.07.2016, 14:25
    #39269805
grasoff.net
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSЧитаем, парсим сайт.
Использую HttpURLConnection с чтением из потока в буфер ну и на выходе получаем строку с html-страницей.
Вопрос. Есть ли возможность как-то уменьшить трафик, если на странице например есть огромные скрипты, которые нам вообще не нужны? Может есть некий вариант, чтобы сервер с их стороны отправлял страницу в некоем сжатом виде (сам понимаю, что маловероятно, но вдруг чего-то не знаю). textise
...
Рейтинг: 0 / 0
07.07.2016, 14:29
    #39269817
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSКогда дергаешь тысячи страниц в день набегает неск гиг трафика, это как минимум, не очень гуманно )

А фильмы когда смотрят в HD в онлайне? Там поболее набегает.

Вообще что за канал у тебя? ASDL-модем чтоли?
...
Рейтинг: 0 / 0
07.07.2016, 14:45
    #39269849
JDS
JDS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
grasoff.net , не понял. И что? ) Там же в html все равно те же самые скрипты прилетели.
maytonА фильмы когда смотрят в HD в онлайне? Там поболее набегает.
Вообще что за канал у тебя? ASDL-модем чтоли?
Канал вполне вменяемый (повторяю, вопрос не в скорости), но фильмы - это фильмы, ты смотришь их дома на безлимитном интернете с фиксированной абон.платой, там главное, чтобы скорость пропускала и смотришь не круглосуточно )
...
Рейтинг: 0 / 0
07.07.2016, 14:51
    #39269861
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSПример не могу дать, мопед не мой )
странный. Аналог большого сайта из инета не можем привести?
...
Рейтинг: 0 / 0
07.07.2016, 14:53
    #39269868
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSЯ просто запрашиваю html-страничку, получаю ее
возьми с SQL-ru и покажи. Она у тебя без доп закачки скриптов, картинок и CSS?
...
Рейтинг: 0 / 0
07.07.2016, 15:15
    #39269900
JDS
JDS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
Petro123Возьми с SQL-ru и покажи. Она у тебя без доп закачки скриптов, картинок и CSS?
Не втыкаю ) При чем доп закачка картинок и css?
Разве при запросе страницы через тот же HttpURLConnection он по цепочке, сам подкачивает еще и все картинки и css?
...
Рейтинг: 0 / 0
07.07.2016, 15:17
    #39269902
Petro123
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSРазве при запросе страницы через тот же HttpURLConnection
не юзал)).
Я вас спрашиваю пример контента который вы собрались фильтровать. Может это нерешаемая задача в принципе.
...
Рейтинг: 0 / 0
07.07.2016, 15:24
    #39269907
JDS
JDS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
Petro123Я вас спрашиваю пример контента который вы собрались фильтровать.
А я и говорю, что примера под рукой нет, но описанная ситуация точно есть. Ну и решение подсказали уже - gzip.
Только, что не везде поддерживается походу )
...
Рейтинг: 0 / 0
07.07.2016, 15:38
    #39269921
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSНе втыкаю ) При чем доп закачка картинок и css?
Разве при запросе страницы через тот же HttpURLConnection он по цепочке, сам подкачивает еще и все картинки и css?
Подожди-подожди! Какая цепочка? HttpURLConnection - это не fucken-браузер! Он не умеет javascrip исполнять!
Он не умеет подкачивать dependencies!

Он просто возвращяет тебе fucken InputStream и дальше ты сам его парсишь и принимаешь решения о том
что еще докачивать и какое активное содержимое исполнять.
...
Рейтинг: 0 / 0
07.07.2016, 15:40
    #39269925
JDS
JDS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
авторПодожди-подожди! Какая цепочка? HttpURLConnection - это не fucken-браузер! Он не умеет javascrip исполнять!
Он не умеет подкачивать dependencies!
Так об этом и говорю. В общем тему можно закрыть. gzip.
...
Рейтинг: 0 / 0
07.07.2016, 15:43
    #39269929
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDSавторПодожди-подожди! Какая цепочка? HttpURLConnection - это не fucken-браузер! Он не умеет javascrip исполнять!
Он не умеет подкачивать dependencies!
Так об этом и говорю. В общем тему можно закрыть. gzip.
Ну и слава богу.
...
Рейтинг: 0 / 0
07.07.2016, 16:48
    #39270016
grasoff.net
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Уменьшение трафика при загрузке html
JDS grasoff.net , не понял. И что? ) Там же в html все равно те же самые скрипты прилетели.не нашёл ни одного, относящегося к sql.ru
...
Рейтинг: 0 / 0
Форумы / Java [игнор отключен] [закрыт для гостей] / Уменьшение трафика при загрузке html / 20 сообщений из 20, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]