Поиск всех ссылок в html-документе / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Поиск всех ссылок в html-документе

8 сообщений из 8, страница 1 из 1

Поиск всех ссылок в html-документе

#33376524

Боня

Гость

Вопрос такой.

Я программно читаю из Интернета некую большую html-страничку и хочу достать из неё все ссылки (т.е. все конструкции вида <a href="">). Читаю в некий буфер кусок данных, ищу в нём ссылки. Проблема возникает при переходе от одного куска дщанных к следующему - как обработать корректно этот переход? Ведь ссылка может начинаться в одном блоке, а заканчиваться в другом.

Спасибо заранее.

...

Рейтинг:

0 / 0

14.11.2005, 13:03

| Ответить | Цитировать | Написать

Поиск всех ссылок в html-документе

#33376553

М.Голованов

Участник

Откуда: Подмосковье

Сообщения: 616

Рейтинг: 0 / 0

БоняВопрос такой.

Я программно читаю из Интернета некую большую html-страничку и хочу достать из неё все ссылки (т.е. все конструкции вида <a href="">). Читаю в некий буфер кусок данных, ищу в нём ссылки. Проблема возникает при переходе от одного куска дщанных к следующему - как обработать корректно этот переход? Ведь ссылка может начинаться в одном блоке, а заканчиваться в другом.

Спасибо заранее.

Вообще-то принято использовать какой-нибудь парсер, который как минимум умеет находить элементы типа A и извлекать их атрибуты (href). Можно взять парсер общего назначения, напустить его на страницу, а потом в результате парсинга (обычно это "дерево" элеметнов в пямяти) уже поискать элементы типа A и достать их href.

...

Рейтинг:

0 / 0

14.11.2005, 13:15

| Ответить | Цитировать | Написать

Поиск всех ссылок в html-документе

#33376557

KGP

Участник

Откуда: Москва

Сообщения: 2 385

Рейтинг: 0 / 0

БоняВопрос такой.

Я программно читаю из Интернета некую большую html-страничку и хочу достать из неё все ссылки (т.е. все конструкции вида <a href="">). Читаю в некий буфер кусок данных, ищу в нём ссылки. Проблема возникает при переходе от одного куска дщанных к следующему - как обработать корректно этот переход? Ведь ссылка может начинаться в одном блоке, а заканчиваться в другом.

Спасибо заранее.

по моему мнению, правильнее было, бы отработать документ и ссылки сохранить отдельно, занявшись синхронизацией текста-ссылок.

...

Рейтинг:

0 / 0

14.11.2005, 13:17

| Ответить | Цитировать | Написать

Поиск всех ссылок в html-документе

#33376615

Боня

Гость

Допустим, буду искать тэги с помощью RegExp (вопрос не в этом).
Не хочется делать лишнюю работу, строить дерево и т.п.
Вопрос в том, как искать в документе, который никогда не будет целиком в памяти, а будут лишь его куски непонятно какого размера, при этом желдательно отделить код парсинга от кода, читающего из интернета страничку.

...

Рейтинг:

0 / 0

14.11.2005, 13:37

| Ответить | Цитировать | Написать

Поиск всех ссылок в html-документе

#33379900

maXmo

Участник

Откуда: Моск.

Сообщения: 8 515

Рейтинг: 0 / 0

аккуратно обрабатывай стыки кусков. Смотри, где начинаются/кончаются теги.
------------------
- А как в Интеpнете pаботать? - Сначала нужно узнать, что вам нужно rtfm

...

Рейтинг:

0 / 0

15.11.2005, 18:10

| Ответить | Цитировать | Написать

Поиск всех ссылок в html-документе

#33382617

Боня

Гость

М-да, аккуратно это хорошо
Вопрос КАК

...

Рейтинг:

0 / 0

16.11.2005, 20:26

| Ответить | Цитировать | Написать

Поиск всех ссылок в html-документе

#33382639

DarkSquid

Участник

Откуда: http://terredesreves.3bb.ru/

Сообщения: 4 801

Рейтинг: 0 / 0

Нет такой html-страницы, которая не поместилась бы в памяти.

...

Рейтинг:

0 / 0

16.11.2005, 20:50

| Ответить | Цитировать | Написать

Поиск всех ссылок в html-документе

#33384189

maXmo

Участник

Откуда: Моск.

Сообщения: 8 515

Рейтинг: 0 / 0

БоняВопрос КАКрекомендую подумать над этим на сон грядущий.

...

Рейтинг:

0 / 0

17.11.2005, 14:22

| Ответить | Цитировать | Написать

8 сообщений из 8, страница 1 из 1

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Поиск всех ссылок в html-документе

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&fpage=193&tid=1347272]:	0ms
get settings:	9ms
get forum list:	18ms
check forum access:	3ms
check topic access:	3ms
track hit:	44ms
get topic data:	10ms
get forum data:	2ms
get page messages:	50ms
get tp. blocked users:	2ms
others:	259ms

total:	400ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы