Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / (PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками / 5 сообщений из 5, страница 1 из 1
28.11.2005, 16:41
    #33404012
Grey Horse
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
Надо выдернуть из HTML файла слова, являющиеся гиперссылками. Тэги, URLы, а также весь остальной (не ссылочный) текст игнорируется. Может, оно у вас уже составлено?
...
Рейтинг: 0 / 0
28.11.2005, 16:49
    #33404043
Black
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
думаю это поможет ...
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
#Поиск URL в тексте и далнейшее подсвечивание таковых, непосредственно, ссылками.
#Пример: В тексте встречается фрагмент: http://www.server.ru, заменить его надо на <a href="http://www.server.ru/>http://www.server.ru/</a> 
#Варианты решений: 
#1.
s[((?:ht|f)tp://(?:[\w\-]+\.)+\w+(?:\:\d+)?(?:/[\w\.\~,\-/]*(?:\?[\w;% \+\-,\=\&]+)?(?:\*)?)?)][\<a href="$ 1 ">$ 1 \</a>]goi;
(Андрей Новиков)
# 2 .
s/\b((ht|f)tp):(\/\/)([a-z0- 9 .:@*()~#\]\[_?=&\/\\-])+/<a href=$&>$&<\/a>/gi;
(Михаил Кюршин)
# 3 .
s|(http://[^\s]+)|<a href=$ 1 >$ 1 </a>|ig;
#(Михаил Костиков)
#Как вы понимаете, возможны и другие варианты. Это лишь примеры. 
Xpoint.ru - Программирование::Perl::Регулярные выражения - F.A.Q.
...
Рейтинг: 0 / 0
28.11.2005, 17:00
    #33404089
g613
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
Николай aka Motodorдумаю это поможет ...
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
#Поиск URL в тексте и далнейшее подсвечивание таковых, непосредственно, ссылками.
#Пример: В тексте встречается фрагмент: http://www.server.ru, заменить его надо на <a href="http://www.server.ru/>http://www.server.ru/</a> 
#Варианты решений: 
#1.
s[((?:ht|f)tp://(?:[\w\-]+\.)+\w+(?:\:\d+)?(?:/[\w\.\~,\-/]*(?:\?[\w;% \+\-,\=\&]+)?(?:\*)?)?)][\<a href="$ 1 ">$ 1 \</a>]goi;
(Андрей Новиков)
# 2 .
s/\b((ht|f)tp):(\/\/)([a-z0- 9 .:@*()~#\]\[_?=&\/\\-])+/<a href=$&>$&<\/a>/gi;
(Михаил Кюршин)
# 3 .
s|(http://[^\s]+)|<a href=$ 1 >$ 1 </a>|ig;
#(Михаил Костиков)
#Как вы понимаете, возможны и другие варианты. Это лишь примеры. 
Xpoint.ru - Программирование::Perl::Регулярные выражения - F.A.Q.

вообще выдирание из _ТЕКСТА_ кусков содержащих подстроку http и _РАЗБОР_HTML_документа_ и поиск в нем ( в конкретных частях его, так как я сильно подозреваю, что куски вида '<a href="http://1.2.3.com">' и <pre>http://1.2.3.com</pre> есть несколько разные вещи и обрабатываться они должны по разному ) подстроки http, поэтому предложу таки изначально посмотреть в сторону HTML::Parser 'a...
...
Рейтинг: 0 / 0
28.11.2005, 17:04
    #33404099
g613
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
p.s.
...вообще выдирание из _ТЕКСТА_ кусков содержащих подстроку http и _РАЗБОР_HTML_документа_ и поиск в нем ( ... ) подстроки http - не одно и тоже...
...
Рейтинг: 0 / 0
28.11.2005, 17:06
    #33404107
Grey Horse
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
g613
поэтому предложу таки изначально посмотреть в сторону HTML::Parser 'a...
Благодарю. Похоже, это то, что мне нужно.
...
Рейтинг: 0 / 0
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / (PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками / 5 сообщений из 5, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]