powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / (PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
5 сообщений из 5, страница 1 из 1
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
    #33404012
Grey Horse
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Надо выдернуть из HTML файла слова, являющиеся гиперссылками. Тэги, URLы, а также весь остальной (не ссылочный) текст игнорируется. Может, оно у вас уже составлено?
...
Рейтинг: 0 / 0
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
    #33404043
Фотография Black
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
думаю это поможет ...
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
#Поиск URL в тексте и далнейшее подсвечивание таковых, непосредственно, ссылками.
#Пример: В тексте встречается фрагмент: http://www.server.ru, заменить его надо на <a href="http://www.server.ru/>http://www.server.ru/</a> 
#Варианты решений: 
#1.
s[((?:ht|f)tp://(?:[\w\-]+\.)+\w+(?:\:\d+)?(?:/[\w\.\~,\-/]*(?:\?[\w;% \+\-,\=\&]+)?(?:\*)?)?)][\<a href="$ 1 ">$ 1 \</a>]goi;
(Андрей Новиков)
# 2 .
s/\b((ht|f)tp):(\/\/)([a-z0- 9 .:@*()~#\]\[_?=&\/\\-])+/<a href=$&>$&<\/a>/gi;
(Михаил Кюршин)
# 3 .
s|(http://[^\s]+)|<a href=$ 1 >$ 1 </a>|ig;
#(Михаил Костиков)
#Как вы понимаете, возможны и другие варианты. Это лишь примеры. 
Xpoint.ru - Программирование::Perl::Регулярные выражения - F.A.Q.
...
Рейтинг: 0 / 0
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
    #33404089
g613
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Николай aka Motodorдумаю это поможет ...
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
#Поиск URL в тексте и далнейшее подсвечивание таковых, непосредственно, ссылками.
#Пример: В тексте встречается фрагмент: http://www.server.ru, заменить его надо на <a href="http://www.server.ru/>http://www.server.ru/</a> 
#Варианты решений: 
#1.
s[((?:ht|f)tp://(?:[\w\-]+\.)+\w+(?:\:\d+)?(?:/[\w\.\~,\-/]*(?:\?[\w;% \+\-,\=\&]+)?(?:\*)?)?)][\<a href="$ 1 ">$ 1 \</a>]goi;
(Андрей Новиков)
# 2 .
s/\b((ht|f)tp):(\/\/)([a-z0- 9 .:@*()~#\]\[_?=&\/\\-])+/<a href=$&>$&<\/a>/gi;
(Михаил Кюршин)
# 3 .
s|(http://[^\s]+)|<a href=$ 1 >$ 1 </a>|ig;
#(Михаил Костиков)
#Как вы понимаете, возможны и другие варианты. Это лишь примеры. 
Xpoint.ru - Программирование::Perl::Регулярные выражения - F.A.Q.

вообще выдирание из _ТЕКСТА_ кусков содержащих подстроку http и _РАЗБОР_HTML_документа_ и поиск в нем ( в конкретных частях его, так как я сильно подозреваю, что куски вида '<a href="http://1.2.3.com">' и <pre>http://1.2.3.com</pre> есть несколько разные вещи и обрабатываться они должны по разному ) подстроки http, поэтому предложу таки изначально посмотреть в сторону HTML::Parser 'a...
...
Рейтинг: 0 / 0
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
    #33404099
g613
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
p.s.
...вообще выдирание из _ТЕКСТА_ кусков содержащих подстроку http и _РАЗБОР_HTML_документа_ и поиск в нем ( ... ) подстроки http - не одно и тоже...
...
Рейтинг: 0 / 0
(PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
    #33404107
Grey Horse
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
g613
поэтому предложу таки изначально посмотреть в сторону HTML::Parser 'a...
Благодарю. Похоже, это то, что мне нужно.
...
Рейтинг: 0 / 0
5 сообщений из 5, страница 1 из 1
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / (PERL) Надо выдернуть из HTML файла слова, являющиеся гиперссылками
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]