|
Парсинг ссылки из строки, содержащей много разнородных ссылок
|
|||
---|---|---|---|
#18+
Добрый день. Столкнулся с такой проблемой: Есть строка, в которой содержится код веб-страницы. В том числе в этой строке есть и разные ссылки, например, /index.php, /index.css, /2/3.png и т.д. Я хочу выдернуть из этой строки все ссылки с .php и записать их в файл. Есть функция (написал) для выдёргивания из строки подстроки по начальному и конечному паттерну ( в данном случае - "href", ".php"). Однако, вот какая возникла проблема: выдёргивается подстрока, начинающаяся с href и заканчивающаяся .php, но в ней может быть много мусора(другого кода), содержащего другие ссылки: index.css, т.к. до .php идёт много кода, в том числе и другие ссылки. Как эту ситуацию можно поправить? ... |
|||
:
Нравится:
Не нравится:
|
|||
12.04.2017, 18:42 |
|
Парсинг ссылки из строки, содержащей много разнородных ссылок
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
12.04.2017, 18:47 |
|
Парсинг ссылки из строки, содержащей много разнородных ссылок
|
|||
---|---|---|---|
#18+
ukugyul552465Есть строка, в которой содержится код веб-страницы. HtmlAgilityPack ... |
|||
:
Нравится:
Не нравится:
|
|||
13.04.2017, 03:18 |
|
Парсинг ссылки из строки, содержащей много разнородных ссылок
|
|||
---|---|---|---|
#18+
Сон Веры Павловныukugyul552465Есть строка, в которой содержится код веб-страницы. HtmlAgilityPack +1 ... |
|||
:
Нравится:
Не нравится:
|
|||
13.04.2017, 11:25 |
|
|
start [/forum/topic.php?fid=20&fpage=45&tid=1399960]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
32ms |
get topic data: |
26ms |
get forum data: |
2ms |
get page messages: |
43ms |
get tp. blocked users: |
1ms |
others: | 17ms |
total: | 149ms |
0 / 0 |