powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / xpath-запрос к html (интересная выборка)
6 сообщений из 6, страница 1 из 1
xpath-запрос к html (интересная выборка)
    #37475507
AmHoHoSanta
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Доброго времени суток, вопрос собсно в чём..
Есть страница с которой нужно вытащить кусок текста, выглядит пример ПЕРВОГО кода вот так:
....
<tbody>
<tr>
<td class="t12ver" width="100%" valign="top" align="left"><img src=" http://www.ua-today.com/images/library/Oleynikov2.jpg" style="width: 287px; height: 229px;"/>
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ (второй абзац)
<br/>
<br/>
<br/>
<iframe width="640" height="360" frameborder="0" allowfullscreen="" src=" http://тут еще видео какое-то(это не важно)"/>
</td>
</tr>
</tbody>......

путь к ноду не сложен:
//div[@id="myarticles_dom"]//td[@class="t12ver"]
но! нужно ссылаться на абзаци, а не на весть текст ( с учетом того, что одинаковых страниц может быть много, а количество абзацев изменяется.. может быть один а может быть и десять тоесть значение не фиксированное)

Вот пример ВТОРОГО кода
....
<div class="article_box">
<span id="0097f" style="font-size:1.0em;">
<p> ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ </p> (ПЕРВЫЙ АБЗАЦ)
<p> ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ </p> (ВТОРОЙ АБЗАЦ)
</span>
</div>
....Верный запрос в таком случае будет: //div[@id="article_box"]/span/p (так мы ссылаемся на сами абзаци, собственно того же нужно добится для первого кода)

Буду благодарен если кто подскажет решение.. уже тонну интернета перелопатил(
...
Рейтинг: 0 / 0
xpath-запрос к html (интересная выборка)
    #37475631
mage.lan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AmHoHoSanta,

придумайте как вы хотите делить на абзацы, наличие <br/> перед, после, оба?

нужен критерий, по которому будет разобран текст.
...
Рейтинг: 0 / 0
xpath-запрос к html (интересная выборка)
    #37475671
AmHoHoSanta
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mage.lan,

Простите, тоесть?
мне нужно как я во втором примере приводил, запрос, который будет ссылаться на абзацы, но в коде первого примера текст (каждый абзац) не находится закрытым в теги, вот в чём проблемка..
...
Рейтинг: 0 / 0
xpath-запрос к html (интересная выборка)
    #37475754
mage.lan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AmHoHoSanta,

поэтому я и прошу указать вас критерии, что считать абзацем текста
такой текст:
Код: plaintext
1.
2.
3.
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
или такой
Код: plaintext
1.
2.
3.
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
или такой
Код: plaintext
1.
2.
3.
4.
5.
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>

ифрейм будет абзацем?
XSL не умеет думать за вас, для него текст это текст, теги это теги. Вы должны рассказать по каким формальным признакам он будет отличать абзацы от неабзацей, потому как я могу вам выдать кусок кода, который разберет конкретно пример, но на боевых данных все получится не так, как вы ожидали.
...
Рейтинг: 0 / 0
xpath-запрос к html (интересная выборка)
    #37477024
AmHoHoSanta
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mage.lan,

а, понимаю..

абзац это:
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (второй абзац)
...
Рейтинг: 0 / 0
xpath-запрос к html (интересная выборка)
    #37477061
mage.lan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AmHoHoSanta,

гуляние по текстам, можно но br вставать, но думаю вам это не нужно:
//text()[preceding-sibling::node()[1][name()='br'] and preceding-sibling::node()[2][name()='br']]
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / xpath-запрос к html (интересная выборка)
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]