Гость
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / xpath-запрос к html (интересная выборка) / 6 сообщений из 6, страница 1 из 1
10.10.2011, 13:38
    #37475507
AmHoHoSanta
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
xpath-запрос к html (интересная выборка)
Доброго времени суток, вопрос собсно в чём..
Есть страница с которой нужно вытащить кусок текста, выглядит пример ПЕРВОГО кода вот так:
....
<tbody>
<tr>
<td class="t12ver" width="100%" valign="top" align="left"><img src=" http://www.ua-today.com/images/library/Oleynikov2.jpg" style="width: 287px; height: 229px;"/>
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ (второй абзац)
<br/>
<br/>
<br/>
<iframe width="640" height="360" frameborder="0" allowfullscreen="" src=" http://тут еще видео какое-то(это не важно)"/>
</td>
</tr>
</tbody>......

путь к ноду не сложен:
//div[@id="myarticles_dom"]//td[@class="t12ver"]
но! нужно ссылаться на абзаци, а не на весть текст ( с учетом того, что одинаковых страниц может быть много, а количество абзацев изменяется.. может быть один а может быть и десять тоесть значение не фиксированное)

Вот пример ВТОРОГО кода
....
<div class="article_box">
<span id="0097f" style="font-size:1.0em;">
<p> ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ </p> (ПЕРВЫЙ АБЗАЦ)
<p> ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ </p> (ВТОРОЙ АБЗАЦ)
</span>
</div>
....Верный запрос в таком случае будет: //div[@id="article_box"]/span/p (так мы ссылаемся на сами абзаци, собственно того же нужно добится для первого кода)

Буду благодарен если кто подскажет решение.. уже тонну интернета перелопатил(
...
Рейтинг: 0 / 0
10.10.2011, 14:48
    #37475631
mage.lan
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
xpath-запрос к html (интересная выборка)
AmHoHoSanta,

придумайте как вы хотите делить на абзацы, наличие <br/> перед, после, оба?

нужен критерий, по которому будет разобран текст.
...
Рейтинг: 0 / 0
10.10.2011, 15:06
    #37475671
AmHoHoSanta
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
xpath-запрос к html (интересная выборка)
mage.lan,

Простите, тоесть?
мне нужно как я во втором примере приводил, запрос, который будет ссылаться на абзацы, но в коде первого примера текст (каждый абзац) не находится закрытым в теги, вот в чём проблемка..
...
Рейтинг: 0 / 0
10.10.2011, 15:44
    #37475754
mage.lan
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
xpath-запрос к html (интересная выборка)
AmHoHoSanta,

поэтому я и прошу указать вас критерии, что считать абзацем текста
такой текст:
Код: plaintext
1.
2.
3.
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
или такой
Код: plaintext
1.
2.
3.
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
или такой
Код: plaintext
1.
2.
3.
4.
5.
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>

ифрейм будет абзацем?
XSL не умеет думать за вас, для него текст это текст, теги это теги. Вы должны рассказать по каким формальным признакам он будет отличать абзацы от неабзацей, потому как я могу вам выдать кусок кода, который разберет конкретно пример, но на боевых данных все получится не так, как вы ожидали.
...
Рейтинг: 0 / 0
11.10.2011, 13:03
    #37477024
AmHoHoSanta
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
xpath-запрос к html (интересная выборка)
mage.lan,

а, понимаю..

абзац это:
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (второй абзац)
...
Рейтинг: 0 / 0
11.10.2011, 13:20
    #37477061
mage.lan
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
xpath-запрос к html (интересная выборка)
AmHoHoSanta,

гуляние по текстам, можно но br вставать, но думаю вам это не нужно:
//text()[preceding-sibling::node()[1][name()='br'] and preceding-sibling::node()[2][name()='br']]
...
Рейтинг: 0 / 0
Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / xpath-запрос к html (интересная выборка) / 6 сообщений из 6, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]