xpath-запрос к html (интересная выборка) / XML, XSL, XPath, XQuery

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / xpath-запрос к html (интересная выборка)

6 сообщений из 6, страница 1 из 1

xpath-запрос к html (интересная выборка)

#37475507

AmHoHoSanta

Гость

Доброго времени суток, вопрос собсно в чём..
Есть страница с которой нужно вытащить кусок текста, выглядит пример ПЕРВОГО кода вот так:
....
<tbody>
<tr>
<td class="t12ver" width="100%" valign="top" align="left"><img src=" http://www.ua-today.com/images/library/Oleynikov2.jpg" style="width: 287px; height: 229px;"/>
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ (второй абзац)
<br/>
<br/>
<br/>
<iframe width="640" height="360" frameborder="0" allowfullscreen="" src=" http://тут еще видео какое-то(это не важно)"/>
</td>
</tr>
</tbody>......

путь к ноду не сложен:
//div[@id="myarticles_dom"]//td[@class="t12ver"]
но! нужно ссылаться на абзаци, а не на весть текст ( с учетом того, что одинаковых страниц может быть много, а количество абзацев изменяется.. может быть один а может быть и десять тоесть значение не фиксированное)

Вот пример ВТОРОГО кода
....
<div class="article_box">
<span id="0097f" style="font-size:1.0em;">
<p> ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ </p> (ПЕРВЫЙ АБЗАЦ)
<p> ТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТТЕКСТ ТЕКСТ ТЕКСТ </p> (ВТОРОЙ АБЗАЦ)
</span>
</div>
....Верный запрос в таком случае будет: //div[@id="article_box"]/span/p (так мы ссылаемся на сами абзаци, собственно того же нужно добится для первого кода)

Буду благодарен если кто подскажет решение.. уже тонну интернета перелопатил(

...

Рейтинг:

0 / 0

10.10.2011, 13:38

| Ответить | Цитировать | Написать

xpath-запрос к html (интересная выборка)

#37475631

mage.lan

Участник

Откуда: Царьград

Сообщения: 1 431

Рейтинг: 0 / 0

AmHoHoSanta,

придумайте как вы хотите делить на абзацы, наличие <br/> перед, после, оба?

нужен критерий, по которому будет разобран текст.

...

Рейтинг:

0 / 0

10.10.2011, 14:48

| Ответить | Цитировать | Написать

xpath-запрос к html (интересная выборка)

#37475671

AmHoHoSanta

Гость

mage.lan,

Простите, тоесть?
мне нужно как я во втором примере приводил, запрос, который будет ссылаться на абзацы, но в коде первого примера текст (каждый абзац) не находится закрытым в теги, вот в чём проблемка..

...

Рейтинг:

0 / 0

10.10.2011, 15:06

| Ответить | Цитировать | Написать

xpath-запрос к html (интересная выборка)

#37475754

mage.lan

Участник

Откуда: Царьград

Сообщения: 1 431

Рейтинг: 0 / 0

AmHoHoSanta,

поэтому я и прошу указать вас критерии, что считать абзацем текста
такой текст:

Код: plaintext

1.
2.
3.

<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)

или такой

Код: plaintext

1.
2.
3.

ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>

или такой

Код: plaintext

1.
2.
3.
4.
5.

<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>

ифрейм будет абзацем?
XSL не умеет думать за вас, для него текст это текст, теги это теги. Вы должны рассказать по каким формальным признакам он будет отличать абзацы от неабзацей, потому как я могу вам выдать кусок кода, который разберет конкретно пример, но на боевых данных все получится не так, как вы ожидали.

...

Рейтинг:

0 / 0

10.10.2011, 15:44

| Ответить | Цитировать | Написать

xpath-запрос к html (интересная выборка)

#37477024

AmHoHoSanta

Гость

mage.lan,

а, понимаю..

абзац это:
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (первый абзац)
<br/>
<br/>
ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ ТЕКСТ (второй абзац)

...

Рейтинг:

0 / 0

11.10.2011, 13:03

| Ответить | Цитировать | Написать

xpath-запрос к html (интересная выборка)

#37477061

mage.lan

Участник

Откуда: Царьград

Сообщения: 1 431

Рейтинг: 0 / 0

AmHoHoSanta,

гуляние по текстам, можно но br вставать, но думаю вам это не нужно:
//text()[preceding-sibling::node()[1][name()='br'] and preceding-sibling::node()[2][name()='br']]

...

Рейтинг:

0 / 0

11.10.2011, 13:20

| Ответить | Цитировать | Написать

6 сообщений из 6, страница 1 из 1

Форумы / XML, XSL, XPath, XQuery [игнор отключен] [закрыт для гостей] / xpath-запрос к html (интересная выборка)

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=14&fpage=26&tid=1332849]:	0ms
get settings:	5ms
get forum list:	13ms
check forum access:	2ms
check topic access:	2ms
track hit:	28ms
get topic data:	11ms
get forum data:	2ms
get page messages:	42ms
get tp. blocked users:	1ms
others:	217ms

total:	323ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы