powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / (PHP) Проверка открывающих и закрывающих тегов
8 сообщений из 33, страница 2 из 2
(PHP) Проверка открывающих и закрывающих тегов
    #33618597
ap99ap
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Изящно не получается.
Нужна принципиально новая идея.

Тупо и в лоб делается вот так:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
/**
 * Проверка текста на предмет совпадения открывающих и закрывающих тэгов
 *
 * @param string $txt    Текст для разбора
 * @param array  $tags   Массив, описывающий состав и начертание
 *                       открывающих и закрывающих тэгов
 *                           array(
 *                               'tag name' =>
 *                                   array(
 *                                       'open'  => '<tag>'
 *                                     , 'close' => '</tag>'
 *                                   )
 *                             ...
 *                           )
 *
 * @return array         Массив, рписывающий результат разбора
 *                           array(
 *                               'result' => true | false
 *                               'reason' => description of problem
 *                           )
 *
 *                           Параметр 'result':
 *                               0     - количество и порядок
 *                                       закрывающих тэгов
 *                                       соответствует количеству
 *                                       и порядку открывающих тэгов
 *                               1     - ошибка несоответствия тэгов
 *                               2     - ошибка во входных параметрах
 *
 *                           Параметр 'reason':
 *                               текстовое описание ошибки
 *
**/
function checkTags( $txt, $tags ) {

    //
    // Возможные результаты
    //

    $result_true = array(
        'result' => true
      , 'reason' => 'тэги соответствуют'
    );
    $result_false_match = array(
        'result' => false
      , 'reason' => 'несоответствие тэгов'
    );
    $result_false_pars = array(
        'result' => false
      , 'reason' => 'ошибка во входных параметрах'
    );

    //
    // Проверка входных параметров
    //

    $regexp = '/\.*';
    $re     = array();
    $search = array();
    foreach( $tags as $t => $v ) {

        // Обязательные элементы массива параметров
        if( empty( $v['open'] ) || empty( $v['close'] ) ) {
            return $result_false_pars;
        }

        // Попутно собираем термы в один регэксп
        $re[] = addcslashes($v['open'].'|'.$v['close'], '/');

        // Попутно формируем массив разбора -
        // ключ - открывающий тэг, значение - закрыващий
        if( !empty($search[$v['open']]) ) {

            // Не допускаются совпадения открывающих тэгов
            return $result_false_pars;

        }

        $search[$v['open']] = $v['close'];

    }
    $regexp .= join( '|', $re ).'/';

    //
    // Разбор входного текста
    //

    // Вырожденный случай - just for test
    if( strlen($txt) ==  0  ) {
        return $result_true;
    }

    // Формируем массив разбора
    preg_match_all( $regexp, $txt, $out );
    $out = $out[ 0 ];

    // Разбираем массив с помощью стека
    $stack = array();
    foreach( $out as $tag ) {

        $open = false;
        foreach( $tags as $k => $v ) {

            if( preg_match( "/".addcslashes($v['open'], '/')."/", $tag ) ) {
                // Открывающий тэг - пишем в стек
                // соответствующий закрывающий тэг
                $stack[] = $search[ $v['open'] ];
                $open = true;
                break;
            }

        }

        if( !$open ) {

            // Закрывающий тэг - извлекаем
            // и проверяем последний элемент стека
            if( array_pop( $stack ) != $tag ) {
                return $result_false_match;
            }

        }

    } // разбор результатов поиска тэгов

    // Если стек после разбора непуст -
    // налицо несоответствие тэгов
    if( count( $stack ) >  0  ) {
        return $result_false_match;
    }

    // Все условия выполнены, тэги соответствуют
    return $result_true;

} // function checkTags()

Это работает, но это некрасиво и лучше придумать что-то другое.


Код: plaintext
1.
WBR,
    A.P.
...
Рейтинг: 0 / 0
(PHP) Проверка открывающих и закрывающих тегов
    #33620862
Dipish
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Че-то не работает все равно! =(
А может в открывающих тегах записывать только само "имя" тега, а уже внутри функции при сборке регекспа "одевать" его в треугольные скобки?
Попробовал поменять строчку:
Код: plaintext
$re[] = addcslashes('<'.$v['open'].'[^>]*>'.'|'.$v['close'], '/'); 
где $v['open'] - просто, скажем, "table". Все равно пишет несоответствие на простейших примерах (типа "<table><td colspan=2> fhkhjk</td></table>") ;-( Почему?
А изменится ли что-нибудь принципиально, если осуществлять два preg_match_all на открывающие и закрывающие теги а потом сравнить длины массивов с результатами? Причем, например, регексп для открывающих будет выглядить типа такого:

Код: plaintext
'#</*(table|tr|td|body)[^>]*>#i'
...
Рейтинг: 0 / 0
(PHP) Проверка открывающих и закрывающих тегов
    #33621048
I_Work
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Внесу и свою лепту в эту тему, поскольку намечается что-то подобное в будущем (только все гораздо серьезнее).

1. Начну с того, что код "<i>превед <b>кросавчег</i></b>" не является вылидным с точки зрения HTML, несмотря на то, что некоторые броузеры и обрабатывают его так, как как большинству из нас кажется правильным! Не будем же мы уподобляться броузеру и идти против стандартов.

2. В любом случае придется использовать стек (может и не в любом, но по крайней мере наиболее удобно и эффективно). Однако здесь надо учесть некоторые особенности следования тегов. Так, например, теги <td></td> должны быть заключены в теги <tr></tr>, которые в свою очередь - в теги <table></table>.

3. Такие теги, как <b>, <i> и некоторые другие, в принципе, могут и не иметь закрывающих, в то время как теги типа <td>, <div>, <table> должны иметь соответствующий закрывающий.

Поэтому решение этой проблемы не является такой уж тривиальной задачей, как проверка на валидность расстановки скобок в выражении (типа "(({[{{{)}}){}{}}")
...
Рейтинг: 0 / 0
(PHP) Проверка открывающих и закрывающих тегов
    #33621092
I_Work
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
К слову.

Вопрос стоял такой:
Код: plaintext
Скажите, а как проверить в хтмл коде, равняется ли число открывающих тегов числу закрывающих?

Ответ: посчитать количества открывающих и закрывающих тегов и сравнить результаты.

Пример: "<p><b></table></html>" - количества открывающих и закрывающих тегов одинаковы!

Давайте будем чуть более точными. Может я и придираюсь, но все же часто возникают споры людей (в данном конкретном случае все, конечно, поняли, что имел в виду автор) из-за того, что каждый видит некоторые вещи в своем собственном свете.

С уважением, Евгений.
...
Рейтинг: 0 / 0
(PHP) Проверка открывающих и закрывающих тегов
    #33621936
ap99ap
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DipishЧе-то не работает все равно! =(
А может в открывающих тегах записывать только само "имя" тега, а уже внутри функции при сборке регекспа "одевать" его в треугольные скобки?
Попробовал поменять строчку:
Код: plaintext
$re[] = addcslashes('<'.$v['open'].'[^>]*>'.'|'.$v['close'], '/'); 
где $v['open'] - просто, скажем, "table". Все равно пишет несоответствие на простейших примерах (типа "<table><td colspan=2> fhkhjk</td></table>") ;-( Почему?


Потому что ты забыл правильно определить тэги.

Вот с таким параметром tags
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
$tags = array(
    'table' => array(
        'open'  => '<table[^>]*>'
      , 'close' => '</table>'
    )
  , 'td'    => array(
        'open'  => '<td[^>]*>'
      , 'close' => '</td>'
    )
);
функция checkTags выдаст правильный ответ - "тэги соответствуют".


Код: plaintext
1.
WBR,
    A.P.
...
Рейтинг: 0 / 0
(PHP) Проверка открывающих и закрывающих тегов
    #33621947
ap99ap
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
I_Work1. Начну с того, что код "<i>превед <b>кросавчег</i></b>" не является вылидным с точки зрения HTML, несмотря на то, что некоторые броузеры и обрабатывают его так, как как большинству из нас кажется правильным! Не будем же мы уподобляться броузеру и идти против стандартов.


Возможно. Мне что-то такое помнилось про html то ли 3.0, то ли более ранний.

I_Work2. В любом случае придется использовать стек (может и не в любом, но по крайней мере наиболее удобно и эффективно). Однако здесь надо учесть некоторые особенности следования тегов. Так, например, теги <td></td> должны быть заключены в теги <tr></tr>, которые в свою очередь - в теги <table></table>.


На самом деле, тут придется использовать конечный автомат. Стек - просто удобная реализация простейшего автомата.

I_Work
3. Такие теги, как <b>, <i> и некоторые другие, в принципе, могут и не иметь закрывающих, в то время как теги типа <td>, <div>, <table> должны иметь соответствующий закрывающий.


Соответственно, граф переходов автомата должен это отражать - только и всего ;)


Код: plaintext
1.
WBR,
    A.P.
...
Рейтинг: 0 / 0
Период между сообщениями больше года.
(PHP) Проверка открывающих и закрывающих тегов
    #37774544
kapa6a3er
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
вопрос решается просто до безобразия
регекспом удаляет элементы не имеющие закрывашек
а затем проверяем по алгоритму что все теги имеют закрывашку

на перле удаляющий регехсп будет выглядеть так (удалит все конструкции типа <name параметры> <name параметры/> <name> <name/> </name> где name один из тегов img hr br meta и такдалее)
на PHP переводите сами :)

$html=~s/<\/?(img|hr|br|meta).*?\/?>//sg;
...
Рейтинг: 0 / 0
(PHP) Проверка открывающих и закрывающих тегов
    #37775980
phpz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
kapa6a3er,

ага
...
Рейтинг: 0 / 0
8 сообщений из 33, страница 2 из 2
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / (PHP) Проверка открывающих и закрывающих тегов
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]