Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Visual Basic [игнор отключен] [закрыт для гостей] / регулярные выражения / 11 сообщений из 11, страница 1 из 1
10.06.2007, 22:11
    #34587528
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
ребята помогите

есть текст из html-файла
нужно выбрать все значения для атрибута href тэга <A>
ограничения содержание атрибута не может содержать "javascript:..." и не "http:..."
только локальные файлы
кроме этого значения для атрибута может быть заключён в "..." или '...' или вообще без них


и второе как такое же сделать для тега <img> атрибут src
ограничения содержание атрибута не может содержать "javascript:..." и не "http:..."
значения для атрибута может быть заключён в "..." или '...' или вообще без них
и файлы типа jpg(и\или другие типы)


как такое сделать через регулярные выражения?
...
Рейтинг: 0 / 0
11.06.2007, 12:16
    #34587963
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
а можно ли сделать по-другому ?
текст через какую-нибуть программу преобразовать в валидный xml

есть ли какое-нибудь средство это реализовать ?
...
Рейтинг: 0 / 0
11.06.2007, 14:47
    #34588225
VladConn
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
Работа с XML файлами проводится не с помощью регулярных выражений. Microsoft для этих целей разработал специальные классы. Например, XML DOM parser MSXML3.DLL. Им и пользуйтесь.

Примеры деклараций объектов:

Dim DOM As DOMDocument
Dim Nodes As IXMLDOMNodeList
Dim x As IXMLDOMNode

и т.д.

На форумах и на сайте Microsoft вы найдете достаточно информации об этих классах и как ими пользоваться.

Успехов
...
Рейтинг: 0 / 0
11.06.2007, 14:55
    #34588240
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
а если HTML не валидный мне никакой парсер XML не поможет
...
Рейтинг: 0 / 0
11.06.2007, 15:16
    #34588279
VladConn
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
michael Rа если HTML не валидный мне никакой парсер XML не поможет

HTML - это файл, который, в частности, читает Internet Explorer. Если он его не читает, значит это не HTML, даже если там есть теги и правильное расширение у файла.
...
Рейтинг: 0 / 0
11.06.2007, 15:34
    #34588311
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
я понял спасибо
это тоже мысль
загрузить текст в обьект IE и парсить
...
Рейтинг: 0 / 0
11.06.2007, 17:27
    #34588580
VladConn
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
michael Rя понял спасибо
это тоже мысль
загрузить текст в обьект IE и парсить

Нет, нет, я не это имел ввиду. Сломанный XML/HTML файл Internet Explorer ведь не воспримет? Я имел ввиду, что надо бы файл вначале починить, сделать пригодным для работы....
...
Рейтинг: 0 / 0
11.06.2007, 17:31
    #34588589
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
как починить ?
...
Рейтинг: 0 / 0
11.06.2007, 17:44
    #34588614
White Owl
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
VladConnНет, нет, я не это имел ввиду. Сломанный XML/HTML файл Internet Explorer ведь не воспримет? Я имел ввиду, что надо бы файл вначале починить, сделать пригодным для работы....Во первых, почему "не воспримет"? Воспримет запросто. Просто выкинет не понятые куски и все. А во вторых, каким образом ты собираешься чинить сломаный xml? Точно так же выкидывать не понятые куски или догадываться что сочинитель этого xml'я имел в виду?
...
Рейтинг: 0 / 0
11.06.2007, 18:36
    #34588710
VladConn
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
Да я не собираюсь его чинить... Тем более, если воспримет.
...
Рейтинг: 0 / 0
11.06.2007, 22:16
    #34588864
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
регулярные выражения
я сделал по-другому
тему можно закрыть
...
Рейтинг: 0 / 0
Форумы / Visual Basic [игнор отключен] [закрыт для гостей] / регулярные выражения / 11 сообщений из 11, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]