Гость
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Как обрабатывать HTML-файлы ? / 3 сообщений из 3, страница 1 из 1
14.11.2019, 20:17
    #39889287
Vakho
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Как обрабатывать HTML-файлы ?
Visual Studio 2010 Ultimate.

Допустим, у меня есть XML-файл.
Я могу загрузить его в память как строку символов st .
Потом преобразую его в XmlDocument
Код: vbnet
1.
2.
DOC = New XmlDocument
DOC.LoadXml(st)


Потом программа может пронестись по нему, найти что надо...
Все счастливы.

Теперь у меня есть HTML-файл.
Я хочу написать программу, которая пронесется по нему, найдет что надо.
Я забрасывал его в метод LoadXml - см. выше.
В принципе, всё работало, но иногда метод давал сбой на какой-то комбинации
символов - не могу вспомнить, давно было. А теперь вот появилась необходимость.

Visual Studio предлагает методы по работе с HTML DOC, но через
System.Windows.Forms . Меня это не устраивает.

Возможно, я что-то пропустил.
Посоветуйте что-нибудь, пожалуйста.
Спасибо.
...
Рейтинг: 0 / 0
14.11.2019, 20:22
    #39889288
Shocker.Pro
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Как обрабатывать HTML-файлы ?
Местные гуру рекомендуют
1) Html Agility Pack
2) https://github.com/antlr/grammars-v4/tree/master/html
...
Рейтинг: 0 / 0
15.11.2019, 10:14
    #39889407
fkthat
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Как обрабатывать HTML-файлы ?
Vakho
В принципе, всё работало, но иногда метод давал сбой на какой-то комбинации
символов.

Да. Потому что валидный html это не обязательно валидный xml. Как сказали выше - хтмл агилитипак тебе поможет.
...
Рейтинг: 0 / 0
Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Как обрабатывать HTML-файлы ? / 3 сообщений из 3, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]