powered by simpleCommunicator - 2.0.59     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Разбор HTML и XML файлов.
15 сообщений из 15, страница 1 из 1
Разбор HTML и XML файлов.
    #32483627
maxapet
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Подскажите пожалуйста, каки в ASP.Net можно парсить файлы HTML и XML ? Какие средства есть для этого?
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32484029
Фотография tygra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
парсить файлы HTML ????

-- Tygra's --
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32484458
maxapet
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ну да, HTML ...
Вообще-то, мне нужно из Word 'овского файла получить XML . В одной книжице я прочитал, что это можно сделать через HTML : преобразовать его (файл) в HTML , подправить, чтобы получился well-formed HTML , а затем преобразовать в XML .
Но сейчас посмотрел, вроде как Word-2003 напрямую позволяет получать XML файлы... Надо ему только XSL подсунуть, чтобы он знал что и как трактовать.
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32486771
Фотография tygra
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Тут ничего не могу посоветовать, не мое это пока - парсенье XML :(

-- Tygra's --
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32487015
Фотография greenapple
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32858141
TJ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Зря вы бросили этот вопрос - вот передо мной появилась задача нахождения в HTML элемента - думал что смогу парсить HTML при помощи XML анализаторов - а не тут то было - они слишком серьозно всё валидизируют, так что либо помогите отключить валидизацию, либо предлагайте мысли как этот Html просматривать - может быть есть средства в System.Web???
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32858166
Стр
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
используй mshtml из:
Microsoft HTML Object Library
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32858167
TJ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А средствами Framework никак???
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32858168
Стр
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Если только все сделать руками
Увы
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32858204
TJ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Тут такой фанарь IHTMLElement почему то не имеет nextSibling, тоесть движение по одном уровню иерархии, он есть в IHTMLNode - но не могу я превратить IHTMLElement -> IHTMLNode хотя он по идеи должен от него наследоваться!!!

lblResult.InnerText += hdoc.getElementById("1").nextSibling.nodeName;
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32859058
marina milanina
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2TJ
авторЗря вы бросили этот вопрос - вот передо мной появилась задача нахождения в HTML элемента - думал что смогу парсить HTML при помощи XML анализаторов - а не тут то было - они слишком серьозно всё валидизируют, так что либо помогите отключить валидизацию, либо предлагайте мысли как этот Html просматривать - может быть есть средства в System.Web???

Если позволяют условия задачи - проведи парсинг в браузере на JavaScript. Это будет сильно проще, поскольку средствами DOM очень легко работать с хтмл

2maxapet
авторВообще-то, мне нужно из Word'овского файла получить XML.
Берется 2003 ворд. Жмется кнопка Save AS. Выбирается xml. Сохраняется.
В чем проблема то? Или надо не просто xml, а xml определенного формата сделать?
Если так, то берется полученный xml, делается xslt-шаблон для перевода в требуемый формат и любым парсером (не обязательно нет-овским) все перегоняется в нужный формат.

На ASP это можно сделать так:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
xmldata - текст, содержащий исходный xml
template - файл, содержащий xslt-шаблон
result - текст, содержащий результирующий xml

   set source = Server.CreateObject("MSXML2.DOMDocument")
   source.validateOnParse = false
   source.async = false	
   source.preserveWhiteSpace=true
   source.loadXML(xmldata)
	
   set style = Server.CreateObject("MSXML2.DOMDocument")
   style.validateOnParse = false
   style.preserveWhiteSpace=true
    
   style.async = false
   style.load(template)	
   result=source.transformNode(style)
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32861597
TJ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если JavaScript то ещё на сервер посылать потом, неудобно!!!
Теперь вот незнаю что сделать c getElementsByName
Оно возвращает HTMLElementCollection в котормо есть Item(object name, object index) что туда вставлять не представляю!!!

Неужели нет нормального средства в NET для парсинга страницы????
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32863815
Фотография Роман Дынник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Зря вы бросили этот вопрос - вот передо мной появилась задача нахождения в HTML элемента - думал что смогу парсить HTML при помощи XML анализаторов - а не тут то было - они слишком серьозно всё валидизируют

Так в чем проблема то? Пиши свой HTML в формате XHTML и парси как XML наздоровье любыми парсерами и анализаторами.
Posted via ActualForum NNTP Server 1.1
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32864694
TJ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я может и не против писать в XHTML - только парсить мне надо чужую страницу созданную до нашего 3 тысячелетия, руками изращенца!!!
...
Рейтинг: 0 / 0
Разбор HTML и XML файлов.
    #32864751
Артем1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
TJЯ может и не против писать в XHTML - только парсить мне надо чужую страницу созданную до нашего 3 тысячелетия, руками изращенца!!!

Порносайты что-ли?
...
Рейтинг: 0 / 0
15 сообщений из 15, страница 1 из 1
Форумы / ASP.NET [игнор отключен] [закрыт для гостей] / Разбор HTML и XML файлов.
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]