Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Подскажите пожалуйста, каки в ASP.Net можно парсить файлы HTML и XML ? Какие средства есть для этого? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.04.2004, 06:32 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
парсить файлы HTML ???? -- Tygra's -- ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.04.2004, 11:59 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Ну да, HTML ... Вообще-то, мне нужно из Word 'овского файла получить XML . В одной книжице я прочитал, что это можно сделать через HTML : преобразовать его (файл) в HTML , подправить, чтобы получился well-formed HTML , а затем преобразовать в XML . Но сейчас посмотрел, вроде как Word-2003 напрямую позволяет получать XML файлы... Надо ему только XSL подсунуть, чтобы он знал что и как трактовать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.04.2004, 15:01 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Тут ничего не могу посоветовать, не мое это пока - парсенье XML :( -- Tygra's -- ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.04.2004, 17:07 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Зря вы бросили этот вопрос - вот передо мной появилась задача нахождения в HTML элемента - думал что смогу парсить HTML при помощи XML анализаторов - а не тут то было - они слишком серьозно всё валидизируют, так что либо помогите отключить валидизацию, либо предлагайте мысли как этот Html просматривать - может быть есть средства в System.Web??? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.01.2005, 22:27 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
используй mshtml из: Microsoft HTML Object Library ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.01.2005, 23:29 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
А средствами Framework никак??? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.01.2005, 23:39 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Если только все сделать руками Увы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.01.2005, 23:41 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Тут такой фанарь IHTMLElement почему то не имеет nextSibling, тоесть движение по одном уровню иерархии, он есть в IHTMLNode - но не могу я превратить IHTMLElement -> IHTMLNode хотя он по идеи должен от него наследоваться!!! lblResult.InnerText += hdoc.getElementById("1").nextSibling.nodeName; ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.01.2005, 01:21 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
2TJ авторЗря вы бросили этот вопрос - вот передо мной появилась задача нахождения в HTML элемента - думал что смогу парсить HTML при помощи XML анализаторов - а не тут то было - они слишком серьозно всё валидизируют, так что либо помогите отключить валидизацию, либо предлагайте мысли как этот Html просматривать - может быть есть средства в System.Web??? Если позволяют условия задачи - проведи парсинг в браузере на JavaScript. Это будет сильно проще, поскольку средствами DOM очень легко работать с хтмл 2maxapet авторВообще-то, мне нужно из Word'овского файла получить XML. Берется 2003 ворд. Жмется кнопка Save AS. Выбирается xml. Сохраняется. В чем проблема то? Или надо не просто xml, а xml определенного формата сделать? Если так, то берется полученный xml, делается xslt-шаблон для перевода в требуемый формат и любым парсером (не обязательно нет-овским) все перегоняется в нужный формат. На ASP это можно сделать так: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.01.2005, 13:53 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Если JavaScript то ещё на сервер посылать потом, неудобно!!! Теперь вот незнаю что сделать c getElementsByName Оно возвращает HTMLElementCollection в котормо есть Item(object name, object index) что туда вставлять не представляю!!! Неужели нет нормального средства в NET для парсинга страницы???? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.01.2005, 16:21 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Зря вы бросили этот вопрос - вот передо мной появилась задача нахождения в HTML элемента - думал что смогу парсить HTML при помощи XML анализаторов - а не тут то было - они слишком серьозно всё валидизируют Так в чем проблема то? Пиши свой HTML в формате XHTML и парси как XML наздоровье любыми парсерами и анализаторами. Posted via ActualForum NNTP Server 1.1 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.01.2005, 17:37 |
|
||
|
Разбор HTML и XML файлов.
|
|||
|---|---|---|---|
|
#18+
Я может и не против писать в XHTML - только парсить мне надо чужую страницу созданную до нашего 3 тысячелетия, руками изращенца!!! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.01.2005, 11:48 |
|
||
|
|

start [/forum/topic.php?fid=18&msg=32858167&tid=1394723]: |
0ms |
get settings: |
6ms |
get forum list: |
17ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
42ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
51ms |
get tp. blocked users: |
2ms |
| others: | 241ms |
| total: | 377ms |

| 0 / 0 |
