|
|
|
Как Excel работает c HTML?
|
|||
|---|---|---|---|
|
#18+
Собсна сабж Нужно втягивать 2к-10к строк с интернет-странички. Не xhtml. Приемлемый способ найден: находим нужную табличку через DOM HTML, форматируем, сохраняем во временный HTM файл, отрываем Excel, делаем к этому файлу запрос. Сохраняем во временный xml(или dbf) файл. Открываем этот файл через OLE DB и вуаля, таблица в базе. Получается примерно в 100 раз быстрее, чем напрямую парсить через объекты mshtml. Но что-то мне подсказывает, что это не самый простой вариант. Причём "умница" Excel любит заменить строку вида 1234E5 на 123400000, да так, что ничего уже и не сделать то толком. Вопрос в следующем - каким образом Excel так ловко парсит таблички HTML??? И как можно использовать это его замечательное свойство без него для :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.01.2008, 02:28 |
|
||
|
Как Excel работает c HTML?
|
|||
|---|---|---|---|
|
#18+
Шыфлкаким образом Excel так ловко парсит таблички HTMLЕму нет нужды формировать объектное представление в DOM. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.01.2008, 11:32 |
|
||
|
Как Excel работает c HTML?
|
|||
|---|---|---|---|
|
#18+
Antonariy Шыфлкаким образом Excel так ловко парсит таблички HTMLЕму нет нужды формировать объектное представление в DOM.Можно ли это умение как-то использовать без Excel? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.02.2008, 03:14 |
|
||
|
Как Excel работает c HTML?
|
|||
|---|---|---|---|
|
#18+
Дезассемблировать эксель? Выдрать из него код, парсящий html, и вставить в свою прогу? Пиши свой парсер, короче. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.02.2008, 10:51 |
|
||
|
Как Excel работает c HTML?
|
|||
|---|---|---|---|
|
#18+
AntonariyДезассемблировать эксель? Выдрать из него код, парсящий html, и вставить в свою прогу? Пиши свой парсер, короче. Я думал, что возможно уже есть готовые объекты :/ Тогда чем можно парсить, если не mshtml (7-10 строк в секунду), не простыми стрингами (очень не удобно), и не регулярными выражениями (не удобно в разработке). Нужен способ с производительностью не менее 500 строк в секунду... Иначе состарится можно :( пока разпарсит... Пока что более-менее устраивает Эксцель. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.02.2008, 17:09 |
|
||
|
Как Excel работает c HTML?
|
|||
|---|---|---|---|
|
#18+
ШыфлТогда чем можно парсить, если не mshtml (7-10 строк в секунду), не простыми стрингами (очень не удобно), и не регулярными выражениями (не удобно в разработке). Нужен способ с производительностью не менее 500 строк в секунду... Иначе состарится можно :( пока разпарсит...libxml2. Быстрее зверя в мире нет ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.02.2008, 17:15 |
|
||
|
|

start [/forum/topic.php?fid=60&fpage=202&tid=2162728]: |
0ms |
get settings: |
10ms |
get forum list: |
21ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
53ms |
get topic data: |
15ms |
get forum data: |
4ms |
get page messages: |
51ms |
get tp. blocked users: |
2ms |
| others: | 242ms |
| total: | 408ms |

| 0 / 0 |
