powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / HTML, JavaScript, VBScript, CSS [игнор отключен] [закрыт для гостей] / html-файл 80 мег -> в базу MSSQL
13 сообщений из 13, страница 1 из 1
html-файл 80 мег -> в базу MSSQL
    #35081449
Ал75
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
как и чем вынуть данные из таблиц html-файла размером 80 мбайт, и при этом чтоб не зависло?
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35081967
Фотография Green2
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
напиши свою программу...
Что значит зависнет, сколько надо - отработает...
Какой именно sql server? Версия...

--

Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35082043
_Новичек
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ал75как и чем вынуть данные из таблиц html-файла размером 80 мбайт, и при этом чтоб не зависло?
DTS пакет тебе в помощь!
при помощи него все это можно сделать
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35082063
Ал75
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
_Новичек
DTS пакет тебе в помощь!
при помощи него все это можно сделать
пробовал - таки зависает..
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35082209
Фотография Antonariy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Такие проблемы нужно решать концептуально...
Это одноразовая операция, или периодическая? Если периодическая, откуда этот файл берется?
Покажите часть содержимого.
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35082255
Ал75
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
ежемесячный отчет от сотового провайдера, операция будет периодическая
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35082356
Фотография Antonariy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Провайдер может присылать отчеты в более другом виде?
Покажите таки часть содержимого. Может это XHTML и его можно будет перегнать через XML.
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35082800
IDVsbruck
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сделать на каком-нибудь языке простейший парсер, который перегонит в xml или cvs, а дальше будет проще.

P.S. Я могу представить, сколько эта "страничка" открывается ...
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35083611
Ал75
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
IDVsbruckСделать на каком-нибудь языке простейший парсер, который перегонит в xml или cvs, а дальше будет проще.

видимо ничего другого не остается. Пробовал консольную тулзу tidy.exe , которая переводит html в xml, но она тоже тормозная, за полчаса результата не дождался. Может есть какие другие консольные утилиты для этого?
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35084451
Ghirik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А порезать этот файл ни как? Парсить 80Мб - понятно уйдет в небытие, хоть где...
Теоритически, удобнее сразу, загрузчиком резать при получении файла....
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35085486
IDVsbruck
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У меня как-то проект был: по фтп получаю xml, парсю его и загоняю в БД. Параллельно создаю полный лог всего процесса. В принципе, ежедневные файлы небольшие - от 200кБ до 2МБ, но первый был 65-70 МБ. У меня достаточно серьезная машина: C2Duo E6900, оверклокеровская разогнаная память, разогнанная материнка (геймеровская) - то есть, одним словом, достаточно мощный аппарат, Eclipse грузится от 0.4 до 0.9 секунд - кто знает, поймет. Так вот, этот файл у меня парсился 30-40 минут SAX-ом, достаточно быстрым парсером (по крайней мере, не ручные процессинги). Так что советую продолжить дерзание: временные задержки - это нормально.
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35085642
ShSerge
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Интересно за какое время пропарсит файл lynx -dump -nolist URL >вых.файл
Он уже и так табличку вернёт с разделителями.
...
Рейтинг: 0 / 0
html-файл 80 мег -> в базу MSSQL
    #35086651
Ал75
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
ShSergeИнтересно за какое время пропарсит файл lynx -dump -nolist URL >вых.файл
Он уже и так табличку вернёт с разделителями.
вот!
спасибо, отличная подсказка! lynx пропарсил за 20мин, из 80 мег получился файл 10 мег со вполне читабельными данными. и ничего не подвисало при этом.
...
Рейтинг: 0 / 0
13 сообщений из 13, страница 1 из 1
Форумы / HTML, JavaScript, VBScript, CSS [игнор отключен] [закрыт для гостей] / html-файл 80 мег -> в базу MSSQL
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]