powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Импорт в БД
7 сообщений из 7, страница 1 из 1
Импорт в БД
    #39349258
Badhabit
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
День добрый. У меня есть необходимость импортировать большое кол-во данных (от 50ГБ до 1ТБ) из довольно "кривых" xml-файлов в СУБД mssql.
Использовать sqlxmlbulkload не получится, потому что данные в xml необходимо править перед импортом. Есть мысль сделать свой парсер xml (так как набор полей/тегов в xml постоянен и ограничен (20 возможных полей)) и преобразовывать xml в строки, а потом грузить в БД через bulkinsert.
Пробовал использовать Msxml2.DOMDocument - работает хорошо на небольших файлах, а на файлах от 2ГБ жутко тормозит, так что похоже надо писать свой парсер.
Подскажите какой язык лучше использовать для написания подобного парсера для больших файлов, желательно скриптовый...

ЗЫ. и еще вопрос можно ли на таком языке использовать "входной поток", чтобы можно было (если файлы заархивированы) сразу направлять поток из архиватора на вход скрипту/парсеру, дабы не создавать временных разархивированых файлов?
...
Рейтинг: 0 / 0
Импорт в БД
    #39349357
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
XmlReader в C# отлично справляется с большими файлами.
...
Рейтинг: 0 / 0
Импорт в БД
    #39349517
Badhabit
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Dima TXmlReader в C# отлично справляется с большими файлами.
А кроме как из C# его можно от куда-нибудь использовать?
...
Рейтинг: 0 / 0
Импорт в БД
    #39349519
Фотография Изопропил
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
BadhabitА кроме как из C# его можно от куда-нибудь использовать?
в Java свой есть
...
Рейтинг: 0 / 0
Импорт в БД
    #39349520
Badhabit
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Изопропил, поточный xml парсер? А например как com объект из vb script можно?
...
Рейтинг: 0 / 0
Импорт в БД
    #39349558
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
BadhabitDima TXmlReader в C# отлично справляется с большими файлами.
А кроме как из C# его можно от куда-нибудь использовать?
из VB.NET, из любого ЯП семейства .NET
...
Рейтинг: 0 / 0
Импорт в БД
    #39349654
Фотография Изопропил
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
BadhabitА например как com объект из vb script можно?
вроде из vbscript - никак ( реализацию IVBSAXContentHandler не изобразить)

хочется на скриптовом языке SAX парсер - python в руки
...
Рейтинг: 0 / 0
7 сообщений из 7, страница 1 из 1
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Импорт в БД
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]