Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Импорт в БД / 7 сообщений из 7, страница 1 из 1
17.11.2016, 16:35
    #39349258
Badhabit
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Импорт в БД
День добрый. У меня есть необходимость импортировать большое кол-во данных (от 50ГБ до 1ТБ) из довольно "кривых" xml-файлов в СУБД mssql.
Использовать sqlxmlbulkload не получится, потому что данные в xml необходимо править перед импортом. Есть мысль сделать свой парсер xml (так как набор полей/тегов в xml постоянен и ограничен (20 возможных полей)) и преобразовывать xml в строки, а потом грузить в БД через bulkinsert.
Пробовал использовать Msxml2.DOMDocument - работает хорошо на небольших файлах, а на файлах от 2ГБ жутко тормозит, так что похоже надо писать свой парсер.
Подскажите какой язык лучше использовать для написания подобного парсера для больших файлов, желательно скриптовый...

ЗЫ. и еще вопрос можно ли на таком языке использовать "входной поток", чтобы можно было (если файлы заархивированы) сразу направлять поток из архиватора на вход скрипту/парсеру, дабы не создавать временных разархивированых файлов?
...
Рейтинг: 0 / 0
17.11.2016, 18:02
    #39349357
Dima T
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Импорт в БД
XmlReader в C# отлично справляется с большими файлами.
...
Рейтинг: 0 / 0
18.11.2016, 00:20
    #39349517
Badhabit
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Импорт в БД
Dima TXmlReader в C# отлично справляется с большими файлами.
А кроме как из C# его можно от куда-нибудь использовать?
...
Рейтинг: 0 / 0
18.11.2016, 00:27
    #39349519
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Импорт в БД
BadhabitА кроме как из C# его можно от куда-нибудь использовать?
в Java свой есть
...
Рейтинг: 0 / 0
18.11.2016, 00:33
    #39349520
Badhabit
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Импорт в БД
Изопропил, поточный xml парсер? А например как com объект из vb script можно?
...
Рейтинг: 0 / 0
18.11.2016, 06:53
    #39349558
Dima T
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Импорт в БД
BadhabitDima TXmlReader в C# отлично справляется с большими файлами.
А кроме как из C# его можно от куда-нибудь использовать?
из VB.NET, из любого ЯП семейства .NET
...
Рейтинг: 0 / 0
18.11.2016, 10:35
    #39349654
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Импорт в БД
BadhabitА например как com объект из vb script можно?
вроде из vbscript - никак ( реализацию IVBSAXContentHandler не изобразить)

хочется на скриптовом языке SAX парсер - python в руки
...
Рейтинг: 0 / 0
Форумы / Программирование [игнор отключен] [закрыт для гостей] / Импорт в БД / 7 сообщений из 7, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]