Вопрос по SSIS - как обрабатывать в пакете ситуацию, когда часть имени файла меняется? / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Вопрос по SSIS - как обрабатывать в пакете ситуацию, когда часть имени файла меняется?

1 сообщений из 26, страница 2 из 2

все

Вопрос по SSIS - как обрабатывать в пакете ситуацию, когда часть имени файла меняется?

#39705498

DaniilSeryi

Участник

Сообщения: 621

Рейтинг: 0 / 0

alexeyvgDaniilSeryiНовая проблема образовалась: число файлов, подлежащих загрузке, достигает нескольких десятков. При этом объём каждого файла - несколько гигабайт и несколько десятков миллионов строк. Как можно ускорить процесс загрузки?
Кажется, мне уже советовали грузить файл в несколько потоков. То есть, первый поток грузит первые 4 миллиона строк, второй - следующие 4 миллиона, и т.д.
Правильно ли я понимаю, что для каждого потока надо будет создавать новый диспетчер подключения. При этом вся разница между этими диспетчерами будет только в диапазонах строк для загрузки?
И что будет, если число строк в файле окажется меньше, чем диапазон строк для загрузке в потоке?Это сложно.
Проще загружать каждый файл в отдельном потоке.

Это несколько for_each Loop и Data_Flow в одном пакете?

Или как-то ещё?

И ещё один вопрос появился, не связанный с этой задачей. Есть файл с данными транзакций. Всё хорошо, всё замечательно, но... Как всегда но... В этот файл какие-то умники вставили строки с промежуточными итогами, и типы столбцов в строках транзакций и строках промежуточных итогов не совпадают. Как отсеять строки промежуточных итогов? А... Блин... Дошло... Сделать обработчик ошибок, чтобы строки транзакций спокойно грузились в таблицу, а при обнаружении строк промежуточных итогов они просто игнорировались или в лог запись падала.

И третий вопрос, гораздо более интересный - по поиску альтернативного решения изначальной задачи.
Есть набор текстовых файлов. В каждом файле лежат данные за одну календарную неделю, соответственно данные одного файла могут относиться как к одному, так и к двум соседним месяцам (пример - неделя с 27.08.2018 по 02.09.2018), и данные за один месяц размазаны по нескольким файлам. Как без загрузки данных на SQL Server разнести данные в новые файлы по месяцам? SQL Server доступен, но файлы лежат на другом сервере, и таскать их по сети не хочется. Заголовки данных в файлах присутствуют, даты сохранены в формате "22Jun2018".

...

Рейтинг:

0 / 0

20.09.2018, 11:04

| Ответить | Цитировать | Написать

1 сообщений из 26, страница 2 из 2

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&msg=39705498&tid=1689081]:	0ms
get settings:	10ms
get forum list:	16ms
check forum access:	4ms
check topic access:	4ms
track hit:	69ms
get topic data:	13ms
get forum data:	5ms
get page messages:	49ms
get tp. blocked users:	1ms
others:	257ms

total:	428ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы