жпа, батч импорт данных в таблицу. / Java

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Java [игнор отключен] [закрыт для гостей] / жпа, батч импорт данных в таблицу.

25 сообщений из 26, страница 1 из 2

все

жпа, батч импорт данных в таблицу.

#39460174

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

Собссно проблема, надо достаточно большой объем через жпа-хибер заимпортить. сущность довольно простая - десяток полей и всё.

ну сделал по простому - каждый раз открывая закрывая сессию - вышло Х времени. долго. сделал так - открыл сессию - сохранил все записи, закрыл сессию - вышло X/2.5 времени. что тоже довольно долго. Почитал про батчи, сделал как написано - ускорилось незначительно. что еще можно сделать? многопоточку? не совсем вариант. начнутся проблемы при импорте связных данных. к тому же пробовал - не особо. одно условие - голый скл и ждбс пользовать нельзя.

...

Рейтинг:

0 / 0

26.05.2017, 09:58:02

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460183

Petro123

Участник

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)

Сообщения: 39 476

Рейтинг: 0 / 0

natanabrahamjr,
конкретнее - время\лог INSERT и размер слова "большой"
Возможно ты упёрся и теперь либо ближе к драйверу (JDBC)? либо тюнинг базы (выкл журналирования)

...

Рейтинг:

0 / 0

26.05.2017, 10:03:02

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460194

Blazkowicz

Участник

Сообщения: 25 080

Рейтинг: 0 / 0

У Хибера есть StatelessSession, но в JPA такой фичи, вроде, нет.

автор одно условие - голый скл и ждбс пользовать нельзя.

Ну, JDBC нафиг не нужен. SQL можно и из JPA запускать. А вот почему вы этого не хотите, вопрос открытый. Если это новые записи, то их в кеше всё равно ещё нет. Если вы хотите чтобы они после импорта сразу в кэш попали, то, поланаю, можно это сделать и насильно.

Попробуйте NativeQuery - даёт ли прирост к производительности?

...

Рейтинг:

0 / 0

26.05.2017, 10:08:40

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460218

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

а можно подробнее касательно стейтлесс сессии?

...

Рейтинг:

0 / 0

26.05.2017, 10:28:52

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460219

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

по ждбс и скл собссно это желание заказчика чтоб скл не было ни в каком виде нигде.

...

Рейтинг:

0 / 0

26.05.2017, 10:29:39

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460228

Usman

Участник

Откуда: من ألماتي

Сообщения: 5 723

Рейтинг: 0 / 0

natanabrahamjrПочитал про батчи, сделал как написано - ускорилось незначительнос этого места по подробнее, если можно (:

...

Рейтинг:

0 / 0

26.05.2017, 10:38:12

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460229

Blazkowicz

Участник

Сообщения: 25 080

Рейтинг: 0 / 0

natanabrahamjrа можно подробнее касательно стейтлесс сессии?
https://docs.jboss.org/hibernate/orm/5.2/userguide/html_single/chapters/batch/Batching.html

...

Рейтинг:

0 / 0

26.05.2017, 10:39:08

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460248

Petro123

Участник

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)

Сообщения: 39 476

Рейтинг: 0 / 0

natanabrahamjr,
вот ещё
https://stackoverflow.com/questions/14174271/using-statelesssession-for-batch-processing
и приводите конкретику.
Если всё сделали правильно, то вы технологию используете не по назначению (выстрел в ногу заказчика)

...

Рейтинг:

0 / 0

26.05.2017, 11:02:32

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460375

Garrick

Участник

Откуда: Москва

Сообщения: 2 870

Рейтинг: 0 / 0

natanabrahamjr,

При массовом обмене данными большого объёма с СУБД (загрузка/выгрузка) рекомендую использовать только JDBC. Быстрее чем JDBC в данном случае никакой Hibernate не настроите. Особенно когда время на загрузку/выгрузку ограничено. Иногда для удобства можно разбавить SpringJDBC или Apache DbUtils. Поверьте... я на этом собаку съел.

...

Рейтинг:

0 / 0

26.05.2017, 13:03:46

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460391

Blazkowicz

Участник

Сообщения: 25 080

Рейтинг: 0 / 0

GarrickПри массовом обмене данными большого объёма с СУБД (загрузка/выгрузка) рекомендую использовать только JDBC. Быстрее чем JDBC в данном случае никакой Hibernate не настроите. Особенно когда время на загрузку/выгрузку ограничено. Иногда для удобства можно разбавить SpringJDBC или Apache DbUtils. Поверьте... я на этом собаку съел.
Не лучше ли тогда воспользоваться инутраментами самой БД?

...

Рейтинг:

0 / 0

26.05.2017, 13:15:10

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460401

Garrick

Участник

Откуда: Москва

Сообщения: 2 870

Рейтинг: 0 / 0

Blazkowicz,

Лучше, но не всегда возможно. То прямого доступа к серверу нет, то форматы входных/выходных данных какие-то не удобоваримые для штатных тулзов и т.п., разные случаи бывают.

...

Рейтинг:

0 / 0

26.05.2017, 13:28:24

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460527

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

UsmannatanabrahamjrПочитал про батчи, сделал как написано - ускорилось незначительнос этого места по подробнее, если можно (:
https://vladmihalcea.com/2016/09/27/how-to-customize-the-jdbc-batch-size-for-each-persistence-context-with-hibernate/
один из вариантов. как здесь. другой вариант напрямую батч сайз задавать в апп.конфиге. ватевер короче, в стате вижу батчи, в логах вижу батчи, на производительности это сказывается в районе 10%. я то ожидал что раза в 2 будет быстрее.

Тулза была вообще написано забавно - для записи каждой строчки открывали закрывали сессию - эт опервое, что я убрал - производительность возросла в 2.5 раза. идем дальше - привинтил батчи - производительность возрасла в 2.7 раза. )) это я еще игрался с размерами батча и т.п.

В общем, боль.

...

Рейтинг:

0 / 0

26.05.2017, 15:39:25

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460530

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

Garricknatanabrahamjr,

При массовом обмене данными большого объёма с СУБД (загрузка/выгрузка) рекомендую использовать только JDBC. Быстрее чем JDBC в данном случае никакой Hibernate не настроите. Особенно когда время на загрузку/выгрузку ограничено. Иногда для удобства можно разбавить SpringJDBC или Apache DbUtils. Поверьте... я на этом собаку съел.
да я то понимаю.. хотя не очень понимаю. как например, это будет эффективнее, если и хибер и голый ждбс генерят одинаковое число запросов и к тому же одинаковые по виду и форме? Сейчас идет речь об импорте одной единственной табилцы (но большой)

...

Рейтинг:

0 / 0

26.05.2017, 15:42:00

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460532

Leonid Kudryavtsev

Участник

Сообщения: 9 300

Рейтинг: 0 / 0

Как минимум было бы хорошо сказать, какая СУБД

...

Рейтинг:

0 / 0

26.05.2017, 15:46:09

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460536

Petro123

Участник

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)

Сообщения: 39 476

Рейтинг: 0 / 0

natanabrahamjr,
ключи в базе FK могут тормозить.
natanabrahamjrда я то понимаю.. хотя не очень понимаю. как например, это будет эффективнее,
запустите вне Java цикл for и будет видно.

...

Рейтинг:

0 / 0

26.05.2017, 15:54:01

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460561

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

постгрес.

...

Рейтинг:

0 / 0

26.05.2017, 16:28:24

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460596

lleming

Участник

Сообщения: 1 905

Рейтинг: 0 / 0

а если так ?
https://stackoverflow.com/questions/6958965/how-to-copy-a-data-from-file-to-postgresql-using-jdbc

...

Рейтинг:

0 / 0

26.05.2017, 17:18:34

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460603

Petro123

Участник

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)

Сообщения: 39 476

Рейтинг: 0 / 0

natanabrahamjrСейчас идет речь об импорте одной единственной табилцы (но большой)
может "импорте в одну таблицу"?
Что у вас на входе и откуда вход?
Потом проверьте простой цикл вне Java.
Скорее всего без Java будет тоже медленно.
Отсюда проблема не в коде а в архитектуре.

...

Рейтинг:

0 / 0

26.05.2017, 17:30:16

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460618

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

какой еще архитектуре? задача тривиальная как топор. есть файл с данными его надо распарсить и положить в одну единственную таблицу.. я не понимаю просто что там тупо можно улучшить, кроме как используя стандартный (который я надеюсь есть) инструментарий для подобных задач. на сегодня у меня скорость импорта (на моей системе) - порядка 1200-1400 записей в секунду.

...

Рейтинг:

0 / 0

26.05.2017, 18:02:23

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460636

just_vladimir

Участник

Сообщения: 864

Рейтинг: 0 / 0

natanabrahamjrкакой еще архитектуре? задача тривиальная как топор. есть файл с данными его надо распарсить и положить в одну единственную таблицу.. я не понимаю просто что там тупо можно улучшить, кроме как используя стандартный (который я надеюсь есть) инструментарий для подобных задач. на сегодня у меня скорость импорта (на моей системе) - порядка 1200-1400 записей в секунду.
Об этом и речь, что задача тривиальная как топор, а Вы какой то х#$%^й маетесь, что дескать не жить не быть, нужно хибер. Достаете из своего хибера нативное соединение с БД и фигачите один единственный вызов COPY FROM STDIN, по итогу на выходе объем кода минимальный, производительность максимальная.

...

Рейтинг:

0 / 0

26.05.2017, 18:32:41

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460642

Blazkowicz

Участник

Сообщения: 25 080

Рейтинг: 0 / 0

natanabrahamjrкакой еще архитектуре? задача тривиальная как топор. есть файл с данными его надо распарсить и положить в одну единственную таблицу.. я не понимаю просто что там тупо можно улучшить, кроме как используя стандартный (который я надеюсь есть) инструментарий для подобных задач. на сегодня у меня скорость импорта (на моей системе) - порядка 1200-1400 записей в секунду.
Суть в том что в данной задаче ORM - лишнее звено. Берем гвоздь, подходим к стенке и забиваем микроскопом. Так и у вас. Берем файл, зачем-то парсим, зачем-то складываем в объекты, зачем-то с помощью ORM сохраняем в единственную таблицу. Даже если файл какого-то экстравагантного формата, то намного проще и эффективнее перегнать его в удобоваримый формат и средствами БД импортировать. Хотя бы в тот же CSV файл. И никакого SQL - заказчик доволен.

...

Рейтинг:

0 / 0

26.05.2017, 18:40:26

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460650

Petro123

Участник

Откуда: Загрузочный сектор Москвы (AutoPOI.ru)

Сообщения: 39 476

Рейтинг: 0 / 0

natanabrahamjrкакой еще архитектуре? задача тривиальная как топор. есть файл с данными его надо распарсить и положить в одну единственную таблицу.
я с вас фигею.
Вы бы сразу сказали что у вас на входе - ФАЙЛ.
Т.к. ОРМ и Хибер делают ИЗ СУБД Объекты-классы.

...

Рейтинг:

0 / 0

26.05.2017, 19:08:17

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460709

Usman

Участник

Откуда: من ألماتي

Сообщения: 5 723

Рейтинг: 0 / 0

natanabrahamjrна производительности это сказывается в районе 10%. я то ожидал что раза в 2 будет быстрее.Можно получить дополнительный прирост оптимизации, если периодически вызывать метод flush() .
(см. Chapter 4. Batch Processing )
^имхо

...

Рейтинг:

0 / 0

26.05.2017, 22:32:25

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460813

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

Petro123natanabrahamjrкакой еще архитектуре? задача тривиальная как топор. есть файл с данными его надо распарсить и положить в одну единственную таблицу.
я с вас фигею.
Вы бы сразу сказали что у вас на входе - ФАЙЛ.
Т.к. ОРМ и Хибер делают ИЗ СУБД Объекты-классы.
на входе файл, непонятного формата и либа к нему, которая выдирает из него данные. на выходе приложенька, с хибером. посередине постгрес. копаюсь дальше -- оказывается файлов много )) и они между собой взаимосвязаны.

...

Рейтинг:

0 / 0

27.05.2017, 12:37:19

| Ответить | Цитировать | Написать

жпа, батч импорт данных в таблицу.

#39460817

natanabrahamjr

Участник

Откуда: Ukraine

Сообщения: 184

Рейтинг: 0 / 0

Usmannatanabrahamjrна производительности это сказывается в районе 10%. я то ожидал что раза в 2 будет быстрее.Можно получить дополнительный прирост оптимизации, если периодически вызывать метод flush() .
(см. Chapter 4. Batch Processing )
^имхо
пробовал. пока самый быстрый прирост в скорости дает стейтлесс сейшн. внутри одной транзакции.

...

Рейтинг:

0 / 0

27.05.2017, 12:46:15

| Ответить | Цитировать | Написать

25 сообщений из 26, страница 1 из 2

все

Форумы / Java [игнор отключен] [закрыт для гостей] / жпа, батч импорт данных в таблицу.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=59&msg=39460618&tid=2122893]:	0ms
get settings:	10ms
get forum list:	21ms
check forum access:	4ms
check topic access:	4ms
track hit:	443ms
get topic data:	25ms
get forum data:	2ms
get page messages:	85ms
get tp. blocked users:	1ms
others:	227ms

total:	822ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы