помогите оптимизировать sql-запрос / SQLite

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / SQLite [игнор отключен] [закрыт для гостей] / помогите оптимизировать sql-запрос

2 сообщений из 2, страница 1 из 1

помогите оптимизировать sql-запрос

#37482669

enic

Гость

Здравствуйте.

Есть такая задача:

- имеем список строк (10-30 символов) - и имеем таблицу в БД sqlite, такой структуры: int uid, string строка, int фейлы

алгоритм такой: - получили строки - внесли их в БД, uid по умолчанию null, фейлы - по умолчанию 0 - обрабатываем строки - те строки, с которыми произошла ошибка - обновляются в БД, инкрементируется счетчик фейлов - все удачно обработанные строки получают свой уникальный uid, чтобы потом их повторно не обрабатывать

таблица нужна затем, чтобы запоминать и отсеивать впоследствии те строки, у которых 5 фейлов и больше а также те, которые были обработаны ранее (имеют uid)

проблема у меня на том месте, где мы получили строки и пытаемся из них удалить те, что в базе имеют по 5 фейлов

я сделал это так:
авторselect data from rows where data in (перечисляем все строки через запятую) and fails >= 5 or uid is not null

т.е. достаем строки, которые в (перечисляем все имеющиеся в начале скрипта строки) и без ошибок, либо уже есть uid

соотв. потом из начального списка удаляем весь этот мусор а оставшиеся обрабатываем

1 список строк в запросе порой получается огромным 2 это неистово жрет память (python3, apache, sqlite3)

как по вашему будет правильнее удалить из начального списка все строки, имеющие фейлы и имеющие ИД, так чтобы не доставать всю таблицу (она может содержать миллионы строк)?

можно проверять каждую строку отдельным запросом, но не сожрет ли это все ресурсы?

...

Рейтинг:

0 / 0

14.10.2011, 15:20

| Ответить | Цитировать | Написать

помогите оптимизировать sql-запрос

#37485770

AlexIljin

Гость

enicкак по вашему будет правильнее удалить из начального списка все строки, имеющие фейлы и имеющие ИД, так чтобы не доставать всю таблицу (она может содержать миллионы строк)?Я бы поменял порядок предикатов в запросе, поставив простейшие на первый план. Не знаю, пытается ли SQLite оптимизировать запросы. Если он просто выполняет проверки слева направо, то до наиболее трудоёмкой части (data in (...)) должен доходить уже максимально отфильтрованный набор строк.

select data from rows where (uid is not null or fails >= 5) and data in (перечисляем все строки через запятую)

Проверять все строки отдельными запросами вряд ли будет лучше с точки зрения производительности.
Не знаю, на что у вас там сжирается память, БД тут вряд ли играет роль. Смотрите, что у вас в Питоне творится.

Вопрос: data == primary key? Наверное, имеет смысл сделать индекс.

...

Рейтинг:

0 / 0

17.10.2011, 20:55

| Ответить | Цитировать | Написать

2 сообщений из 2, страница 1 из 1

Форумы / SQLite [игнор отключен] [закрыт для гостей] / помогите оптимизировать sql-запрос

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=54&fpage=20&tid=2009110]:	0ms
get settings:	5ms
get forum list:	11ms
check forum access:	2ms
check topic access:	2ms
track hit:	57ms
get topic data:	9ms
get forum data:	2ms
get page messages:	35ms
get tp. blocked users:	2ms
others:	198ms

total:	323ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы