Стоит ли GUID заменить на два INTEGER ? / SQLite

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / SQLite [игнор отключен] [закрыт для гостей] / Стоит ли GUID заменить на два INTEGER ?

10 сообщений из 10, страница 1 из 1

Стоит ли GUID заменить на два INTEGER ?

#37673195

metos

Гость

Проектирую некое хранилище данных (для большого количества записей).
Есть некие объекты, которых может быть очень много (до 5 миллионов). В этой БД будет содержаться информация для каждого из объектов. Каждый объект идентифицируется по его уникальному глобальному GUID (16 байтов), т.к. таких БД может быть несколько и возможен импорт данных из одной в другую.

Так вот изначально проектировали под СУБД (MySQL/MSSQL) и соответсвенно планировани хранить в таблице объектов глобальный GUID и внутренний ID (INT 32 / INT 64). Но сейчаз решили что функций SQLite вполне достаточно.
Тип GUID будет представлен как BLOB в 16 байт.
И вот у меня появилось 3 возможных решения:
1) оставить в таблице объектов глобальный GUID и внутренний ID (индексы только для ID);
2) использовать в БД только GUID (индексы только по нему);
3) использовать в БД только GUID, но представленнный в виде двух полей типа INTEGER (индекс по обоим полям).

Какой вариант оптимальнее для SQLite?

И ещё 3 тупых вопроса:
Правильно ли я понимаю, что значения полей типа INTEGER в DB-файле будет преставлено в виде ANSI-строк?
Правильно ли я понимаю, что значения полей типа BLOB в DB-файле будет преставлено в виде UTF-8 строки?
Имеет ли какое то значение тип поля при создании для него индекса?

...

Рейтинг:

0 / 0

21.02.2012, 18:48

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37673306

RXL

Участник

Сообщения: 1 601

Рейтинг: 0 / 0

metosПроектирую некое хранилище данных (для большого количества записей).
Есть некие объекты, которых может быть очень много (до 5 миллионов). В этой БД будет содержаться информация для каждого из объектов. Каждый объект идентифицируется по его уникальному глобальному GUID (16 байтов), т.к. таких БД может быть несколько и возможен импорт данных из одной в другую.

Так вот изначально проектировали под СУБД (MySQL/MSSQL) и соответсвенно планировани хранить в таблице объектов глобальный GUID и внутренний ID (INT 32 / INT 64). Но сейчаз решили что функций SQLite вполне достаточно.
Тип GUID будет представлен как BLOB в 16 байт.
И вот у меня появилось 3 возможных решения:
1) оставить в таблице объектов глобальный GUID и внутренний ID (индексы только для ID);
2) использовать в БД только GUID (индексы только по нему);
3) использовать в БД только GUID, но представленнный в виде двух полей типа INTEGER (индекс по обоим полям).

Какой вариант оптимальнее для SQLite?

Исходите из отношения таблиц.
GUID нужен только для внешней связки при импорте/экспорте и не используется приложением? Тогда лучше вообще храните его в отдельной таблице, а для связки используйте INTEGER PRIMARY KEY - это в SQLite самый оптимальный индекс ( http://sqlite.org/lang_createtable.html#rowid). Только учтите, что PK в SQLite не подразумевает NOT NULL - последний нужно определять явно.

metosИ ещё 3 тупых вопроса:
Правильно ли я понимаю, что значения полей типа INTEGER в DB-файле будет преставлено в виде ANSI-строк?
Правильно ли я понимаю, что значения полей типа BLOB в DB-файле будет преставлено в виде UTF-8 строки?
Имеет ли какое то значение тип поля при создании для него индекса?

1. Нет. В SQLite столбцы не типизированные, неявного приведения типов нет: что занесете, то и будет хранить. Хранимые типы описаны в мануале: http://sqlite.org/datatype3.html
2. Нет. См. ссылку выше.
3. Имеет. Индекс как раз типизирован (иначе и быть не могло). Чем короче индекс, тем быстрее поиск.

...

Рейтинг:

0 / 0

21.02.2012, 19:58

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37673493

metos

Гость

RXLИсходите из отношения таблиц.
GUID нужен только для внешней связки при импорте/экспорте и не используется приложением? Тогда лучше вообще храните его в отдельной таблице, а для связки используйте INTEGER PRIMARY KEY - это в SQLite самый оптимальный индекс ( http://sqlite.org/lang_createtable.html#rowid). Только учтите, что PK в SQLite не подразумевает NOT NULL - последний нужно определять явно.

GUID также используется при работе приложения.
Поле ID (32/64 бита) появилось лишь из-за того, что это оптимальный способ для построения индекса. Из-за этого поля появилась доп. таблица, которая связывает ID и GUID.
Но ведь можно обойтись и без этой таблицы и поля ID, просто работая сразу с GUID. Но GUID представлен как BLOB(16), для которого индекс вообще не оптимален. Вот я и предложил представить в БД GUID как два поля GUID_LOW и GUID_HIGH (типа INTEGER).
Впринципе, в таком варианте индекс будет достаточно "повесить" на только на поле GUID_LOW, что будет эффективно при выборке, да и размер индексов уменьшит.
Также придётся добавить один UNIQUE индекс, содержащий оба поля GUID_LOW и GUID_HIGH - для контроля уникальности. Либо самому контролировать уникальность. Что лучше пока не знаю.

Идея с двумя полями стоящая?

...

Рейтинг:

0 / 0

21.02.2012, 22:21

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37673515

metos

Гость

Про UNIQUE индекс написал фигню.
Как раз таки в случае полей GUID_LOW и GUID_HIGH отпадает необходимость в контроле уникальности GUID, т.к. нету связывающей таблицы со списков всех GUID.

...

Рейтинг:

0 / 0

21.02.2012, 22:34

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37673636

RXL

Участник

Сообщения: 1 601

Рейтинг: 0 / 0

metos,

Если в запросе одна таблица, то адресовать напрямую по GUID будет оптимальнее, чем искать GUID по одной таблице, а потом по другой искать по INTEGER.

Если в запросе несколько таблиц и вы их будете связывать по GUID, то однозначно INTEGER лучше. Да и работать с целыми удобнее, чем с BLOB.

...

Рейтинг:

0 / 0

22.02.2012, 00:56

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37678208

MBG

Гость

Индекс по GUID будет очень сильно замедлять вставку данных. Стоит проверить на своих объемах. Мои тесты см. здесь:

http://geomapx.blogspot.com/search?q=index+degradation

Там внизу есть данные по сравнению скорости вставки для randomblob(8), randomblob(16) и проч. Скорость выборки при этом не страдает, потому для селектов тесты и не нужны, кроме особых случаев.

...

Рейтинг:

0 / 0

26.02.2012, 02:30

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37684492

metos

Гость

MBGИндекс по GUID будет очень сильно замедлять вставку данных. Стоит проверить на своих объемах. Мои тесты см. здесь:

http://geomapx.blogspot.com/search?q=index+degradation

Там внизу есть данные по сравнению скорости вставки для randomblob(8), randomblob(16) и проч. Скорость выборки при этом не страдает, потому для селектов тесты и не нужны, кроме особых случаев.
Ясно что индекс по BINARY менее эффективен.
Если сделать UNIQUE индекс, объединяющий два поля типа INTEGER, как это отразится на скорости?

Как вашу функцию intrange2table представить на Tcl ?
Как под виндою, используя MSYS + TclTk, выполнять тесты? (хочется сопоставить скорость sqlite и sqlcipher)

...

Рейтинг:

0 / 0

29.02.2012, 15:05

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37684534

metos

Гость

MBGСкорость выборки при этом не страдает ....... кроме особых случаев.
А почему скорость выборки не страдает? В качестве индекса используется 64-битный хэш от BINARY ?
Что за особые случаи? (хоть 1 пример)

...

Рейтинг:

0 / 0

29.02.2012, 15:17

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37685167

MBG

Гость

metosMBGСкорость выборки при этом не страдает ....... кроме особых случаев.
А почему скорость выборки не страдает? В качестве индекса используется 64-битный хэш от BINARY ?
Что за особые случаи? (хоть 1 пример)

Пример простой - индекс по гигабайтному блобу очевидно намного медленнее, чем по числу типа integer. В случае же разумной длины ключей скорость выборки заметно не изменяется, а вот вставка замедляется заметно, т.к. сжатия индексов в эскулайте нет.

...

Рейтинг:

0 / 0

29.02.2012, 22:01

| Ответить | Цитировать | Написать

Стоит ли GUID заменить на два INTEGER ?

#37685172

MBG

Гость

metosЕсли сделать UNIQUE индекс, объединяющий два поля типа INTEGER, как это отразится на скорости?

Скорости чего? На селектах - скорее, всего, никак, разницы не заметить. На вставках - точно медленнее будет, притом в два раза быстрее в кэш упретесь и после того совсем хреново станет, а вообще зависит от распределения данных (предварительно отсортированные значения типа PK вставляются лучше всего - не требуется сильно модифицировать индексное дерево на вставках).

metosКак вашу функцию intrange2table представить на Tcl ?

Простым циклом заполнить временную табличку нужными значениями. Или вот такой модуль взамен использовать:

http://mobigroup.ru/debian/pool-squeeze/main/s/sqlite3-ext-wholenumber/

Под винду я его не тестировал, но должен работать без проблем.

metosКак под виндою, используя MSYS + TclTk, выполнять тесты? (хочется сопоставить скорость sqlite и sqlcipher)

Странный вопрос: tclsh8.5 filename.tcl

...

Рейтинг:

0 / 0

29.02.2012, 22:08

| Ответить | Цитировать | Написать

10 сообщений из 10, страница 1 из 1

Форумы / SQLite [игнор отключен] [закрыт для гостей] / Стоит ли GUID заменить на два INTEGER ?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=54&msg=37684534&tid=2009059]:	0ms
get settings:	9ms
get forum list:	18ms
check forum access:	3ms
check topic access:	3ms
track hit:	146ms
get topic data:	12ms
get forum data:	3ms
get page messages:	53ms
get tp. blocked users:	1ms
others:	217ms

total:	465ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы