Опять про varchar(n) / Firebird, InterBase

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Опять про varchar(n)

25 сообщений из 173, страница 2 из 7

все

Опять про varchar(n)

#38718566

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

S.G.что за числа такие, по 100 цифр?Факторизацией, наверное, занимаются :-)
Только вопрос: причём тут СУБД.

...

Рейтинг:

0 / 0

12.08.2014, 16:53

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718610

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

roadsterрасстояние до Марса в миллиметрах.
На него хватит 18-ти.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

12.08.2014, 17:20

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718631

WildSery

Участник

Откуда: да, оттуда.

Сообщения: 19 151

Рейтинг: 0 / 0

Dimitry Sibiryakov,

Да и 15 хватит с запасом

...

Рейтинг:

0 / 0

12.08.2014, 17:42

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718662

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

NickDeeВот тут есть кой-какие бенчмарки
поскольку там разницы практически нет, мне это напомнило заявление сотрудника российского Оракла на Корпоративных Базах Данных лет 10 назад:
- теперь заливка данных происходит в 10 раз быстрее!

на что я из зала прокомментировал - "значит, до этого момента с заливкой данных было все совсем хреново". Народ поржал.

Из теста по ссылке я делаю примерно аналогичный вывод - раз практически нет разницы между char, varchar и text, при разной фактической длине, то значит, реализация одинаково гове..ая. Ну или тест такой.
Имеет смысл сравнить тот же тест с ФБ.

...

Рейтинг:

0 / 0

12.08.2014, 18:09

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718668

NickDee

Участник

Сообщения: 1 395

Рейтинг: 0 / 0

Залил 10 записей в табличку с полем типа text(varchar без N). По 100 миллионов символов на запись.
При create index была выдана ошибка:
SQL Error: ОШИБКА: строка индекса требует байт: 1144712, при максимуме: 8191
Почему он поломался - я не знаю. Ведь можно было построить индекс по первым N символам (пусть даже по 8191, но я бы лучше задавал это N в create index), а остальные символы добывать из записи при непосредственном сравнении. Никто не хочет делать по-взрослому :) Или просто не придумали ещё... :)

...

Рейтинг:

0 / 0

12.08.2014, 18:16

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718670

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

NickDee при максимуме: 8191
а я предупреждал. значит, "безразмерная строка" до сих пор не может превышать размер страницы.

...

Рейтинг:

0 / 0

12.08.2014, 18:18

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718671

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

по крайней мере для индекса.

...

Рейтинг:

0 / 0

12.08.2014, 18:18

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718673

dimitr

Участник

Откуда: PNZ

Сообщения: 7 059

Рейтинг: 0 / 0

kdvNickDee при максимуме: 8191
а я предупреждал. значит, "безразмерная строка" до сих пор не может превышать размер страницы.
это в индексе. У нас тоже самое.

...

Рейтинг:

0 / 0

12.08.2014, 18:19

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718674

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

dimitr,

да, облом. причем, у нас ограничение на размер ключа в 1/4 страницы.

...

Рейтинг:

0 / 0

12.08.2014, 18:20

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718675

NickDee

Участник

Сообщения: 1 395

Рейтинг: 0 / 0

kdvNickDee при максимуме: 8191
а я предупреждал. значит, "безразмерная строка" до сих пор не может превышать размер страницы.
Я ж туда 100М текста залил в поле.
А если бы заливал туда строки по 100 символов длиной, то и данные бы хранились по-другому и индекс бы создался.

...

Рейтинг:

0 / 0

12.08.2014, 18:21

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718683

Симонов Денис

Участник

Откуда: Рязань

Сообщения: 11 624

Рейтинг: 0 / 0

NickDee,

гораздо интереснее что будет если ты сначала создашь индекс, а потом попробуешь залить 100М текста

...

Рейтинг:

0 / 0

12.08.2014, 18:34

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718700

NickDee

Участник

Сообщения: 1 395

Рейтинг: 0 / 0

Симонов ДенисNickDee,

гораздо интереснее что будет если ты сначала создашь индекс, а потом попробуешь залить 100М текста
Фигня получится. Больше 8К не зальёшь.
Я ж говорю, что нужно использовать в ключе индекса только первые N символов, и нет проблем.

А что будет в FB? В FB индекс для varchar(2048) создаётся, а для varchar(4096) уже нет. При пустой таблице.
Если бы даже сейчас сделать в FB возможность создания индексов для полей varchar(32000) и чтобы не получался гигантский расход памяти и просадка по производительности, то будет всем профит. Можно будет спокойно для полей с неизвестным количеством символов ставить 32000.
Т.е. я предлагаю чтобы N в varchar(N) не влияла на производительность и расход памяти, и не влияла на возможность создания индекса. А чтобы стала лишь ограничителем длины.
А то сейчас получается что пользователь указывая N ещё и настраивает производительность, и управляет расходом памяти, причём по неизвестным ему формулам :)

...

Рейтинг:

0 / 0

12.08.2014, 18:55

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718712

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

NickDeeЕсли бы даже сейчас сделать в FB возможность создания индексов для полей
varchar(32000) и чтобы не получался гигантский расход памяти и просадка по
производительности, то будет всем профит.
"И почему люди не летают как птицы?.." (с) Островский.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

12.08.2014, 19:09

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718715

Симонов Денис

Участник

Откуда: Рязань

Сообщения: 11 624

Рейтинг: 0 / 0

NickDeeЯ ж говорю, что нужно использовать в ключе индекса только первые N символов, и нет проблем.

и выдаст твой индекс фигню. Особенно здорово будет попытаться сделать такой индекс уникальным.

NickDeeА что будет в FB? В FB индекс для varchar(2048) создаётся, а для varchar(4096) уже нет. При пустой таблице.

по крайней мере FB не врёт что для некого безразмерного типа вы получаете только преимущества. В доке честно сказано про максимальный размер ключа индекса.

З.Ы. А то глядишь на поверку окажется, что эффективность супер типа text не такая уж хорошая.

...

Рейтинг:

0 / 0

12.08.2014, 19:11

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718744

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

Симонов Денис,

в ДИАМС (mumps) "индексировалось" только первые 63 символа. И это было хорошо. С другой стороны, при помещении документов в большой varchar всегда можно выделить какие-то реквизиты документа, которые представляют интерес для поиска, и которые всегда меньше 63 символов.
Я считаю, что индексирование строковых столбцов длиной более 50 символов вообще не имеет смысла. Даже если индексировать 63 символа, глубина такого индекса превышает 3 уже на ощутимых объемах записей, и в результате профит от такого индекса получается только при поиске на равенство. Чего при 63 символах практически не бывает.

...

Рейтинг:

0 / 0

12.08.2014, 19:43

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718749

Мимопроходящий

Участник

Откуда: бурятский тундрюк, эсквайр

Сообщения: 33 443

Рейтинг: 0 / 0

Hello, Kdv!
You wrote on 12 августа 2014 г. 19:45:29:

Kdv> Я считаю, что индексирование строковых столбцов длиной более 50 символов
> вообще не имеет смысла. Даже если индексировать 63 символа, глубина
> такого индекса превышает 3 уже на ощутимых объемах записей, и в
> результате профит от такого индекса получается только при поиске на
> равенство. Чего при 63 символах практически не бывает.
иногда бывает нужно, при построении UNIQUE CONSTRAINT
для "нечеловеческих" данных.

Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

12.08.2014, 19:48

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718751

NickDee

Участник

Сообщения: 1 395

Рейтинг: 0 / 0

Симонов ДенисNickDeeЯ ж говорю, что нужно использовать в ключе индекса только первые N символов, и нет проблем.

и выдаст твой индекс фигню. Особенно здорово будет попытаться сделать такой индекс уникальным.

Индекс выдаст всё нормально, просто если он будет не по полной строке, то для таких длинных занчений придётся лезть в данные за окончательным вердиктом (> или < или =).
Уникальность - это про "=".
Симонов ДенисNickDeeА что будет в FB? В FB индекс для varchar(2048) создаётся, а для varchar(4096) уже нет. При пустой таблице.

по крайней мере FB не врёт что для некого безразмерного типа вы получаете только преимущества.Вопрос не в том, врёт или нет. Вопрос в том, что даже если в varchar(32000) лежит 10 символов, то ресурсы от компа часто требуются как на 32000 символа. Т.е. varchar(32000) в большинстве случаев кушает ресурсы примерно так же, как char(32000), независимо от длины строки в данных, т.е. кушает почти всегда по максимуму (на 32000).

...

Рейтинг:

0 / 0

12.08.2014, 19:51

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718755

Basil A. Sidorov

Участник

Сообщения: 11 633

Рейтинг: 0 / 0

NickDeeВопрос в том, что даже если в varchar(32000) лежит 10 символов, то ресурсы от компа часто требуются как на 32000 символа.Это вы прямо сейчас придумали?

...

Рейтинг:

0 / 0

12.08.2014, 19:57

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718756

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

NickDee Т.е. varchar(32000) в большинстве случаев кушает ресурсы примерно так же, как char(32000), независимо от длины строки в данных
в смысле?

...

Рейтинг:

0 / 0

12.08.2014, 19:58

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718759

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

kdvв смысле?при сортировках паддинг данных будет до декларированной длины поля, а не до "самой длинной непустой строки".

...

Рейтинг:

0 / 0

12.08.2014, 20:04

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718761

Basil A. Sidorov

Участник

Сообщения: 11 633

Рейтинг: 0 / 0

Таблоидпри сортировках паддинг данных будет до декларированной длины поля, а не до "самой длинной непустой строки".Это вопрос реализации , которая является внутренним делом SQL-сервера.

...

Рейтинг:

0 / 0

12.08.2014, 20:06

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718782

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

Таблоидпри сортировках паддинг данных будет до декларированной длины поля
я в курсе, вопрос в том, как это обходит постгрес. Вначале вычисляет макс строку, а только потом сортирует?

...

Рейтинг:

0 / 0

12.08.2014, 20:52

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718791

NickDee

Участник

Сообщения: 1 395

Рейтинг: 0 / 0

kdvNickDee Т.е. varchar(32000) в большинстве случаев кушает ресурсы примерно так же, как char(32000), независимо от длины строки в данных
в смысле?
Размеры буферов, их обнуление и заполнение данными.

БД с page_size 16k.
Есть табличка:

Код: sql

create table T1 (Id Integer, S varchar(N))

, без индексов.
В ней миллион записей. В каждой записи поле S = 'A';
Какой размер БД?
при N = 1 он равен 58mb.
при N = 32000 он равен 583mb.
Т.е. одни и те же данные хранятся в БД с разной степенью эффективности. Разница в 10 раз. Т.е. на такую БД нужно в 10 раз больше оперативки чтобы свопа не было. При одних и тех же данных.

Код: sql

select * from T1 order by S

execute and fetch all:
Для N = 1:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.

Время подготовки запроса = 15ms
Время выполнения запроса = 5s 86ms
Среднее время на получение одной записи = 0,01 ms
Current memory = 9 042 996
Max memory = 59 338 876
Memory buffers = 2 048
Reads from disk to cache = 13 344
Writes from cache to disk = 0
Fetches from cache = 2 026 685

Для N = 32000:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.

Unsuccessful execution caused by system error that does not preclude successful execution of subsequent statements.
sort error.
No free space found in temporary directories.
operating system directive WriteFile failed.
Недостаточно места на диске. .

------ Информация о производительности ------
Время подготовки запроса = 31ms
Время выполнения запроса = 36s 910ms
Current memory = 34 362 880
Max memory = 102 555 736
Memory buffers = 2 048
Reads from disk to cache = 3 601
Writes from cache to disk = 0
Fetches from cache = 216 103

6 гигабайт не хватило на сортировку при N=32000. Хорошо что винт SSD, а то бы это получилось не 36 секунд, а минут 5.
При N=2048 на сортировку ушло 4 GB временных файлов, но фетч не прошёл, т.к. IBExpert-у не хватило памяти (он тоже зачем-то отжирает по максимуму памяти, на все N символов, не знаю уж зачем)

Короче вот :)

...

Рейтинг:

0 / 0

12.08.2014, 21:17

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718798

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

NickDeeselect * from T1 order by S
я на курсах это объясняю, популярно. Вообще серебряной пули нет (как и полного счастья в жизни).

...

Рейтинг:

0 / 0

12.08.2014, 21:28

| Ответить | Цитировать | Написать

Опять про varchar(n)

#38718800

NickDee

Участник

Сообщения: 1 395

Рейтинг: 0 / 0

kdvТаблоидпри сортировках паддинг данных будет до декларированной длины поля
я в курсе, вопрос в том, как это обходит постгрес. Вначале вычисляет макс строку, а только потом сортирует?
А зачем вычислять макс строку? И зачем нужен паддинг? Я просто представляю себе - мне нужно взять из файла строки и посортировать... зачем мне делать их паддинг? Или при записи отсортированных строк в другой текстовый файл...
Я максимум готов записать длину строки и её бинарное представление. Паддить её перед записью не готов. То же и с чтением: читать, а потом избавляться от паддинга, который был сделан предыдущим записывающим... уж лучше договориться с записывающим чтобы не паддил :)

...

Рейтинг:

0 / 0

12.08.2014, 21:30

| Ответить | Цитировать | Написать

25 сообщений из 173, страница 2 из 7

все

Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Опять про varchar(n)

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=40&msg=38718668&tid=1563372]:	0ms
get settings:	9ms
get forum list:	11ms
check forum access:	2ms
check topic access:	2ms
track hit:	171ms
get topic data:	10ms
get forum data:	2ms
get page messages:	65ms
get tp. blocked users:	1ms
others:	233ms

total:	506ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы