powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / UTF 8 vs. однобайтовые кодировки
2 сообщений из 2, страница 1 из 1
UTF 8 vs. однобайтовые кодировки
    #32750771
ilejn
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть ли какие-нибудь специфические проблемы в кодировке UTF-8
(например length('ВАСЯ') равен четырем или чему-нибудь еще)?
Заметна ли разница в производительности и/или размере базы?
...
Рейтинг: 0 / 0
UTF 8 vs. однобайтовые кодировки
    #32752016
фффф
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
char_length() должен возвращать длину в символах. Не знаю как для всяких иероглифов, которые могут занимать до 6 байт в UTF-8, а для кириллицы и западноевропейских алфавитов все нормально.
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
unic=>\encoding alt
unic=>select a, char_length(a), octet_length(a)
unic->from (select convert('ВАСЯ' using windows_866_to_utf_8) as a) as b;
  a   | char_length | octet_length
 ------+-------------+-------------- 
 ╨Т╨Р╨б╨п |            4  |             8 
( 1  row)
Размер базы растет пропорционально наличию нелатинских букв в текстовых полях - это может быть заметно. Производительность конечно уменьшается, но если задача сервера в основном только хранение текстовой инфы (вроде форума), то не так уж сильно.
Проблема pg - не в формате хранения unicode, а в том, что локаль (и соответственно collation) может быть всего лишь одна на кластер, фиксированная на момент его создания.
...
Рейтинг: 0 / 0
2 сообщений из 2, страница 1 из 1
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / UTF 8 vs. однобайтовые кодировки
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]