powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / MySQL [игнор отключен] [закрыт для гостей] / Много кодировок в базе + поиск
3 сообщений из 3, страница 1 из 1
Много кодировок в базе + поиск
    #32897940
Mamut
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Знаю, знаю, заклюете :) Ну да ладно.

В большинстве вопросов об организации поиска по русским текстам предлагают изменить кодировку на ... эээ ... соответствующую и забыть про мучения.

Но.

У меня уже который год идет работа с сайтами, едиными в трех лицах, то есть языках - английском, русском и турецком (соответственно, latin1, эээ win-1251 и win-1254).

Английский - побоку, он все равно в любую кодировку вписывается, а вот турецкий и русский пересекаются - увы.

И вот! Наконец! Писец подкрался незаметно :) Заставляют, понимаете ли, сварганить поиск, да не просто, а всеобъемлющий, да еще по всему сайту. Со всеми вытекающими релевантностями и прочая и прочая.

Годом раньше я себе сварганил этакое подобие инвертированных файлов в мускле. Ничего, работает, но вот на русских и турецких словах, естественно, спотыкается.

Проблема еще в том, что мускл+пыхыпы конвертируют все в UTF-8, негодники, что ситуацию с одной стороны облегчает, а сдругой - усугубляет.

Что делать? (извечный вопрос, увы)

Пересмотреть ли свой алгоритм инвертированных файлов? Или, как посоветовали кому-то в одном из форумов, разбивать входящие тексты на подстроки из четырех символов и хранить их и связочную таблицу "подстрока - документ"?

Или есть еще варианты?

Поможите, люди добрые, бо мы сами не местные :)
...
Рейтинг: 0 / 0
Много кодировок в базе + поиск
    #32897987
Фотография Хрен
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
вариант - перейти на версию 4.1 где можно назначать разные character sets и разные collations для разных полей.
...
Рейтинг: 0 / 0
Много кодировок в базе + поиск
    #32898528
Mamut
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Спасибо. Посмотрю, что можно с этим сделать. Как известно, хозяин - барин, но какой я программист, если не смогу его переубедить?
...
Рейтинг: 0 / 0
3 сообщений из 3, страница 1 из 1
Форумы / MySQL [игнор отключен] [закрыт для гостей] / Много кодировок в базе + поиск
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]