Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
Вопрос по %Text.Russian БД - Cache 2008.1.0.401.0 Unicode Подскажите если кто работал с этим классом: В описании класса написано, что он работает и с Unicode версией Cache. Не индексируются файлы в кодировке utf-16, если ручками конвертировать файл utf16->cp1251, то файл индексируется. Можно как-нибудь решить эту проблему ( индексировать файлы без перекодировки utf16->cp1251 ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.06.2008, 10:38 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
У меня все работает. Cache for Windows (x86-32) 2008.2 (Build 420U) Thu May 15 2008 12:46:24 EDT Какая у Вас локаль по умолчанию и что стоит в "New Global Collation" у баз данных? У меня своя локаль на основе rusw и у всех БД стоит "Cache standard". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.06.2008, 11:13 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
Класс напрямую с файлами не работает и перекодировок не выполняет. В нем предполагается, что данные хранятся в кодировке, родной для вашей установки Каше, т.е. в Вашем случае - UTF-16. Вы, наверное, воспользовались примером (morpho.mac): Код: plaintext 1. 2. 3. 4. 5. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.06.2008, 11:35 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
servit У меня своя локаль на основе rusw и у всех БД стоит "Cache standard". В "New Global Collation" стоит "Сyrilic1". Какие изменения Вы внесли в новую локаль? Alexey Maslov Пробовал ставить вместо CP1251 Unicode (когда загружал юникодный файл), индекс все равно не создается. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.06.2008, 13:56 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
У меня в локали изменения касаются только поддержки молдавского языка и поддержки unicode для формирования XML ClientDataSet в Delphi, все остальное - как в rusw. Если просто посмотреть загруженный текст в таблице, он нормально отображается (чтобы отмести ошибки конвертации при чтении файла)? PS: и, если можно, приложите небольшой файл с данными, с которыми проблема. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.06.2008, 14:17 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
LeronПробовал ставить вместо CP1251 UnicodeТакой таблицы нет. В локали RUS8 есть UnicodeLittle, UnicodeBig, UTF8. Но я бы начал с RAW (если на входе файл с Виндовым юникодом): Код: plaintext ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.06.2008, 15:55 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
Нашел ошибку: после перехода БД на юникод забыл поменять в коде программы (написана на с++) вызовы CachePushStr (с помощью ее я передаю в каше текст для индексации) на CachePushStrW. Alexey Maslov В моей каше стоит локаль rusw. В том примере morpho.mac пробовал как Вы сказали менять на RAW : Код: plaintext Спасибо за помощь! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.06.2008, 17:50 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
А можно как нибудь в каше не хранить текст, который индексируется, т.е. самому ручками создавать индекс, работая напрямую с глобалами. У меня не получилось, не хочет искать по такому индексу. В Портале в плане запроса поиска по тексту увидел, что зачем то происходит опреация %SQLUPPER(MyText) (точно план запроса не помню), зачем ему нужен мой текст, ведь поиск идет только по индексу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.06.2008, 18:05 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
Насколько я помню, хранимый текст приводится к %SQLUPPER, если используется предикат %CONTAINS. По-возможности надо стараться использовать %CONTAINSTERM, об этом даже сказано в 1readme.htm. LeronА можно как нибудь в каше не хранить текст, который индексируется, т.е. самому ручками создавать индекс, работая напрямую с глобалами.Не совсем понятно, чего Вы хотите. Примерчик (упрощенный) привели бы... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.06.2008, 12:08 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
Пример: Код: plaintext 1. 2. 3. 4. 5. 6. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.06.2008, 14:27 |
|
||
|
индексация русских текстов
|
|||
|---|---|---|---|
|
#18+
Вроде понял, но не уверен. Вы хотели бы хранить только индекс, не храня сам текст? Но ведь индекс (устроенный по типу битмаповского) ориентирован на стандартное хранение Cache, которое не предусматривает хранения данных в битмаповских индексах. Поэтому поиск через SQL у вас не пойдет. Но ничто не мешает реализовать его на прямом доступе. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.06.2008, 15:05 |
|
||
|
|

start [/forum/topic.php?fid=39&msg=35350667&tid=1558864]: |
0ms |
get settings: |
6ms |
get forum list: |
10ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
54ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
32ms |
get tp. blocked users: |
1ms |
| others: | 210ms |
| total: | 326ms |

| 0 / 0 |
