powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Similar to с цифрами
25 сообщений из 46, страница 1 из 2
Similar to с цифрами
    #39854973
Atanas
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Обнаружили сегодня удивительное поведение similar to.

select _utf8 x'c2b9' similar to '[1-2]' from rdb$database;
true

select _utf8 x'c2b9' similar to '[1]' from rdb$database;
false

select _utf8 x'c2b9' similar to '[2]' from rdb$database;
false

_utf8 x'c2b9' это '¹', единица в верхнем индексе (SUPERSCRIPT ONE)


Т.е. для similar это не единица и не двойка, а что-то между :) Стоит ли писать в трекер?
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39854982
Atanas
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Т.к. нужна была проверка, цифра ли это, выкрутились через через [:DIGIT:]
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862667
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Atanas,

вроде влад недавно делал экспериментальную сборку с другой регеэкcп-библиотекой

если она в мейнстрим пойдёт - то на ней бы перепроверить

иначе наверное стоит написать в трекер
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862674
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Делал не Влад, Влад лишь показал где взять.
Оно уже в master, т.е. можно брать снапшоты и проверять.

По теме - я сильно сомневаюсь, что "единица в верхнем индексе (SUPERSCRIPT ONE)" и подобные символы должны сравниваться как цифры.
По крайней мере в обычных (не специальных) collate.
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862693
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hvlad,

снапшоты под windows не собираются с 6 числа. Если только автосборки брать из appveyor
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862697
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Симонов Денис,

да, уже видел. Разберёмся.
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862808
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hvlad> Оно уже в master

в четвёрке. а в тройке?
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862814
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ariochа в тройке?

А в тройке опаньки. Ибо эта новая библиотека даже четвёрку поломала напрочь, а уж в
стабильную ветку её и подавно никто не пустит.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862815
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
> По теме - я сильно сомневаюсь

тогда точно в трекер - пусть в трекере и договариваются, что считать цифрой.

я, кстати, тоже не вполне уверен, что индексы со всех 4-х углов нужно считать цифрами. Склоняюсь к "нужно", но не уверен.

а ещё есть цифры строчные, а не только прописные(заглавные)
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862818
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakov,

насколько понимаю, первая задача в таких патчах - перевести синтаксис регэкспа с SQL на обычный PCRE ?

можно ли этот кусок отдельно из патча выбрать, а в качестве движка использовать библиотеку ICU, которая в какой-то мере в FB используется уже много лет.

P.S. а ещё лучше, какое-нибудь расширение SQL, чтоб использовать сразу PCRE-синтаксис в запросах и забыть про SQL-regexp вообще
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862821
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arioch,

дружок, а не пойти ли тебе в fb-devel и почитать обсуждение почему именно re2 выбрана, а не ICU.

AriochP.S. а ещё лучше, какое-нибудь расширение SQL, чтоб использовать сразу PCRE-синтаксис в запросах и забыть про SQL-regexp вообще

напиши свою UDR с данным функционалом
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862835
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakovновая библиотека даже четвёрку поломала напрочьКакой пафос. Какая чушь.

Когда ты уже научишься перестать свои локальные проблемы выдавать за мировое зло...
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862843
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Симонов Денис,

дай ссылку, почитаю
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862846
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arioch,

вот всё за вас найди

https://www.mail-archive.com/firebird-devel@lists.sourceforge.net/msg17384.html]https://www.mail-archive.com/firebird-devel@lists.sourceforge.net/msg17384.html

З.Ы. Я читаю через Opera-mail по news://news.gmane.org:119/gmane.comp.db.firebird.devel
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862849
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gmane по NNTP работает?
потому что gmane-WWW лежит уже третий, кажется, год

у тебя эта переписка уже есть, ты её читал, а мне реально надо будет с самого начала искать где когда кто по каким ключевым словам и т.д.
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862851
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hvladКакой пафос. Какая чушь.

Ты уже починил сборку снэпшотов чтобы уверенно об этом заявлять?
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862854
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry SibiryakovhvladКакой пафос. Какая чушь.

Ты уже починил сборку снэпшотов чтобы уверенно об этом заявлять?Да. И ?
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862857
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
АдрианоBecause ICU, boost (regex and xpressive), PCRE and almost every other
regex engine are susceptible to the same problems we had on my own coded
version: some expressions produces exponential time complexity that
kills engine even with small texts being matched.

On the other hand, RE2 is based on different theory. Complexity is
linear based on text length.

"пойти в девел", "поискать обсуждение", сколько пафоса

можно было просто своими словами пересказать в две строки и две минуты
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862860
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arioch,

ну я по NTTP читаю и даже пишу
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862861
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
hvladДа. И ?

И теперь Таблоид сможет прогнать тесты для обнаружения утечек памяти.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862864
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arioch,

ну так это маленький кусок из обсуждения. Там этот вопрос не только Влад задавал.
А если пересказывать, то могу что то забыть или исказить. Заметь это обсуждение было почти месяц назад
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862867
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arioch, 14:02у тебя эта переписка уже есть, ты её читал, а мне реально надо будет с самого начала
искать где когда кто по каким ключевым словам и т.д....
Arioch, 14:07"пойти в девел", "поискать обсуждение", сколько пафосаСильно утомился, бедняжка ?
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862893
rdb_dev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Мужики, заканчивайте шашками махать!
Рекомендую подробно изучить Unicode Collation Algorithm (UCA) и обратите внимание на пункт "Numbers" раздела "1.4 Customization" , который гласит:
" Numbers . A customization may be desired to allow sorting numbers in numeric order. If strings including numbers are merely sorted alphabetically, the string “A-10” comes before the string “A-2”, which is often not desired. This behavior can be customized, but it is complicated by ambiguities in recognizing numbers within strings (because they may be formatted according to different language conventions). Once each number is recognized, it can be preprocessed to convert it into a format that allows for correct numeric sorting, such as a textual version of the IEEE numeric format."

Что уж говорить о надстрочном и подстрочном начертании?... В FirebirdSQL предусмотрено управление всеми возможностями кастомизации упорядочений?
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862902
rdb_dev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По поводу superscript и subscript: "10.2 Tertiary Weight Table"
" The <compat> weight 0x0004 is given to characters that do not have more specific decomposition types. It includes superscripted and subscripted combining letters, for example U+0365 COMBINING LATIN SMALL LETTER I and U+1DCA COMBINING LATIN SMALL LETTER R BELOW. These combining letters occur in abbreviations in Medieval manuscript traditions. "
...
Рейтинг: 0 / 0
Similar to с цифрами
    #39862905
hvlad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
rdb_dev,

создаёшь коллейт с NUMERIC-SORT и проверяешь, в чём проблемы ?
...
Рейтинг: 0 / 0
25 сообщений из 46, страница 1 из 2
Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Similar to с цифрами
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]