Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
Всем привет! Подскажите пожалуйста, может быть кто-то сталкивался с похожей проблемой. Необходимо осуществлять замену символов в строке. Ведется поиск по ФИО не в лоб, а подменой символов по самым распространенным типам опечаток, т.е. Щ на Ш, Ь на И, Ъ на И, двойные буквы одинарными. Как можно быстро находить эти двойные буквы в строке? Не перебором же по всему алфавиту..... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 09:33 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
так что-ли? Код: sql 1. 2. 3. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 09:42 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
Руслан Дамирович, например, Даммироович -> Дамирович ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 09:55 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
Кареглазая_заяВсем привет! Подскажите пожалуйста, может быть кто-то сталкивался с похожей проблемой. Необходимо осуществлять замену символов в строке. Ведется поиск по ФИО не в лоб, а подменой символов по самым распространенным типам опечаток, т.е. Щ на Ш, Ь на И, Ъ на И, двойные буквы одинарными. Как можно быстро находить эти двойные буквы в строке? Не перебором же по всему алфавиту..... Вам нужно обратиться к Игорю Ашманову. Он как раз занимался проблемой автокоррекции в далеких 90-х и реализовал модуль для Microsoft, который в Word все эти двойные буквы ловит и опечатки. Можно попробовать через OLE копировать кусок в Word, вызывать макросом на VBA проверку синтаксиса и орфографии, а затем преобразованный и очищенный абзац копировать обратно в столбец nvarchar(max) в таблицу SQL. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 09:56 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
основа всё та же - создается словарь правил или стандартных опечаток а дальше если вы работаете со строкой - то применяете их к строке способы могут быть разные - от банального like до индексной таблички если со множеством строк - то лучше наверное будет индексная табличка . но тока учтите - в таких вещах автоматическая автозамена очень плохой помощник. Всё должно отсматриваться глазками. Правда есть исключение )) работа с персональными данными )) там можно словчить - если сравниваются довольно большие банные по человеку ( типа - место рождения, адрес, дата рождения, фио и остальные редко меняемые данные ) то если не совпадение в одном поле из нескольких, по с большей долей вероятности таки описка, и её можно исправить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 10:09 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
Кареглазая_заяНе перебором же по всему алфавиту.....Вообще-то, лучше всего именно перебором. Ничего страшного! Например: Есть ли у кого готовая функция перевода (транслит) с руского на английский ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 10:10 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
Кареглазая_заяВсем привет! Подскажите пожалуйста, может быть кто-то сталкивался с похожей проблемой. Необходимо осуществлять замену символов в строке. Ведется поиск по ФИО не в лоб, а подменой символов по самым распространенным типам опечаток, т.е. Щ на Ш, Ь на И, Ъ на И, двойные буквы одинарными. Как можно быстро находить эти двойные буквы в строке? Не перебором же по всему алфавиту..... 1. Если враг не сдается - его уничтожают. 2. Удалите символы. 3. Найдите совпадения. 4. Обработайте найденное "як хотите"... ЗЫ. Кстати в алфавите всего то 32 буквы. Так что 32 replace - самое быстрое. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 10:13 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
Кареглазая_заяРуслан Дамирович, например, Даммироович -> Дамирович Это вам в Хогвардс на факультет прикладной магии ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 11:49 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
Кареглазая_заяРуслан Дамирович, например, Даммироович -> Дамирович Кареглазая_заядвойные буквы одинарными. Как можно быстро находить эти двойные буквы в строке? Не перебором же по всему алфавиту. Таки да. И оловя нн ый -> оловя н ый. И диле мм а -> диле м а. И Ваш генеральный директор Кареглазый_Ге нн адий -> Кареглазый_Ге н адий. И уволят Вас за такой алгоритм с волчьим билетом на мороз. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 12:13 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
detkuData Quality Services (DQS) ? https://msdn.microsoft.com/ru-ru/library/gg524800(v=sql.120).aspx Жара! А есть видео, где ее используют? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 12:42 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
https://www.youtube.com/results?search_query=+Data+Quality+Services ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 12:55 |
|
||
|
Замена символов с строке
|
|||
|---|---|---|---|
|
#18+
detkuData Quality Services (DQS) ? https://msdn.microsoft.com/ru-ru/library/gg524800(v=sql.120).aspx Это все замечательно, только вот условие автора темы "Ведется поиск по ФИО не в лоб, а подменой символов по самым распространенным типам опечаток ". У Вас база DQS. И есть в ней "Иванов", "Петров", "А в рам". Приходит А б рам Петрович. Или Авр аа м Моисеевич. Их как - добавлять в DQS или считать, что при вводе своих ФИО они ошиблись - и нужно автоматически заменить. В общем, автору темы нужен универсальный алгоритм покруче ИИ. А выход из положения - внедрение процесса сверки вариантов, похожих на ошибки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.12.2017, 13:03 |
|
||
|
|

start [/forum/topic.php?fid=46&tid=1690592]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
23ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
36ms |
get tp. blocked users: |
1ms |
| others: | 248ms |
| total: | 347ms |

| 0 / 0 |
