|
|
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Доводилось ли кому-нибудь работать с перечнем экстремистов? http://fedsfm.ru/documents/terrorists-catalog-portal-act Я имею этот список в виде файла Экселевского. И я вполне легко сделал поиск по нормальным ФИО. Но там также есть клинические случаи типа такого: авторФЕРЗАЛИЕВА (МАГОМЕДОВА) ГАЛИНА ФЕРЗАЛИЕВНА (МАГОМЕДОВА ГАЛИНА ФЕРЗАЛИЕВНА) (Человек, запрещённый на территории РФ) Как мне эти случаи обрабатывать? Это вообще что такое, неужели нельзя было в разные строки разнести разные варианты ФИО? Про всяких Абдурахманов я даже думать не хочу: авторABD AL-RAHMAN MUHAMMAD MUSTAFA AL-QADULI (Abd al-Rahman Muhammad Mustafa Shaykhlari; Abdul Rahman Muhammad al-Bayati; Abu Ala; Abu Hasan; Abu Iman; Abu Muhammad; Abu Zayna; Abu-Shuayb; Aliazra Ra'ad Ahmad; Hajji Iman; Tahir Muhammad Khalil Mustafa al-Bay (Человек, запрещённый на территории РФ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2016, 14:06 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
XDiaBLoИ я вполне легко сделал поиск по нормальным ФИО. Я в смысле по всем персонажам из этого списка, должен поиск в нашей базе делать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2016, 14:08 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Мне кажется вопросы установления личности невозможно решать в автоматизированном режиме. Список-списком но где есть элемент автоматизации? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2016, 22:23 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
В похожей ситуации банально считали сколько слов из имени получателя нашлось в каждой записи списка. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2016, 22:32 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Автор никогда не работал в госконторах. Если к вам пришёл лакей от господ и срочно (на вчера) сообщает о необходимости исполнить приказ номер такой-то от тако-го-то тако-го - дружно гогочите ему в лицо. А потом радостно с лихим молодцеватым видом хором говорите мол... нет технической возможности браток. Нету в баста. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2016, 22:44 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
XDiaBLoЯ в смысле по всем персонажам из этого списка, должен поиск в нашей базе делать.Лучше перебдеть, чем недобдеть. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.07.2016, 22:52 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
maytonМне кажется вопросы установления личности невозможно решать в автоматизированном режиме. Список-списком но где есть элемент автоматизации? Во всяком случае задача автоматизации на мне. Никто не будет каждого персонажа из этого списка, искать в базе вручную. И при массовом заведении каждого клиента искать в этом списке тоже. wstВ похожей ситуации банально считали сколько слов из имени получателя нашлось в каждой записи списка. Дельная идея. Я думаю может фамилию, имя и отчество сверять с этим списком, и если все три нашлись, то он наш. Ну закачать к примеру этот список в базу, в отдельную таблицу, и лайков в запросе наставить. maytonАвтор никогда не работал в госконторах. Если к вам пришёл лакей от господ и срочно (на вчера) сообщает о необходимости исполнить приказ номер такой-то от тако-го-то тако-го - дружно гогочите ему в лицо. А потом радостно с лихим молодцеватым видом хором говорите мол... нет технической возможности браток. Нету в баста. Да кого там. Мне начальство присылает задачи, и они ждут результат, а не какие-то отговорки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 06:56 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
По идее у меня уже давно этот поиск работает. Просто я обнаружил там записи такого вида: XDiaBLoавторФЕРЗАЛИЕВА (МАГОМЕДОВА) ГАЛИНА ФЕРЗАЛИЕВНА (МАГОМЕДОВА ГАЛИНА ФЕРЗАЛИЕВНА) (Человек, запрещённый на территории РФ) И хочу сделать чтобы все варианты заполнения разыскивались правильно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 06:58 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Тебе в которую сторону проверку надо? Если проверить конкретного человека из своей базы, то может искать его в базе запрещенных отдельно по словам? Т.е. просто считаем что запись в базе запрещенных набором слов. Выбираем все записи по вхождению искомой фамилии, затем среди найденного по имени, затем по отчеству. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 08:18 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
XDiaBLo, Я работал. Разбираю эту строку в таблицу альтернативных наименований. А так вообще у меня порядок работы такой: 1. Клею строки по параметрам Код: sql 1. 2. 3. , т.к. там наименования могут быть гораздо больше 255 символов и продолжение строки переноситится на следующуу строку. В вашем случае это наименование будет ABD AL-RAHMAN MUHAMMAD MUSTAFA AL-QADULI (Abd al-Rahman Muhammad Mustafa Shaykhlari; Abdul Rahman Muhammad al-Bayati; Abu Ala; Abu Hasan; Abu Iman; Abu Muhammad; Abu Zayna; Abu-Shuayb; Aliazra Ra'ad Ahmad; Hajji Iman; Tahir Muhammad Khalil Mustafa al-Bay+++ati; Umar Muhammad Khaiil Mustafa) 2. Заменяю разделитель ; на | первом уровне скобок, что бы правильно разобрать такие строки Код: plaintext Код: plaintext ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 08:50 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
На выходе получаю прмерно это: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 08:55 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Клинический случай: Код: sql 1. 2. 3. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 08:59 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
__Avenger__Клинический случай: Код: sql 1. 2. 3. А как ФЕРЗАЛИЕВА ГАЛИНА ФЕРЗАЛИЕВНА значит она не проскакивает в результатах? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 09:54 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Интересный вариант конечно, сейчас сначала свою идею проверю, если по производительности устраивать не будет, придётся пилить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 09:56 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Если мой вариант со словами залить в БД, и сделать доп таблицу words (Id, word), то можно индексы использовать, примерно так Код: sql 1. 2. 3. 4. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:04 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Только повторы убрать при заливке, т.е. например записьidfio123ФЕРЗАЛИЕВА (МАГОМЕДОВА) ГАЛИНА ФЕРЗАЛИЕВНА (МАГОМЕДОВА ГАЛИНА ФЕРЗАЛИЕВНА) должна храниться в word так idword123ФЕРЗАЛИЕВА123МАГОМЕДОВА123ГАЛИНА123ФЕРЗАЛИЕВНА ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:09 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Dima TТолько повторы убрать при заливке, т.е. например записьidfio123ФЕРЗАЛИЕВА (МАГОМЕДОВА) ГАЛИНА ФЕРЗАЛИЕВНА (МАГОМЕДОВА ГАЛИНА ФЕРЗАЛИЕВНА) должна храниться в word так idword123ФЕРЗАЛИЕВА123МАГОМЕДОВА123ГАЛИНА123ФЕРЗАЛИЕВНА Хмм, интересно. Только индекс таблицы с клиентами всё равно не прокатит. Так только штучных прямо при заведении проверять. Хотя это тоже вариант. А я в общем-то сейчас работаю над массовым поиском. Списки то постоянно обновляются. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:24 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Dima TЕсли мой вариант со словами залить в БД, и сделать доп таблицу words (Id, word), то можно индексы использовать, примерно так Код: sql 1. 2. 3. 4. И кстати когда у чувака только фамилия и имя, будет нужно совпадение 2 параметров. Тут нужно запрос подумать как составить. Но это потом, сперва додумаю куда мне это всё залить в базу. Нашёл подходящую табличку, но полей в ней маловато. Мне нужно ещё дату рождения и паспортные данные туда запихнуть. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:27 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
XDiaBLoХмм, интересно. Только индекс таблицы с клиентами всё равно не прокатит. Так только штучных прямо при заведении проверять. Хотя это тоже вариант. А я в общем-то сейчас работаю над массовым поиском. Списки то постоянно обновляются. тут будет работать индекс по words.word Как вариант для массовой проверки - сначала отсечь тех кого заведомо не найдем. Т.е. у кого имя, отчество или фамилия не встречаются в списке запрещенных. Также разбиваем список проверяемых на слова, таблица find_words: find_idfind_word1ИВАНОВ1ИВАН1ИВАНЫЧ2ПЕТРОВА2ГАЛИНА2ПЕТРОВНА затем оставляем только тех кто целиком есть в words Код: sql 1. 2. 3. затем проверка каждого из оставшихся поштучно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:37 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
XDiaBLoИ кстати когда у чувака только фамилия и имя, будет нужно совпадение 2 параметров. Тут нужно запрос подумать как составить. Но это потом, сперва додумаю куда мне это всё залить в базу. Нашёл подходящую табличку, но полей в ней маловато. Мне нужно ещё дату рождения и паспортные данные туда запихнуть. Магическая цифра 3 в запросе это количество слов, если будет два слова, то так Код: sql 1. 2. 3. 4. XDiaBLoНо это потом, сперва додумаю куда мне это всё залить в базу. Нашёл подходящую табличку, но полей в ней маловато. Мне нужно ещё дату рождения и паспортные данные туда запихнуть. обычно просто создают новую таблицу с нужной структурой ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:41 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Dima TXDiaBLoНо это потом, сперва додумаю куда мне это всё залить в базу. Нашёл подходящую табличку, но полей в ней маловато. Мне нужно ещё дату рождения и паспортные данные туда запихнуть. обычно просто создают новую таблицу с нужной структурой Ага, кто бы мне разрешил так сделать? Сказано использовать готовую таблицу для временных данных. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:47 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
XDiaBLoСказано использовать готовую таблицу для временных данных. Не от большого ума сказано. Для временных данных создают временные таблицы. Сервер какой? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:50 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Dima TXDiaBLoСказано использовать готовую таблицу для временных данных. Не от большого ума сказано. Для временных данных создают временные таблицы. Сервер какой? Так она итак временная. автор-- Create table create global temporary table TEMP_COLLECTION ( scope VARCHAR2(255), marked_id NUMBER(18) not null, add_info VARCHAR2(3900) ) on commit delete rows; Просто она уже существует. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 10:53 |
|
||
|
Перечень экстремистов
|
|||
|---|---|---|---|
|
#18+
Я не вижу какая dbms у автора. Но если он юзает varchar2 то возможно Oracle. Тогда (если автор очень сильно хочет автоматизировать блеклисты) я-бы предложил подключить к базе опцию Oracle Text (Сtxcat index). Как здесь пишут http://www.oracle.com/technetwork/database/enterprise-edition/ctxcat-primer-090555.html И в выражении поиска использовать специальные фунции типа Код: plsql 1. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.07.2016, 11:54 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=39276090&tid=1340652]: |
0ms |
get settings: |
4ms |
get forum list: |
14ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
49ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
66ms |
get tp. blocked users: |
1ms |
| others: | 211ms |
| total: | 358ms |

| 0 / 0 |
