|
|
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Как однозначно идентифицировать физическое лицо? Достаточно ли фамилия-имя-отчество-дата рождения? Какова вероятность дубликатов с такими данными? Каковы мнения по этому вопросу? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:06 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
В общем случае никак см сюда ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:13 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
ИНН не пробовали применять? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:14 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
СтарыйПень wrote: > Какова вероятность дубликатов с такими данными? 100% - т.е. однозначно будут :) Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:19 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Это-то понятно, поэтому больше интересует - какова вероятность появления в одном регионе более одного чел. с одинаковыми ФИО+дата рожд. (может быть еще место рождения добавить). То, что фамилия может измениться - это вопрос другой. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:20 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
СтарыйПень wrote: > Это-то понятно, поэтому больше интересует - какова вероятность появления > в одном регионе более одного чел. с одинаковыми ФИО+дата рожд. (может > быть еще место рождения добавить). 100% - опять таки. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:24 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
т.е. из 100 чел.- 100 будет одинаковыми? :) что-то не верится ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:28 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
СтарыйПеньт.е. из 100 чел.- 100 будет одинаковыми? :) что-то не верится Вы, когда код пишете, тоже считаете, что EXISTS и ALL - это одно и то же? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:44 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Биометрия: радужка, отпечатки, голос, ДНК наконец :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 12:59 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
bpost wrote: > Биометрия: радужка, отпечатки, голос, ДНК наконец :) Не подходит - надо будет в доках указывать, все такое... вы давно видели оператора, способного без ошибок набрать 1024 битное число в хексе? Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 13:09 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
> Как однозначно идентифицировать физическое лицо? Вы уверены, что Вам нужно решить именно эту задачу? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 13:12 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
номер паспорта не пробовал ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 13:19 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Ну, так как я не програмист, а скорее пользователь, то юмор Ennor Tiegael признаться не понял. Попробую по другому: Существует БД с ~ 10-40 тыс чел. В этой БД есть много повторяющихся данных (ФИО+дата рожд). Причем точно известно, некоторые физические лица записаны с разными номерами паспортов и прочими номерами (поменяли). БД построена так, что такие записи ощутимо влияют на статистику. (есть знаете ли разница - один чел три раза обратился или три чела по разу) Вопрос: Какова вероятность, что в данной местности (регионе) есть несколько чел. с одинаковыми ФИО+д/рожд. Как мне кажется, у нас (при тройном имени) такая вероятность близка к нулю. Хотелось бы услышать мнения или из личного опыта работы с большими БД ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 13:37 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Даже если веротность мала, проблемы остаются. Ведь при набивке ФИО и дат рожения делается также масса ошибок, особенно для неиндемичных для данного региона имен ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 13:45 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
СтарыйПень пишет: > Как однозначно идентифицировать физическое лицо? > Достаточно ли фамилия-имя-отчество-дата рождения? > Какова вероятность дубликатов с такими данными? > Каковы мнения по этому вопросу? Да никак !! Сколько уже копий сломано на этом. Пока каждому в мозг чип не будут внедрять при рождении, ничего с идентификацией не получится. > Достаточно ли фамилия-имя-отчество-дата рождения? Обычны набор - это фамилия-имя-отчество-дата рождения-место рождения. Это именно то, что указано в метрике (свидетельстве о рождении). Но конечно же этого недостаточно для полной формальной идентификации человека. Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 14:40 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
СтарыйПень пишет: > Вопрос: > Какова вероятность, что в данной местности (регионе) есть несколько чел. > с одинаковыми ФИО+д/рожд. Эт тебе, мужиг, в статкомитет надо с такими вопросами. > Как мне кажется, у нас (при тройном имени) такая вероятность близка к нулю. Отнюдь. Так что если ты хочешь разгребать неуникальность людей в твоей базе - то только руками. Вернее так- сначала убрать всех, которые точно уникальны по ФИО. Потом руками (в полуавтоматическом режиме) тех, кто имеет " однофамильцев ". И при этом еще надо учесть, что и при вводе могли быть ошибки в наборе. Так что по звуковой близости тоже хорошо бы потом проверить всех, может были опечатки. > Хотелось бы услышать мнения или из личного опыта работы с большими БД 40 тыщчел - это большая БД ? Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 14:46 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
saturnatuномер паспорта не пробовал Может поменяться. Как ИД не годится - уже было. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 15:24 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Rin@tИНН не пробовали применять? ИНН не обязателен для физ. лиц ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 15:29 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Naf wrote: > ИНН не обязателен для физ. лиц А также для детей в возрасте до... скоки то там. у них, кстате - даже пачпорта нету, есть токо мама, папа и собачка :) Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 15:37 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
СтарыйПеньКак однозначно идентифицировать физическое лицо? Собрался народ давать советы, а кто в лес, кто по дрова. Рассказываю однозначно правильное решение. Ключ Empolyee ID (это табельным номером в СССР называли) - уникальный идентификатор для каждого человека, который не будет меняться. ФИО в отдельную таблицу (NAMES например), где кроме этого ещё ключ с датой нужен с когда действует, ведь имя/фамилия может меняться. Дату рождения и место рождения опять в другую таблицу и везде первым ключом Employee ID. Надеюсь понятно написал. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 16:17 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Flare wrote: > Ключ *Empolyee ID* (это табельным номером в СССР называли) - уникальный > идентификатор для каждого человека, который не будет меняться. GUID! Уникально даже для китая! Posted via ActualForum NNTP Server 1.4 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 17:06 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
locky Flare wrote: > Ключ *Empolyee ID* (это табельным номером в СССР называли) - уникальный > идентификатор для каждого человека, который не будет меняться. GUID! Уникально даже для китая! Posted via ActualForum NNTP Server 1.4 И выжечь каленым железом на лбу у Empolyee. :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 17:24 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
Помнится, писалось ранее. Наверное, правильная постановка задачи будет такая. Определения. 1. Есть событие, назовем его событием регистрации (СР). СР характеризуется набором признаков, имеет этапы. СР может быть закончено или нет. Цель СР – определить уникальность предмета среди ограниченного количества похожих предметов (похожих в смысле определенного множества признаков из набора), используя наборы признаков (идентификация). Определяющий момент – первичное СР (ПСР). 2. При ПСР предмет впервые получает набор признаков, который должен однозначно определить его как уникальный объект. Признаки могут быть объективными, постоянными, субъективными, меняющимися. Набор признаков может быть пустым, состоять из одного или нескольких элементов. 3. Вторичным СР (ВСР) назовем любое СР, следующее по времени за ПСР. 4. ВСР предполагает, что набор признаков полученных при ПСР существует и используется при идентификации. 5. Конечное СР (КСР). Событие регистрации обратное ПСР. 6. Набор признаков. Признаки должны быть объективными. Признаки должны иметь систему отсчета, измерений одинаковую для всех предметов, проходящих идентификацию. Количество признаков –ограничено. 7. Самое важное: идентификация должна проводиться по формальным алгоритмам сравнения, доступным современным компьютерным программам. Задача. Определить набор признаков для ПСР , ВСР, КСР. Определить, какие признаки из набора, их комбинации является необходимыми для идентификации при ПСР , ВСР, КСР. По моему, вся наука до сих пор не решила эту задачу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 17:33 |
|
||
|
как идентифицировать физическое лицо
|
|||
|---|---|---|---|
|
#18+
И это было в ранних форумах . . . Есть опыт анализа БД на 400 000 человек. Данные взяты по миллионному городу (6 городских районов). Анализировались два городских района. Брались данные реальные, по избирательным участкам. Сколько ошибок данных пришлось обработать! Разработаны справочники мужских и женских имен, мужских и женских отчеств. Фамилии являются достаточно уникальными - в справочник не встали! Ключ: Фамилия +КодИмени+КодОтчества+годрождения+место рождения. Вероятность повтора 1 на 5 000 000. Попутно были найдены двойники в избирательных списках. Немного, около 100 человек. Неправильно провели границу между участками! Вместо года рождения лучше взять дату рождения. За место рождения в крупном городе - считать адрес прописки родителей на момент рождения. Идеальным, наверное является свидетельство о рождении. Пока все. Но материала много. Например, разработаны алгоритмы сравнения с эталоном (справочником) неправильно введенных имен. Например на имя Александр было около 20 реализаций. С уважением. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.07.2007, 17:45 |
|
||
|
|

start [/forum/topic.php?fid=32&msg=34673769&tid=1544390]: |
0ms |
get settings: |
8ms |
get forum list: |
19ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
197ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
74ms |
get tp. blocked users: |
1ms |
| others: | 250ms |
| total: | 570ms |

| 0 / 0 |
