Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / как идентифицировать физическое лицо / 25 сообщений из 103, страница 1 из 5
20.07.2007, 12:06
    #34672717
как идентифицировать физическое лицо
Как однозначно идентифицировать физическое лицо?
Достаточно ли фамилия-имя-отчество-дата рождения?
Какова вероятность дубликатов с такими данными?
Каковы мнения по этому вопросу?
...
Рейтинг: 0 / 0
20.07.2007, 12:13
    #34672749
blinded
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
В общем случае никак см сюда
...
Рейтинг: 0 / 0
20.07.2007, 12:14
    #34672752
Rin@t
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
ИНН не пробовали применять?
...
Рейтинг: 0 / 0
20.07.2007, 12:19
    #34672775
locky
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
СтарыйПень wrote:
> Какова вероятность дубликатов с такими данными?
100% - т.е. однозначно будут :)
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
20.07.2007, 12:20
    #34672777
как идентифицировать физическое лицо
Это-то понятно, поэтому больше интересует - какова вероятность появления в одном регионе более одного чел. с одинаковыми ФИО+дата рожд. (может быть еще место рождения добавить).
То, что фамилия может измениться - это вопрос другой.
...
Рейтинг: 0 / 0
20.07.2007, 12:24
    #34672798
locky
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
СтарыйПень wrote:
> Это-то понятно, поэтому больше интересует - какова вероятность появления
> в одном регионе более одного чел. с одинаковыми ФИО+дата рожд. (может
> быть еще место рождения добавить).
100% - опять таки.
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
20.07.2007, 12:28
    #34672815
как идентифицировать физическое лицо
т.е. из 100 чел.- 100 будет одинаковыми? :) что-то не верится
...
Рейтинг: 0 / 0
20.07.2007, 12:44
    #34672881
Ennor Tiegael
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
СтарыйПеньт.е. из 100 чел.- 100 будет одинаковыми? :) что-то не верится
Вы, когда код пишете, тоже считаете, что EXISTS и ALL - это одно и то же?
...
Рейтинг: 0 / 0
20.07.2007, 12:59
    #34672961
bpost
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
Биометрия: радужка, отпечатки, голос, ДНК наконец :)
...
Рейтинг: 0 / 0
20.07.2007, 13:09
    #34673014
locky
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
bpost wrote:
> Биометрия: радужка, отпечатки, голос, ДНК наконец :)
Не подходит - надо будет в доках указывать, все такое...
вы давно видели оператора, способного без ошибок набрать 1024 битное
число в хексе?
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
20.07.2007, 13:12
    #34673027
guest_20040621
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
> Как однозначно идентифицировать физическое лицо?

Вы уверены, что Вам нужно решить именно эту задачу?
...
Рейтинг: 0 / 0
20.07.2007, 13:19
    #34673068
saturnatu
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
номер паспорта не пробовал
...
Рейтинг: 0 / 0
20.07.2007, 13:37
    #34673157
как идентифицировать физическое лицо
Ну, так как я не програмист, а скорее пользователь, то юмор Ennor Tiegael признаться не понял.
Попробую по другому:
Существует БД с ~ 10-40 тыс чел.
В этой БД есть много повторяющихся данных (ФИО+дата рожд). Причем точно известно, некоторые физические лица записаны с разными номерами паспортов и прочими номерами (поменяли).
БД построена так, что такие записи ощутимо влияют на статистику. (есть знаете ли разница - один чел три раза обратился или три чела по разу)

Вопрос:
Какова вероятность, что в данной местности (регионе) есть несколько чел. с одинаковыми ФИО+д/рожд.

Как мне кажется, у нас (при тройном имени) такая вероятность близка к нулю.
Хотелось бы услышать мнения или из личного опыта работы с большими БД
...
Рейтинг: 0 / 0
20.07.2007, 13:45
    #34673195
blinded
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
Даже если веротность мала, проблемы остаются. Ведь при набивке ФИО и дат рожения делается также масса ошибок, особенно для неиндемичных для данного региона имен
...
Рейтинг: 0 / 0
20.07.2007, 14:40
    #34673508
MasterZiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
СтарыйПень пишет:
> Как однозначно идентифицировать физическое лицо?
> Достаточно ли фамилия-имя-отчество-дата рождения?
> Какова вероятность дубликатов с такими данными?
> Каковы мнения по этому вопросу?

Да никак !! Сколько уже копий сломано на этом.
Пока каждому в мозг чип не будут внедрять при рождении,
ничего с идентификацией не получится.


> Достаточно ли фамилия-имя-отчество-дата рождения?

Обычны набор - это
фамилия-имя-отчество-дата рождения-место рождения.
Это именно то, что указано в метрике (свидетельстве о
рождении). Но конечно же этого недостаточно для полной
формальной идентификации человека.
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
20.07.2007, 14:46
    #34673541
MasterZiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
СтарыйПень пишет:
> Вопрос:
> Какова вероятность, что в данной местности (регионе) есть несколько чел.
> с одинаковыми ФИО+д/рожд.

Эт тебе, мужиг, в статкомитет надо с такими вопросами.

> Как мне кажется, у нас (при тройном имени) такая вероятность близка к нулю.

Отнюдь. Так что если ты хочешь разгребать неуникальность людей в твоей
базе - то только руками. Вернее так- сначала убрать всех, которые точно
уникальны по ФИО. Потом руками (в полуавтоматическом режиме) тех, кто
имеет " однофамильцев ". И при этом еще надо учесть, что и при вводе
могли быть ошибки в наборе. Так что по звуковой близости тоже
хорошо бы потом проверить всех, может были опечатки.

> Хотелось бы услышать мнения или из личного опыта работы с большими БД

40 тыщчел - это большая БД ?
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
20.07.2007, 15:24
    #34673751
Дмитрий В. Бехилев
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
saturnatuномер паспорта не пробовал
Может поменяться. Как ИД не годится - уже было.
...
Рейтинг: 0 / 0
20.07.2007, 15:29
    #34673769
Naf
Naf
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
Rin@tИНН не пробовали применять?

ИНН не обязателен для физ. лиц
...
Рейтинг: 0 / 0
20.07.2007, 15:37
    #34673806
locky
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
Naf wrote:
> ИНН не обязателен для физ. лиц
А также для детей в возрасте до... скоки то там.
у них, кстате - даже пачпорта нету, есть токо мама, папа и собачка :)
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
20.07.2007, 16:17
    #34673966
Flare
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
СтарыйПеньКак однозначно идентифицировать физическое лицо?
Собрался народ давать советы, а кто в лес, кто по дрова. Рассказываю однозначно правильное решение.

Ключ Empolyee ID (это табельным номером в СССР называли) - уникальный идентификатор для каждого человека, который не будет меняться.

ФИО в отдельную таблицу (NAMES например), где кроме этого ещё ключ с датой нужен с когда действует, ведь имя/фамилия может меняться.
Дату рождения и место рождения опять в другую таблицу и везде первым ключом Employee ID. Надеюсь понятно написал.
...
Рейтинг: 0 / 0
20.07.2007, 17:06
    #34674118
locky
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
Flare wrote:
> Ключ *Empolyee ID* (это табельным номером в СССР называли) - уникальный
> идентификатор для каждого человека, который не будет меняться.
GUID! Уникально даже для китая!
Posted via ActualForum NNTP Server 1.4
...
Рейтинг: 0 / 0
20.07.2007, 17:24
    #34674195
Сахават Юсифов
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
locky
Flare wrote:
> Ключ *Empolyee ID* (это табельным номером в СССР называли) - уникальный
> идентификатор для каждого человека, который не будет меняться.
GUID! Уникально даже для китая!
Posted via ActualForum NNTP Server 1.4

И выжечь каленым железом на лбу у Empolyee. :)
...
Рейтинг: 0 / 0
20.07.2007, 17:33
    #34674224
laleks
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
Помнится, писалось ранее.
Наверное, правильная постановка задачи будет такая.
Определения.
1. Есть событие, назовем его событием регистрации (СР). СР характеризуется набором признаков, имеет этапы. СР может быть закончено или нет. Цель СР – определить уникальность предмета среди ограниченного количества похожих предметов (похожих в смысле определенного множества признаков из набора), используя наборы признаков (идентификация). Определяющий момент – первичное СР (ПСР).
2. При ПСР предмет впервые получает набор признаков, который должен однозначно определить его как уникальный объект. Признаки могут быть объективными, постоянными, субъективными, меняющимися. Набор признаков может быть пустым, состоять из одного или нескольких элементов.
3. Вторичным СР (ВСР) назовем любое СР, следующее по времени за ПСР.
4. ВСР предполагает, что набор признаков полученных при ПСР существует и используется при идентификации.
5. Конечное СР (КСР). Событие регистрации обратное ПСР.
6. Набор признаков. Признаки должны быть объективными. Признаки должны иметь систему отсчета, измерений одинаковую для всех предметов, проходящих идентификацию. Количество признаков –ограничено.
7. Самое важное: идентификация должна проводиться по формальным алгоритмам сравнения, доступным современным компьютерным программам.

Задача.
Определить набор признаков для ПСР , ВСР, КСР.
Определить, какие признаки из набора, их комбинации является необходимыми для идентификации при ПСР , ВСР, КСР.

По моему, вся наука до сих пор не решила эту задачу.
...
Рейтинг: 0 / 0
20.07.2007, 17:45
    #34674269
laleks
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
И это было в ранних форумах . . .
Есть опыт анализа БД на 400 000 человек.
Данные взяты по миллионному городу (6 городских районов). Анализировались два городских района. Брались данные реальные, по избирательным участкам.
Сколько ошибок данных пришлось обработать!
Разработаны справочники мужских и женских имен, мужских и женских отчеств.
Фамилии являются достаточно уникальными - в справочник не встали!
Ключ: Фамилия +КодИмени+КодОтчества+годрождения+место рождения.
Вероятность повтора 1 на 5 000 000.
Попутно были найдены двойники в избирательных списках. Немного, около 100 человек.
Неправильно провели границу между участками!
Вместо года рождения лучше взять дату рождения.
За место рождения в крупном городе - считать адрес прописки родителей на момент рождения.
Идеальным, наверное является свидетельство о рождении.
Пока все. Но материала много.
Например, разработаны алгоритмы сравнения с эталоном (справочником) неправильно введенных имен. Например на имя Александр было около 20 реализаций.
С уважением.
...
Рейтинг: 0 / 0
20.07.2007, 18:46
    #34674445
softwarer
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
как идентифицировать физическое лицо
FlareРассказываю однозначно правильное решение.
Зачетная формулировка.
...
Рейтинг: 0 / 0
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / как идентифицировать физическое лицо / 25 сообщений из 103, страница 1 из 5
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]