|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Есть проблема. Всвязи с законом о защите персональных данных использовать хоть и устаревшие, но ,тем не менее, персональные данные для целей разработки (СУБД, работающая для разработки и тестирования всего и вся) не представляется возможным. Данные, естественно, нужны. Все данные очень персональные (медицина). Для успокоения службы безопасности их необходимо деперсонифицировать. Какие существуют алгоритмы? Сталкивался кто-либо с деперсонификацией на практике? гугль не предлагать. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 14:44 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Да какие тут могут быть алгоритмы?! Просто замените в ФИО и в адресе все гласные на "А" или просто вырежьте их. Аналогично можно поступить с цифрами в номере паспорта и в цифрах адреса. Главное чтобы в результате по данным нельзя было однозначно идентифитицировать конкретного человека. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 14:58 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Dimkas, В том то и дело, что данные нужны ну не совсем "от балды". Некоторые из разрабатываемых задач должны работать с т.н. "двойниками". т.е. предложенный алгоритм (все гласные менять на "А") - не подходит. Голозадов и какой-нибудь Галезидев должны в итоге различаться. Пусть не со своей фамилией, но разной :) ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 15:04 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
VingerDimkas, В том то и дело, что данные нужны ну не совсем "от балды". Некоторые из разрабатываемых задач должны работать с т.н. "двойниками". т.е. предложенный алгоритм (все гласные менять на "А") - не подходит. Голозадов и какой-нибудь Галезидев должны в итоге различаться. Пусть не со своей фамилией, но разной :)Поменяйте персональные данные на их хэш ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 15:58 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
alexeyvg, хэш похожие фамилии изменит так, что они будут совсем разными. удалять гласные (как вариант хэш) тоже не катит, при чтении без них часто можно обойтись и восстановить исходный смысл. На ум приходит шифрование, но простые шифры легко взламываются, а сложные скорее всего изменят данные так, что они будут непригодны для тестов. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 16:28 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Vinger, достаточно просто данные "отсоединить" от владельца. Если заняться нечем, то можно в принципе дополнительно отчества или имена перетасовать. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 20:44 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
iscrafmVinger, достаточно просто данные "отсоединить" от владельца. Если заняться нечем, то можно в принципе дополнительно отчества или имена перетасовать. а поможет ?... в принципе то получаем для обработки данных уже "присоединённый" вариант (а иначе смысл любых обработок теряется) что и будет изначальным до деперсонификации т.е. по-большому счету неважно как именно хранение идет - важно то что есть алгоритм (а т.е. и хранение данных перед самой обработкой) уже в нормальном персонифицированном виде ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 20:48 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Last1CmeniscrafmVinger, достаточно просто данные "отсоединить" от владельца. Если заняться нечем, то можно в принципе дополнительно отчества или имена перетасовать. а поможет ?... в чем заключается персональная информация? В том, что Петрова Ивана Николаевича геморрой 3-й степени. Не сладко ему, и знать об этом, кроме врача, никому не нужно. Что не является персональной информацией? То, что на учете есть больной с геморроем 3-й стенени. Или то, что базе присутствует сочетание Петров Иван Николаевич, каких в Яндексе только 716 000. Но гипотетическая запись о болезни привязана к какому-то Сидорову Сергею Ефремовичу... ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 21:06 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
iscrafmLast1CmeniscrafmVinger, достаточно просто данные "отсоединить" от владельца. Если заняться нечем, то можно в принципе дополнительно отчества или имена перетасовать. а поможет ?... в чем заключается персональная информация? В том, что Петрова Ивана Николаевича геморрой 3-й степени. Не сладко ему, и знать об этом, кроме врача, никому не нужно. Что не является персональной информацией? То, что на учете есть больной с геморроем 3-й стенени. Или то, что базе присутствует сочетание Петров Иван Николаевич, каких в Яндексе только 716 000. Но гипотетическая запись о болезни привязана к какому-то Сидорову Сергею Ефремовичу... я не про то что и как храниться а про то что для работы с этим прийдётся её все равно персонализировать т.е. таким образом мы опять же наступаем на грабли того что работаем с персонализированной информацией... хоть это будет и некий алгоритм, известный как думает автор только ему, но он будет и соответственно существует опасность сторонней расшифровки алогритма предварительной персонализации перед работой с конечными данными если ТС устроит то что данные просто не будут лежать в "открытом" виде то это хорошо а если это не от "дурака" то думаю не взлетит ... |
|||
:
Нравится:
Не нравится:
|
|||
17.06.2010, 22:26 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
VingerDimkas, В том то и дело, что данные нужны ну не совсем "от балды". Некоторые из разрабатываемых задач должны работать с т.н. "двойниками". т.е. предложенный алгоритм (все гласные менять на "А") - не подходит. Голозадов и какой-нибудь Галезидев должны в итоге различаться. Пусть не со своей фамилией, но разной :)А ради чего ? КОды у них все равно разные. Посмотрите, сколько в Москве "Иванов Александр". Даже отчества могут совпадать. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2010, 10:21 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
LSVА ради чего ? КОды у них все равно разные. Посмотрите, сколько в Москве "Иванов Александр". Даже отчества могут совпадать. На входе в редком случае передается Id'шник :( Если б было всё по Id - то была бы сказка)) грубо говоря есть база с фио, др, адресом и прочими радостями личной жизни. На вход приходит порядка стопятьсот тыщмильёнов записей. Идёт идентификация человека по базе не по совсем явным признакам, проверяются опечатки, подозрения на то что есть попытка закинуть одного и того же человека второй раз. что тётя, например, сменила фамилию и именно эту тётю надо обновить в базе. таким образом требования к алгоритму деперсонификации получаем: 1. Необратимость процедуры деперсонификации 2. должен отрабатывать на входных данных также как и на мирно покоящихся в базе. (Иванова Екатерина Сергеевна, 21.06.1980, село Нижняя Пыжма, улица гнилая, дом 10) должно приводить к (Зябликова Зульфия Аристарховна, 19.12.1985, город Нерезиновск, улица отличная, дом 95) в обоих случаях, но обратное не должно быть определенным. 3. Это соответствие не должно быть известно. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2010, 12:40 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Vinger(Иванова Екатерина Сергеевна, 21.06.1980, село Нижняя Пыжма, улица гнилая, дом 10) должно приводить к (Зябликова Зульфия Аристарховна, 19.12.1985, город Нерезиновск, улица отличная, дом 95) берете 2 случайные записи, меняете местами значения одного случайного поля т.е., к примеру была Иванова Екатерина Сергеевна, 21.06.1980 случайно ей в пару находим Зябликова Зульфия Аристарховна, 19.12.1985 случайно переставляем, например, отчество.. Долго, но надежно )) ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2010, 12:46 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
mcureenabalexeyvg, хэш похожие фамилии изменит так, что они будут совсем разными.А зачем вам знать, что фамилии похожи??? Непонятна тогда ваша задача. mcureenabНа ум приходит шифрование, но простые шифры легко взламываются, а сложные скорее всего изменят данные так, что они будут непригодны для тестов.Противоречие - если фамилии зашифрованны, то вы тоже не сможете понять, похожие 2 фамилии или нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.06.2010, 20:39 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
А причем здесь шифрование? Надо понизить персонификацию. Если доступ есть, то сть и к шифрам. Шифроваие от краж, ..., а не для регулирования доступа - все законопослушные предполагаются. Сейчас в ведомствах РАЗНЫХ РАЗЫЕ классификаторы расылают - какая степень персоификации. Обычно 4 степени. Самая слабая 4-ая - какие-то данные, но невозможно опрделить к кому они относотся. 3-ая - определено кто и что и дана информация, но выйти на какие-то дополительные сведения по персоне (человек или группа или организация или ...) невозможо. Так отделить персонификацию от самих данных. Понизить степень через декомпозицию - на две подсистемы типа 3 и 4 вместо одной типа 1 или 2. Есть мысль!! В медицине уже были инициативы - вместо 'ФИО, даты рождеия, адреса, места работы, ...' давать в клиниках код на время лечения и буквально выдавать таблички, которые носит с собой, а перед врачом и всем медперсоналом и прочим персоналом есть как бы просто тело с идетификационным кодом (неизвестно - кто и что и почему и ...). Но вполне понято - почему такое не прошло (как то, что человек человеку рознь и человеку более важно, чтобы его узнали, чем был инкогито, а также когда обезличены, то ко всем отношеие как к быдлу, чем как к, например, бизнес-элите, а также несовершенство и усложнеие учета при такой форме, ...). ... |
|||
:
Нравится:
Не нравится:
|
|||
20.06.2010, 09:38 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
всё это игры российских масштабов, такие как ЕГАИС. Вот когда на рынке перестанут появляться БД ворованные с министреств, тогда можно всерьёз рассуждать о сабже. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.06.2010, 09:27 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
если морфология не нужна то ФИО просто заменяете на произвольно генеренные числа. (в зависимости от диапазона совпадения будут - то есть как в жизни) для удобства чтения можно создать маленький список фио например Иванов, Петров, Сидоров, Орлов (штук 20) и дальше генерить фамилию как рандом слово из списка+число те. вида Иванов123 просто менять местами наверно нехорошо так как кто нить может докопаться до каких нить редких фамилий ... |
|||
:
Нравится:
Не нравится:
|
|||
21.06.2010, 11:52 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
fleandr, адрес \ телефон \ ... вы думаете менее персональные? ... |
|||
:
Нравится:
Не нравится:
|
|||
21.06.2010, 12:20 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
думаю да... понятно что изменять надо все.я привел ФИО как более сложный пример с адресом просто - телефон генерировать произвольно - все цифры в адресе - менять произвольно 100% хватит. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.06.2010, 12:59 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
AlexandrPlusА причем здесь шифрование? Ну ка же? Мы меняем одни данные на другие по какому то закону. Если закон известен и легко обратим, то усилия вылетят в трубу. Конечно тут неклассическая постановка задачи шифрования, поэтому ряд ограничений можно игнорировать и сделать более устойчивый алгоритм шифрования. Однако, теоретическая база должна быть очень похожа. AlexandrPlusВ медицине уже были инициативы - вместо 'ФИО, даты рождеия, адреса, места работы, ...' давать в клиниках код на время лечения и буквально выдавать таблички... Полагаю, это впринципе не всегда катит. Например больничный, выданный на "табличку" вряд ли устроит работодателя. Мало ли кто там с табличкой по больнице ходил. Разделение БД тут не подходит, поскольку речь идёт о данных в одной и той же БД. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.06.2010, 13:14 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
mcureenabAlexandrPlusА причем здесь шифрование? Ну ка же? Мы меняем одни данные на другие по какому то закону. Если закон известен и легко обратим, то усилия вылетят в трубу. Конечно тут неклассическая постановка задачи шифрования, поэтому ряд ограничений можно игнорировать и сделать более устойчивый алгоритм шифрования. Однако, теоретическая база должна быть очень похожа. AlexandrPlusВ медицине уже были инициативы - вместо 'ФИО, даты рождеия, адреса, места работы, ...' давать в клиниках код на время лечения и буквально выдавать таблички... Полагаю, это впринципе не всегда катит. Например больничный, выданный на "табличку" вряд ли устроит работодателя. Мало ли кто там с табличкой по больнице ходил. Разделение БД тут не подходит, поскольку речь идёт о данных в одной и той же БД. В законе про персональные данные - про защиту и доступ вообще. А если смогут украсть или злонамеренно или по преступной халатности испортить данные, то украдут и шифры и программы дешифрации, и испортят зашифрованные данные. Про таблички, жетончики, ... - это внутри клиники на время пребывания. То есть именно ДЕПЕРСОНИФИЦИРОВАНИЕ - чтобы все, кому не попадя, не могли достать сведения о пациенте, когда тот в больнице. Только ограниченный круг лиц может по жетону узнать все и оформить нужные документы при поступлении, при пребывании и при выписке. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.06.2010, 17:30 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Vinger, можно взять температуру за окном как исходное случайное число R, прибавлять к IDшнику пациента и вместо символа S ставить S1=S+((ID+R)%32), а с циырами брать ...%10 Можно добавить туда сегодняшнюю дату, вычесть твой номер паспорта, разделить на день рождения тещи и тд. Для отладки хватит ... |
|||
:
Нравится:
Не нравится:
|
|||
21.06.2010, 22:24 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
VingerЕсть проблема. Всвязи с законом о защите персональных данных использовать хоть и устаревшие, но ,тем не менее, персональные данные для целей разработки (СУБД, работающая для разработки и тестирования всего и вся) не представляется возможным. Данные, естественно, нужны. Все данные очень персональные (медицина). Для успокоения службы безопасности их необходимо деперсонифицировать. Какие существуют алгоритмы? Сталкивался кто-либо с деперсонификацией на практике? гугль не предлагать. скажите пожалуйста, а как тогда реализовать схему: поиск человека по номеру полиса? Нужно найти его адрес и так далее, причем срочно, иначе человек умрет. П.С. Помоему с защитой данных должно быть очень просто: расписавшись, человек разрешает использование своих данных для обработки. Существующие данные уже автоматически попадают под правило: "разрешено обрабатывать, пока конкретный человек не запретил". Получить разрешение у сотен тысяч на использование как бы нереально. Как человек, работавшиой с медициной, меня очень интересует этот вопрос. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.06.2010, 11:30 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Интересующийся этим скажите пожалуйста, а как тогда реализовать схему: поиск человека по номеру полиса? Нужно найти его адрес и так далее, причем срочно, иначе человек умрет. П.С. Помоему с защитой данных должно быть очень просто: расписавшись, человек разрешает использование своих данных для обработки. Существующие данные уже автоматически попадают под правило: "разрешено обрабатывать, пока конкретный человек не запретил". Получить разрешение у сотен тысяч на использование как бы нереально. Как человек, работавшиой с медициной, меня очень интересует этот вопрос. А здесь речь идёт не о продуктивных данных, а об их выгрузке для целей разработки и отладки. Основные данные остаются прежними, просто сеть в которой они будут обрабатываться должна быть вычищена от средств разработки и отладки. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.06.2010, 12:18 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Интересующийся этимСуществующие данные уже автоматически попадают под правило: "разрешено обрабатывать, пока конкретный человек не запретил". Что значит "обрабатывать"? Публиковать в интернете, это тоже как бы обрабатывать. С другой стороны, если чел не разрешил использовать его персональные данные, то не ясно, как с ним иметь дело. Интересующийся этимПолучить разрешение у сотен тысяч на использование как бы нереально. Если разрешения не получены, то конечно собирать их будет проблематично, да и не ясно зачем. "Иных уж нет, а те далече." А с каждого посетителя получить согласие с заявлением о конфиденциальности вполне реально. Впринципе, пока дело не касается формальностей (справки для учереждений, договора, больничные), чел может указать любые вымышленные данные, лишь бы он сам их не забыл. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.06.2010, 12:43 |
|
Деперсонификация персональных данных
|
|||
---|---|---|---|
#18+
Vinger А здесь речь идёт не о продуктивных данных, а об их выгрузке для целей разработки и отладки. Основные данные остаются прежними, просто сеть в которой они будут обрабатываться должна быть вычищена от средств разработки и отладки. ИМХО запросами можно изменить на рандомное число даты рождения, номера полисов и.т.д.. аналогично можно фамилиям изменить имя и отчество в итоге буду нормальные данные, но в которых не будет информации о реальных людях по которым вполне можно отладить всякие алгоритмы... поиска дублей и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.06.2010, 16:22 |
|
|
start [/forum/topic.php?fid=33&fpage=32&tid=1548270]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
54ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
61ms |
get tp. blocked users: |
2ms |
others: | 295ms |
total: | 459ms |
0 / 0 |