Гость
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Очистка данных в базе данных / 11 сообщений из 11, страница 1 из 1
21.09.2019, 12:54
    #39864971
Student191
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Здравствуйте. Подскажите, пожалуйста. Есть база данных из 15 тысяч строк и 50 признаков. Нужно "очистить" данные, как это сделать?
Там есть и просто текст (например, образование), и возраст, и другие данные. С чего начать "подготовку"? Помогите, пожалуйста, советом, очень нужно!!!!
Заранее спасибо
...
Рейтинг: 0 / 0
21.09.2019, 12:59
    #39864974
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Student191С чего начать "подготовку"?С того, чтобы сделать бэкап. Чтобы не было мучительно
больно когда за исчезновение данных будут бить.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
21.09.2019, 19:09
    #39865076
полудух
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Student191Есть база данных из 15 тысяч строк и 50 признаков.
это в таблицах строки
а в базах данных таблицы
Нужно "очистить" данные, как это сделать?
Код: sql
1.
TRUNCATE table_name;
...
Рейтинг: 0 / 0
21.09.2019, 21:57
    #39865108
L_argo
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Речь про очистку полей от ценной инфы, без удаления записей ?

Тогда что-то вроде:

UPDATE MyTable
set
Field1 = null,
Field2 = null,
Field3 = null,
Field4 = null,
....

или некое "пустое значение", если поле требует непустоты.

пысы: ну и вопрос....ппц просто....
...
Рейтинг: 0 / 0
21.09.2019, 22:32
    #39865117
Gerros
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Student191,

1. составить требования к чистым данным - что где и в каком формате должно храниться.
2. придумать какие-то простенькие алгоритмы, которые из грязных данных как-то примерно извлекают чистые в большинстве случаев.
3. написать клиентское приложение, которое построчно проходит по базе, и отображает оператору грязные данные и очищенные алгоритмами из второго пункта. Оператор в приложении либо подтверждает правильность извлечения данных, либо исправляет руками и подтверждает, либо помечает строку как пропущенную и оставляет её для уточнения с владельцем данных или начальством или кем-то ещё.
...
Рейтинг: 0 / 0
22.09.2019, 18:22
    #39865261
Student191
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Gerros,

да именно это и надо. Ох, сложновато звучит...А можете проконсультировать в лс на примере хотя бы одного параметра? Пожалуйста
...
Рейтинг: 0 / 0
22.09.2019, 18:47
    #39865266
Gerros
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Student191,

Пришлите фрагмент исходных данных на почту в профиле.
...
Рейтинг: 0 / 0
22.09.2019, 19:34
    #39865283
Student191
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Gerros,

прислала, правда, всю таблицу, посмотрите, какой более-менее нормальный параметр там...
...
Рейтинг: 0 / 0
01.10.2019, 12:53
    #39869878
MasterZiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Student191Здравствуйте. Подскажите, пожалуйста. Есть база данных из 15 тысяч строк и 50 признаков. Нужно "очистить" данные, как это сделать?
Там есть и просто текст (например, образование), и возраст, и другие данные. С чего начать "подготовку"? Помогите, пожалуйста, советом, очень нужно!!!!
Заранее спасибо

Не нужно.
...
Рейтинг: 0 / 0
15.10.2019, 15:17
    #39876622
Александр Бердышев
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Кстати, да.
В таблице данные оставьте в таком виде и не трогайте - это будет таблица исходных данных, она должна быть неизменна - чтобы было что смотреть, когда лишнего отчистите.

Для чистых данных нужна будет ещё одна таблица.

Потом составляете список, что считать шумом в данных.
Пишите список эвристик, на которые будете опираться при очистке данных. Лучше добавить их на какое-нибудь корпоративное wiki.

Чистить данные в несколько шагов.
1. Удалить лишние/дублирующиеся строки.
2. Поправить данные в полях, если это можно сделать опираясь на другие поля.
3. Попытаться как-то сагрегировать данные.

Так же нужна будет отдельная проверка "чистых" данных - что они действительно чистые.

Может часть данных придётся выводить на ручную проверку.
...
Рейтинг: 0 / 0
15.10.2019, 15:24
    #39876625
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Очистка данных в базе данных
Student191Здравствуйте. Подскажите, пожалуйста. Есть база данных из 15 тысяч строк и 50 признаков. Нужно "очистить" данные, как это сделать?
Там есть и просто текст (например, образование), и возраст, и другие данные. С чего начать "подготовку"? Помогите, пожалуйста, советом, очень нужно!!!!
Заранее спасибо
Обычно удяляет данные человек отвественный. Например - владелец бизнеса. Если вы удалите и чего-то
напортачите а бэкап как всегда был нерабочий уже 2 года - то вас будут бить больно.

Хороший совет - перед удалением написать скрипты и показать их и их результат ответственному.
Особенно с этими 50 так называемыми признаками. Что-то здесь в этой постановке плохо... Расплывчато...
Как говорил мой военрук - нижуя непонятно.

Еще также хороший совет сделать дамп этой таблицы и ее зависимых во внешние файлы. И хранить
дамп хотя-бы лет 5.
...
Рейтинг: 0 / 0
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Очистка данных в базе данных / 11 сообщений из 11, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]