powered by simpleCommunicator - 2.0.48     © 2025 Programmizd 02
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Очистка данных в базе данных
11 сообщений из 11, страница 1 из 1
Очистка данных в базе данных
    #39864971
Student191
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте. Подскажите, пожалуйста. Есть база данных из 15 тысяч строк и 50 признаков. Нужно "очистить" данные, как это сделать?
Там есть и просто текст (например, образование), и возраст, и другие данные. С чего начать "подготовку"? Помогите, пожалуйста, советом, очень нужно!!!!
Заранее спасибо
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39864974
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Student191С чего начать "подготовку"?С того, чтобы сделать бэкап. Чтобы не было мучительно
больно когда за исчезновение данных будут бить.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39865076
Фотография полудух
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Student191Есть база данных из 15 тысяч строк и 50 признаков.
это в таблицах строки
а в базах данных таблицы
Нужно "очистить" данные, как это сделать?
Код: sql
1.
TRUNCATE table_name;
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39865108
L_argo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Речь про очистку полей от ценной инфы, без удаления записей ?

Тогда что-то вроде:

UPDATE MyTable
set
Field1 = null,
Field2 = null,
Field3 = null,
Field4 = null,
....

или некое "пустое значение", если поле требует непустоты.

пысы: ну и вопрос....ппц просто....
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39865117
Gerros
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Student191,

1. составить требования к чистым данным - что где и в каком формате должно храниться.
2. придумать какие-то простенькие алгоритмы, которые из грязных данных как-то примерно извлекают чистые в большинстве случаев.
3. написать клиентское приложение, которое построчно проходит по базе, и отображает оператору грязные данные и очищенные алгоритмами из второго пункта. Оператор в приложении либо подтверждает правильность извлечения данных, либо исправляет руками и подтверждает, либо помечает строку как пропущенную и оставляет её для уточнения с владельцем данных или начальством или кем-то ещё.
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39865261
Student191
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Gerros,

да именно это и надо. Ох, сложновато звучит...А можете проконсультировать в лс на примере хотя бы одного параметра? Пожалуйста
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39865266
Gerros
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Student191,

Пришлите фрагмент исходных данных на почту в профиле.
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39865283
Student191
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Gerros,

прислала, правда, всю таблицу, посмотрите, какой более-менее нормальный параметр там...
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39869878
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Student191Здравствуйте. Подскажите, пожалуйста. Есть база данных из 15 тысяч строк и 50 признаков. Нужно "очистить" данные, как это сделать?
Там есть и просто текст (например, образование), и возраст, и другие данные. С чего начать "подготовку"? Помогите, пожалуйста, советом, очень нужно!!!!
Заранее спасибо

Не нужно.
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39876622
Александр Бердышев
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Кстати, да.
В таблице данные оставьте в таком виде и не трогайте - это будет таблица исходных данных, она должна быть неизменна - чтобы было что смотреть, когда лишнего отчистите.

Для чистых данных нужна будет ещё одна таблица.

Потом составляете список, что считать шумом в данных.
Пишите список эвристик, на которые будете опираться при очистке данных. Лучше добавить их на какое-нибудь корпоративное wiki.

Чистить данные в несколько шагов.
1. Удалить лишние/дублирующиеся строки.
2. Поправить данные в полях, если это можно сделать опираясь на другие поля.
3. Попытаться как-то сагрегировать данные.

Так же нужна будет отдельная проверка "чистых" данных - что они действительно чистые.

Может часть данных придётся выводить на ручную проверку.
...
Рейтинг: 0 / 0
Очистка данных в базе данных
    #39876625
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Student191Здравствуйте. Подскажите, пожалуйста. Есть база данных из 15 тысяч строк и 50 признаков. Нужно "очистить" данные, как это сделать?
Там есть и просто текст (например, образование), и возраст, и другие данные. С чего начать "подготовку"? Помогите, пожалуйста, советом, очень нужно!!!!
Заранее спасибо
Обычно удяляет данные человек отвественный. Например - владелец бизнеса. Если вы удалите и чего-то
напортачите а бэкап как всегда был нерабочий уже 2 года - то вас будут бить больно.

Хороший совет - перед удалением написать скрипты и показать их и их результат ответственному.
Особенно с этими 50 так называемыми признаками. Что-то здесь в этой постановке плохо... Расплывчато...
Как говорил мой военрук - нижуя непонятно.

Еще также хороший совет сделать дамп этой таблицы и ее зависимых во внешние файлы. И хранить
дамп хотя-бы лет 5.
...
Рейтинг: 0 / 0
11 сообщений из 11, страница 1 из 1
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Очистка данных в базе данных
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]