Гость
Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / Двоичные данные / 6 сообщений из 6, страница 1 из 1
20.07.2015, 14:39
    #39011413
Дмит
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Двоичные данные
Попалось необычное задание.
Сушествует несколько файлов mdb, в них таблицы со столбцом содержащим двоичные данные. Посути это файлы БД из разных подразделений, размером 1000-5000 строк.
Необходимо слить эти таблицы в одну, удалив повторяющиеся строки (по этим самым двоичным данным).
Прошу подать идею, как это можно, оптимально сделать.
...
Рейтинг: 0 / 0
20.07.2015, 16:05
    #39011541
Akina
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Двоичные данные
Сделать БД с такой таблицей и 3-4 различающимися записями в ней, все остальные объекты удалить. Сжать и зазиповать. Приложить к сообщению.
...
Рейтинг: 0 / 0
21.07.2015, 08:14
    #39011857
Дмит
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Двоичные данные
В примере больше двух записей не смог поместить из-за размера, поскольку двоичные данные - это графические файлы.
...
Рейтинг: 0 / 0
22.07.2015, 07:56
    #39012940
hclubmk
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Двоичные данные
Вычисляй хэш, сравнивай и удаляй если надо
...
Рейтинг: 0 / 0
24.07.2015, 09:37
    #39015094
Дмит
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Двоичные данные
Проанализировал файлы и пришёл к выводу, что вычисление хэша не нужно. Достаточно сравнить размер поля двоичных данных. Все поля разные по размеру.
Алгоритм верификации простым перебором, долго но терпимо :)
...
Рейтинг: 0 / 0
24.07.2015, 10:22
    #39015128
hclubmk
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Двоичные данные
Дмитвычисление хэша не нужно. Достаточно сравнить размер поля двоичных данных. Все поля разные по размеру Это неправильный подход - опираться только на размер данных. Да и хэш было бы неплохо считать несколькими различными алгоритмами.
...
Рейтинг: 0 / 0
Форумы / Microsoft Office [игнор отключен] [закрыт для гостей] / Двоичные данные / 6 сообщений из 6, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]