|
Двоичные данные
|
|||
---|---|---|---|
#18+
Попалось необычное задание. Сушествует несколько файлов mdb, в них таблицы со столбцом содержащим двоичные данные. Посути это файлы БД из разных подразделений, размером 1000-5000 строк. Необходимо слить эти таблицы в одну, удалив повторяющиеся строки (по этим самым двоичным данным). Прошу подать идею, как это можно, оптимально сделать. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.07.2015, 14:39 |
|
Двоичные данные
|
|||
---|---|---|---|
#18+
Сделать БД с такой таблицей и 3-4 различающимися записями в ней, все остальные объекты удалить. Сжать и зазиповать. Приложить к сообщению. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.07.2015, 16:05 |
|
Двоичные данные
|
|||
---|---|---|---|
#18+
В примере больше двух записей не смог поместить из-за размера, поскольку двоичные данные - это графические файлы. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.07.2015, 08:14 |
|
Двоичные данные
|
|||
---|---|---|---|
#18+
Вычисляй хэш, сравнивай и удаляй если надо ... |
|||
:
Нравится:
Не нравится:
|
|||
22.07.2015, 07:56 |
|
Двоичные данные
|
|||
---|---|---|---|
#18+
Проанализировал файлы и пришёл к выводу, что вычисление хэша не нужно. Достаточно сравнить размер поля двоичных данных. Все поля разные по размеру. Алгоритм верификации простым перебором, долго но терпимо :) ... |
|||
:
Нравится:
Не нравится:
|
|||
24.07.2015, 09:37 |
|
Двоичные данные
|
|||
---|---|---|---|
#18+
Дмитвычисление хэша не нужно. Достаточно сравнить размер поля двоичных данных. Все поля разные по размеру Это неправильный подход - опираться только на размер данных. Да и хэш было бы неплохо считать несколькими различными алгоритмами. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.07.2015, 10:22 |
|
|
start [/forum/topic.php?fid=61&fpage=44&tid=2173422]: |
0ms |
get settings: |
9ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
33ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
43ms |
get tp. blocked users: |
2ms |
others: | 288ms |
total: | 413ms |
0 / 0 |