Интересный вопрос на оптимальный алгоритм / WinForms, .Net Framework

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Интересный вопрос на оптимальный алгоритм

5 сообщений из 30, страница 2 из 2

все

Интересный вопрос на оптимальный алгоритм

#38614165

Изопропил

Участник

Сообщения: 33 046

Рейтинг: 0 / 0

Students,

можешь искать по слову diff

...

Рейтинг:

0 / 0

14.04.2014, 13:35

| Ответить | Цитировать | Написать

Интересный вопрос на оптимальный алгоритм

#38614311

bazile

Участник

Сообщения: 3 121

Рейтинг: 0 / 0

Studentsалгоритм есть здесь
http://en.wikipedia.org/wiki/Longest_common_subsequence_problem
Кто-нибудь знает, как он по-русски называется?
В левой колонке есть ссылка на русский вариант - "Наибольшая общая подпоследовательность".

Studentsработает быстрее, чем перебор байт-за-байтом.
Строго говоря здесь тоже идет перебор байта за байтом :) Быстрее он будет работать потому что делает меньше вычислений. Однако, чтобы сравнивать два файла нам нужно иметь их рядом. Ты же говоришь о задаче сравнения двух файлов находящихся на разных компьютерах в которолй нужно съэкономить сетевой трафик и минимизировать общее время на задачу (поиск разных кусков + передача по сети). При такой постановке алгоритм rsync будет эффективнее на мой взгляд.

...

Рейтинг:

0 / 0

14.04.2014, 15:17

| Ответить | Цитировать | Написать

Интересный вопрос на оптимальный алгоритм

#38614351

Students

Участник

Сообщения: 1 174

Рейтинг: 0 / 0

ясно, спасибо.

rsync сейчас как раз и используется. Основная проблема в том, что приходится перебирать "байт-за-байтом" огромных файлов, например, 30ГБ.

...

Рейтинг:

0 / 0

14.04.2014, 15:34

| Ответить | Цитировать | Написать

Интересный вопрос на оптимальный алгоритм

#38614421

bazile

Участник

Сообщения: 3 121

Рейтинг: 0 / 0

Students, перебор байз за байтом это не проблема. Тебе в любом случае придется это делать так или иначе. Если бы файловая система сохраняла список изменений сделанных в файле, то тогда перебор содержимого файла для поиска изменений был бы не нужен. Файловые системы FAT/NTFS этого не делают. Значит остается только перебор всего содержимого. Если для тебя это проблема, то заливай всегда файл целиком. Все просто и никаких "проблем".

Вообще складывается впечатление что ты не понимаешь на оптимизицию чего направлены алгоритмы типа rsync. Мы стремимся уменьшить сетевой трафик и _общее_ время на передачу файла. Даже если я потрачу 5 минут на поиск отличий в файле, но съэкономлю 30 минут на передачу - это все равно выигрыш. При желании можно сделать службу которая будет следить за изменениями в файлах, пересчитывать хеши в фоновом режиме и сохранять их. При таком подходе многие хеши уже будут готовы на момент начала синхронизации.

...

Рейтинг:

0 / 0

14.04.2014, 16:20

| Ответить | Цитировать | Написать

Интересный вопрос на оптимальный алгоритм

#38614430

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

StudentsОсновная проблема в том, что приходится перебирать "байт-за-байтом" огромных файлов, например, 30ГБ.
Я искренне не понимаю, в чем проблема.

Вот вы перед загрузкой определяете хэши и, убедившись, что на сервер файла нет, загружаете его. Кто вам мешает эти хэши тоже грузить и хранить их? Тогда, при следующей загрузке, вы считаете хэши только на клиенте, не грузя сервер, и сравниваете эти хэши с сохраненными на сервере.

Даже более того, перед подсчетом хэшей можете сначала попробовать сравнить нерасчетные признаки, например, длина файла, тип файла.

Про огромные файлы и MMF я вам уже сказал.

...

Рейтинг:

0 / 0

14.04.2014, 16:25

| Ответить | Цитировать | Написать

5 сообщений из 30, страница 2 из 2

все

Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Интересный вопрос на оптимальный алгоритм

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=20&msg=38614430&tid=1403041]:	0ms
get settings:	10ms
get forum list:	15ms
check forum access:	3ms
check topic access:	3ms
track hit:	238ms
get topic data:	12ms
get forum data:	3ms
get page messages:	41ms
get tp. blocked users:	1ms
others:	336ms

total:	662ms