|
|
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Попалась задачка. Есть ее решение. Но не могу понять хоть убей, как ее решает автор. Пожалуйста помогите. Растолкуйте решение. http://www.lotos-khv.narod.ru/dist/lek6.htm ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 18:34 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Ее автор - хабаровская "школа программистов". Она и должна растолковывать и пояснять потоки своего сознания. При чём здесь sql.ru - непонятно. P.S. Просто мнение.... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 19:11 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Высосали проблему из пальца. При известной нижней границе "наименьшее отсутствующее" или "ничего" или "нижняя граница". Соответственно, требуется проверить, есть ли в выборке число, равное нижней границе. Один проход. Даже если переформулировать идиотскую формулировку - всё равно один проход. Без всяких сортировок. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:08 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovПри известной нижней границе "наименьшее отсутствующее" или "ничего" или "нижняя граница".Это почему же? Вполне может быть, что "нижняя граница" занята, а "наименьшее отсутствующее" где-то больше. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:15 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
miksoftВполне может быть, что "нижняя граница" занята, а "наименьшее отсутствующее" где-то больше.Да, в этой формулировке больше похоже на правду, но это всё равно один проход. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:25 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovДа, в этой формулировке больше похоже на правду, но это всё равно один проход.Два. Первый на поиск наименьшего, второй - на поиск дырки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:27 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovmiksoftВполне может быть, что "нижняя граница" занята, а "наименьшее отсутствующее" где-то больше.Да, в этой формулировке больше похоже на правду, но это всё равно один проход.Числа не отсортированы. Как? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:27 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
miksoftЧисла не отсортированы. Как?Как искать наименьшее в один проход? Сравнивать очередного кандидата с уже найденным претендентом. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:30 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Задача ниочем авторИз числового интервала от единицы до миллиарда выбираются случайным образом без повторений миллион чисел и записываются в файл. Необходимо за приемлемое время выяснить, какое наименьшее число отсутствует в файле. Использовать массивы или иные структуры данных, их заменяющие, запрещается. Там в решении предлагается сначала отсортировать, затем искать дырки между соседними. Алгоритмы сортировки в куче источников описаны. Только наполнение 0,1% (миллион из миллиарда), т.е. вероятность 1000 к 1 что нет первого, поэтому можно тупо перебирать 1,2,3,4,5, сканировать весь файл и с большой вероятностью получить отсутствующее за несколько проходов. Скорость чтения со среднего диска 70-80 Мб/сек, т.е. 4Мб (миллион int`ов) прочитаются 20 раз в секунду . Можно предположить случай что последовательность 1-999`999 непрерывна, затем 1`000`001, тогда потребуется 13-14 часов, но это из области невероятного, т.к. генератор случайных чисел не дает такие последовательности. Даже если так и изначально прочитать в память (в кэш проца все войдет), то 4000-8000 сканов в секунду или 3-5 минут в худшем случае, задача параллелится и на 4 ядрах можно за минуту уложиться. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:31 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovmiksoftЧисла не отсортированы. Как?Как искать наименьшее в один проход? Сравнивать очередного кандидата с уже найденным претендентом.Вы совсем не вчитались в задачу. Ищется не наименьшее присутствующее, а наименьшее отсутствующее. В файле вполне могут быть числа 1,2,3, ... 1000, 1002, ... (только в произвольном порядке). А 1001 нужно найти. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:33 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima TТам в решении предлагается сначала отсортироватьСортировка нужна для поиска медианы. Для поиска граничных значений сортировка избыточна. После того, как граничное значение известно - поиск дырки становится тривиальным. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:36 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Basil A. SidorovПосле того, как граничное значение известно - поиск дырки становится тривиальным.Погорячился. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:38 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima T, Решение "в лоб" можно ускорить тем, что переписать из исходного в промежуточный файл числа, которые меньше или равны миллиону. При равномерном распределении чисел это даст сокращение объема файла в тысячу раз. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:40 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
miksoftDima T, Решение "в лоб" можно ускорить тем, что переписать из исходного в промежуточный файл числа, которые меньше или равны миллиону. При равномерном распределении чисел это даст сокращение объема файла в тысячу раз. можно 1000 если будет 1000, то следующую 1000 и т.д. пока меньше 1000 за раз не считается. Случайное распределение заданное в ТЗ тоже надо использовать. 1000 условно, точнее его можно рассчитать из скорости записи и чтения файла и параметра "приемлемое время" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 20:47 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Миллион четырёхбайтовых чисел - меньше четырёх мегабайт. Даже в рамках идиотских ограничений сортировка миллиона чисел не может дать миллиарды файловых операций. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 21:59 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maxtravПопалась задачка. Есть ее решение. Но не могу понять хоть убей, как ее решает автор. Пожалуйста помогите. Растолкуйте решение. http://www.lotos-khv.narod.ru/dist/lek6.htm Больше всего улыбнуло желание автора статьи доказать свою правоту, а потому "неудачные" решения расчитываются исходя их миллиарда элементов, а удачное - из миллиона. Круто конечно ))) откуда взято число миллиард?! Да от балды... Перефразирую. В файле записаны 1'000'000 чисел из интервала 1 - 1'000'001 в случайном порядке. Найти пропущенное число. Как уже сказали, и в том и в другом случае будет как минимум одно число пропущено, нам осталось его найти. Вот теперь оцениваем задачу правильно. :) В итоге представленное решение (точнее идея) неплохое. Хотя я предложу немного лучше :) Я по подобному принципу (на основании, кстати, метода быстрой сортировки) сортировал все числа у себя в программках (когда учился или участвовал в олимпиадах). Сортировка разумеется была побитная (то есть меняем местами числа, если число с соответствующим битом равным 1 стоит левее числа с тем же битом равным нулю. Таким образом рекурсия уходит максимум на n уровней, где n - число бит в числе) Отвлёкся :) Итак... поясняю решение автора: У нас есть миллион чисел, которыми можно заполнить без пробелов только миллион первых позиций. Потому, если есть пробел, то он находится в позиции от 1 до 1000000. Этот интервал мы и проверяем. Берём число 500000, начинаем читать файл и сравнивать каждое число с данным. Если прочитанное из файла меньше - прибавляем 1 к счётчику. Если в итоге счётчик равен 500000 - значит первые пол миллиона позиций заполнены без пробелов и нас интересует вторая половина миллиона. Итак, когда мы узнали в какой половине миллиона интересующий нас пропуск, повторяем то же действие для соответствующей половины миллиона, и делим ещё на 2 интервала... и так пока у нас не останется интервал в 1... именно он и будет нашим искомым пропуском. Это всё нормальными словами и без лишних действий, которые он описал... Не буду сильно комментировать его решение... из недостатков отмечу - он говорит о миллиардах операций, зато его программа сама вынуждена провести чтение 20'000'000 чисел по 4 байта (при чтении с диска в 512 байт, то есть по одному сектору, это будет около 16000 операций чтения). Замечу что методу быстрой сортировки потребуется приблизительно столько же... просто у него ещё будут затраты на запись чисел в их новые позиции. На практике такая задача решилась бы в разы легче (мной по крайней мере). Я бы завёл файл на миллион байт и заполнил бы его нулями. А потом читая число из первого файла, выставлял бы байт во втором файле с соответствующим смещением в единицу (можно и с битами работать конечно, но тут вопрос простоты реализации. С битами не удобно работать). В итоге, задача свелась бы к чтению и записи миллиона чисел. После записи второго файла читаем его побайтово и смещении байта со значением 0 даёт нам искомое число (пропущенную позицию). Кстати... на практике не бывает ограничения "не использовать массивы". :) А учитывая метод решения, если заюзать массив как напрерывный набор двоичных флагов, то и памяти на такой массив потребуется 8МБ. Большинству даже вэб приложений такое количество памяти спокойно выделяется (им выделяется даже в разы больше). Потому правильно тут сказали, при разумных ограничениях задача решаема в 2 прохода... 1 - пишем массив, второй - ищем пропуск. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 22:52 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
что то мне кажется автор там слишком мудрит так же непонятно ограничение на массивы, сам он вполне их использует видимо имеется ввиду что весь файл напрямую в массив загонять нельзя если так, то достаточно выполнить подсчёт пройдясь по всему файлу Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. и уже дальше анализировать в этом русле решить задачу наверное будет легче ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2014, 23:18 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Ограничение на "неиспользование" массивов выглядит весьма странно. Особенно на фоне сортировок. Ну... на малых выборки объёмах можно было задействовать массив с биткартой. Идея - похожа на поиск неуникального целого числа в потоке целых. А на больших объёмах - merge-сортировкой и 1 проходом по результату. Или - гибридный вариант. Биткарта (по оценке) превышает memory двукратно - бъём диапазон на два поддиапазона. И в два прохода находим дырку в "биткарте". Всяко лучше чем сортировка. Кстати совершенно напрасно автор ограничился типом integer... :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 00:46 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Тьфу ты, спать надо по ночам простая задача, там действительно не надо массивов, щас время появится накатаю решение ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 06:03 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
никакой сортировки там не надо просто пройтись по файлу с подсчётом Log2(MaxN) раз Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 06:49 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonЕе автор - хабаровская "школа программистов". Она и должна растолковывать и пояснять потоки своего сознания. При чём здесь sql.ru - непонятно. именно в кавычках, поддерживаю miksoftВы совсем не вчитались в задачу. Ужасная постановка задачи. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 06:56 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
ПрограмёрБольше всего улыбнуло желание автора статьи доказать свою правоту, а потому "неудачные" решения расчитываются исходя их миллиарда элементов, а удачное - из миллиона. Круто конечно ))) откуда взято число миллиард?! Да от балды... Перефразирую. В файле записаны 1'000'000 чисел из интервала 1 - 1'000'001 в случайном порядке. Найти пропущенное число. Как уже сказали, и в том и в другом случае будет как минимум одно число пропущено, нам осталось его найти. такая постановка решается очень просто :), код примерно такой: Код: plaintext 1. 2. 3. 4. 5. 6. 7. если индексы не напутал, но смысл думаю понятен :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 07:11 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
гадкое решение ужасно поставленной задачиПоделим миллиардный интервал на два интервала по 500 миллионов. Где может находиться искомое число? Очевидно, в первом, так как 500-миллионный интервал миллионом чисел не заполнить. Теперь поделим первый 500-миллионный интервал на два и т. д. Рано или поздно заключение о том, что интервал, содержащий искомое число, будет первым, окажется несправедливым. Поэтому давайте для любой пары интервалов разработаем более универсальный метод. а где в постановке задачи написано что все числа должны быть подряд ????? ужасная постановка задачиИз числового интервала от единицы до миллиарда выбираются случайным образом без повторений миллион чисел и записываются в файл. Необходимо за приемлемое время выяснить, какое наименьшее число отсутствует в файле. Использовать массивы или иные структуры данных, их заменяющие, запрещается. а если они подряд, то можно найти мак и мин, и сделать через код приведённый мной выше. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 07:18 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
SashaMercury, для олимпиады задача вполне нормальная автора где в постановке задачи написано что все числа должны быть подряд ????? как раз написано обратное авторИз числового интервала от единицы до миллиарда выбираются случайным образом без повторений миллион чисел и записываются в файл авторНеобходимо за приемлемое время выяснить, какое наименьшее число отсутствует в файле. т.е. нет если в файле 1 - значит единица задача на бинарный поиск - сложность C(log(N)*N), где N - количество цифр в файле я правда в начальных условиях погорячился Код: pascal 1. 2. достаточно Код: pascal 1. 2. искомое число может быть в интервале [1..N+1] никаких сортировок тут делать не нужно ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 08:54 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maxtrav, Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. подобные задачи решаю поиском в строке здесь сложность --в длине строки(1000000 по 6 символов и 2 разделителя=8млн символов), несколько меньше с учетом длины числа количество чиселзначностьразделители91 цифра2902290032900042900005290000062 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 09:11 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
ПЕНСИОНЕРКАmaxtrav, [src VB] Sub w140513_0845() Dim s1, s2, j1, j2 ''Выборка из миллиарда '' ''Условие задачи. '' ''Из числового интервала от единицы до миллиарда выбираются случайным образом без ''повторений миллион чисел и записываются в файл. ''Необходимо за приемлемое время выяснить, какое наименьшее число отсутствует в файле. ''Использовать массивы или иные структуры данных, их заменяющие, запрещается. а по вашему строка из кучи символов это не массив? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 09:24 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan), нет, это файл на диске, согласно условию задачиавторповторений миллион чисел и записываются в файл. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 09:34 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
ПЕНСИОНЕРКАkealon(Ruslan), нет, это файл на диске, согласно условию задачиавторповторений миллион чисел и записываются в файл. и вы его полностью в строку решили загрузить? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 09:41 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Может я чего не понял, но по-моему все тривиально - объявляется интервал с нижней и верхней границей 1..1000000000. Потом идется по файлу. Если встреченное число рано нижней границе к нижней границе прибавляется 1 , если меньше верхней, верхняя равна встреченному числу. Если нижняя граница становится равна верхней, начинаем заново, но нижней границе+1, а верхнюю опять делаем опять 1000000000. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:04 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
ALOTE, а если-бы в задаче надо было найти две нижних "дырки" ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:11 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Почитал топик, оказывается очень хорошая задачка ... чтобы проверить как разработчики умеют понимать ТЗ :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:14 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonALOTE, а если-бы в задаче надо было найти две нижних "дырки" ? То же самое, нижняя граница+1 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:22 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
ALOTE, хех. Хвастун. А вот тебе еще мысль. Дана выборка из 2^32 - 1 уникальных элементов int. Я вот думаю как найти дырку без использования проверок условий "if-then-else". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:41 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
ALOTEМожет я чего не понял, но по-моему все тривиально - объявляется интервал с нижней и верхней границей 1..1000000000. Потом идется по файлу. Если встреченное число рано нижней границе к нижней границе прибавляется 1 , если меньше верхней, верхняя равна встреченному числу. Если нижняя граница становится равна верхней, начинаем заново, но нижней границе+1, а верхнюю опять делаем опять 1000000000. и сколько раз придётся читать файл твоему алгоритму в худшем случае ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:46 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan)и сколько раз придётся читать файл твоему алгоритму в худшем случае ? В худшем случае миллион раз, при условии, что случайная выборка даст отсортированный в обратном порядке массив чисел от 1 до 100000. Но при каждом проходе число читаемых строк будет уменьшаться на 1. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:51 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonALOTE, хех. Хвастун. А вот тебе еще мысль. Дана выборка из 2^32 - 1 уникальных элементов int. Я вот думаю как найти дырку без использования проверок условий "if-then-else". Может вообще без программирования? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:53 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
ALOTEkealon(Ruslan)и сколько раз придётся читать файл твоему алгоритму в худшем случае ? В худшем случае миллион раз, при условии, что случайная выборка даст отсортированный в обратном порядке массив чисел от 1 до 100000. Но при каждом проходе число читаемых строк будет уменьшаться на 1. посмотри мой алгоритм, c бинарным поиском, он делает это гарантированно за 20 проходов и ему неважно в каком порядке данные 10^6 < 2^20 PS: задача то олимпиадная, проверка на входе будет подсовывать самые неудобные случаи ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 12:59 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonALOTE, хех. Хвастун. А вот тебе еще мысль. Дана выборка из 2^32 - 1 уникальных элементов int. Я вот думаю как найти дырку без использования проверок условий "if-then-else". :-) а сколько чисел в выборке, всего одно выпало? а While использовать можно? если всего одно число сумма всех чисел от 1 до N = (1+N)*N/2 вычитаем из него все числа в файле итоговым результатом будет невключённое число ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 13:06 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Может XOR-ем попробовать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 15:02 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Поделим миллиардный интервал на два интервала по 500 миллионов. Где может находиться искомое число? Очевидно, в первом, так как 500-миллионный интервал миллионом чисел не заполнить. Теперь поделим первый 500-миллионный интервал на два и т. д. Рано или поздно заключение о том, что интервал, содержащий искомое число, будет первым, окажется несправедливым. Поэтому давайте для любой пары интервалов разработаем более универсальный метод. Почему очевидно в первом ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 15:26 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
SashaMercuryПоделим миллиардный интервал на два интервала по 500 миллионов. Где может находиться искомое число? Очевидно, в первом, так как 500-миллионный интервал миллионом чисел не заполнить. Теперь поделим первый 500-миллионный интервал на два и т. д. Рано или поздно заключение о том, что интервал, содержащий искомое число, будет первым, окажется несправедливым. Поэтому давайте для любой пары интервалов разработаем более универсальный метод. Почему очевидно в первом ? как уже говорил... автор предоставил избыточное решение (делается больше чем надо). Очевидно, что пропуск находится в одной из первых 1000001 позиций. А значит и 1000 000 000 проверять не надо... достаточно начинать делить интервалы начиная с миллиона (точнее начиная с 0xFFFFF = 1048576, тогда все операции легко сводятся к битовым, а потому идёт экономия времени и упрощение логики). Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. Вот так :) Вот моё решение, на основании решения автора. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 17:08 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Ох уж эти любители Паскаля... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 18:56 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
[quot Програмёр]SashaMercuryпропущено... Вот так :) Вот моё решение, на основании решения автора. Не работает ваше решение, я его немного модифицировал без потери смысла Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. выводит 16, хотя должно быть 11 кроме того оно выходит считает файл 32 раза ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 19:23 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
[quot kealon(Ruslan)]Програмёрпропущено... Не работает ваше решение, я его немного модифицировал без потери смысла Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. выводит 16, хотя должно быть 11 кроме того оно выходит считает файл 32 раза Сильно извиняюсь :) реально ошибся... в последний момент перед заливкой поправил и не проверил. В условии увеличения счётчика ошибся... вот код с правильным накладыванием маски: Код: pascal 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. файл читается 20 раз... Ровно столько раз, сколько бит в самом большом числе искомого интервала (в нашем случае это 1000001 < 2^20). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.05.2014, 22:26 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Ребята, вы издеваетесь ? Я уже единственное нормальное, и с большой долей вероятности самое быстрое решение привёл вышел. такая постановка решается очень просто :), код примерно такой: SS Код: plaintext 1. 2. 3. 4. 5. 6. 7. если индексы не напутал, но смысл думаю понятен :) Програмёркак уже говорил... автор предоставил избыточное решение (делается больше чем надо). Очевидно, что пропуск находится в одной из первых 1000001 позиций. А значит и 1000 000 000 проверять не надо... достаточно начинать делить интервалы начиная с миллиона (точнее начиная с 0xFFFFF = 1048576, тогда все операции легко сводятся к битовым, а потому идёт экономия времени и упрощение логики). автор предоставил порнографическую постановку задачи, и аналогичное решение задачи. Удивлён что mayton участвовал в этой вашей дискуссии. Хотя, судя по тому как он тонко намекнул остальным на XOR.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 01:50 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
пИз числового интервала от единицы до миллиарда выбираются случайным образом без повторений миллион чисел и записываются в файл. Необходимо за приемлемое время выяснить, какое наименьшее число отсутствует в файле. Использовать массивы или иные структуры данных, их заменяющие, запрещается. ну очевидно что в полученном массиве будет 10^6 чисел, и зачем мне смотреть те индексы что даже не существуют ???? И поэтому вашу фразу ПрограмёрОчевидно, что пропуск находится в одной из первых 1000001 позиций. я понимаю как -очевидно что искомое число имеет значение в диапазоне 1 - 10^6+1. Вот как я вижу эту задачу: 1. Дан массив array мощностью 10^6. Каждый элемент массива целое число в диапазоне от 1 до 10^9. Каждый элемент массива уникален. Найти минимальное пропущенное число в array. К этой задаче решение выше не подходит. Вот, как мне кажется, вы видите эту задачу. 2. Дан массив array мощностью 10^6. Каждый элемент массива целое число в диапазоне от 1 до 10^6. Каждый элемент массива уникален. Найти минимальное пропущенное число в array. К этой задаче решение выше. Допустим, мы рассматриваем задачу 1. Програмёркак уже говорил... автор предоставил избыточное решение (делается больше чем надо). Очевидно, что пропуск находится в одной из первых 1000001 позиций Возможно, вы хотите сказать что значение искомого числа в диапазоне 1 - 10^6+1, но и это неверно. Допустим все array[i]=0.5^10^9+i. Тогда минимальное пропущенное 0.5^10^9-1 Значит, вы возможно рассматриваете такую постановку: 3. Дан массив array мощностью 10^6. Каждый элемент массива целое число в диапазоне от 1 до 10^9. Каждый элемент массива уникален. Найти минимальное не включенное в array число из диапазона 1 - 10^9. И тогда, ДЕЙСТВИТЕЛЬНО, наше число находится в диапазоне 1 - 10^6+1. Вы рассматриваете задачу 3 ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 03:00 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
SashaMercuryРебята, вы издеваетесь ? Я уже единственное нормальное, и с большой долей вероятности самое быстрое решение привёл вышел. такая постановка решается очень просто :), код примерно такой: SS Код: plaintext 1. 2. 3. 4. 5. 6. 7. если индексы не напутал, но смысл думаю понятен :) Програмёркак уже говорил... автор предоставил избыточное решение (делается больше чем надо). Очевидно, что пропуск находится в одной из первых 1000001 позиций. А значит и 1000 000 000 проверять не надо... достаточно начинать делить интервалы начиная с миллиона (точнее начиная с 0xFFFFF = 1048576, тогда все операции легко сводятся к битовым, а потому идёт экономия времени и упрощение логики). автор предоставил порнографическую постановку задачи, и аналогичное решение задачи. Удивлён что mayton участвовал в этой вашей дискуссии. Хотя, судя по тому как он тонко намекнул остальным на XOR.. Да, просто я когба подбирал аналогичную задачу, забыл о более оптимальном поиске одного пропуска. Потому задачу лучше свести к 2 пропускам, и она станет аналогичной изначальной задаче, только без излишеств. То есть, есть 1000000 чисел в диапазоне 1000002. Найти меньшее из пропущеных чисел. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 07:28 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Тогда мы имеем поиск неподвижной точки. Не стал разбираться как сделано у автора по ссылке в первой записи топа(ибо его объяснение мне мягко говоря не нравится), но судя по вашим комментариям у вас что-то аналогичное с алгоритмом ниже. Код в первом приближении Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 08:47 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Если не ошибаюсь, количество проходов log_2 (1 000 000). То есть не должно превышать 20, тоже встречал это число. Так как это частный случай, то всё равно эту задачу можно решить за один проход. Только надо подумать как ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 08:53 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
SashaMercuryРебята, вы издеваетесь ? Я уже единственное нормальное, и с большой долей вероятности самое быстрое решение привёл вышел. такая постановка решается очень просто :), код примерно такой: SS Код: plaintext 1. 2. 3. 4. 5. 6. 7. если индексы не напутал, но смысл думаю понятен :) Програмёркак уже говорил... автор предоставил избыточное решение (делается больше чем надо). Очевидно, что пропуск находится в одной из первых 1000001 позиций. А значит и 1000 000 000 проверять не надо... достаточно начинать делить интервалы начиная с миллиона (точнее начиная с 0xFFFFF = 1048576, тогда все операции легко сводятся к битовым, а потому идёт экономия времени и упрощение логики). автор предоставил порнографическую постановку задачи, и аналогичное решение задачи. Удивлён что mayton участвовал в этой вашей дискуссии. Хотя, судя по тому как он тонко намекнул остальным на XOR.. код на коленке можно приводить любой рабочей проги, которую можно проверить нету вот например, при чём здесь последняя i (...^i) ? Код: plaintext 1. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 09:24 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
SashaMercuryЕсли не ошибаюсь, количество проходов log_2 (1 000 000). То есть не должно превышать 20, тоже встречал это число. Так как это частный случай, то всё равно эту задачу можно решить за один проход. Только надо подумать как вот фактически вы сами и пришли к методу деления пополам а вот за один проход вопрос открыт ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 09:35 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan)код на коленке можно приводить любой рабочей проги, которую можно проверить нету вот например, при чём здесь последняя i (...^i) ? Код: plaintext 1. Код рабочий, только Саша его написал в своем любимом стиле нечитабельных указателей. Читай *(a + i - 1) как a[i - 1]. Вот чуть улучшенная модификация готовая для запуска Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. Так думаю понятней принцип работы. Только этот алгоритм к данной задаче отношения не имеет. PS SashaMercury, не издевайся над указателями :) твоя запись действительно трудно читается. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 10:00 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan)SashaMercuryЕсли не ошибаюсь, количество проходов log_2 (1 000 000). То есть не должно превышать 20, тоже встречал это число. Так как это частный случай, то всё равно эту задачу можно решить за один проход. Только надо подумать как вот фактически вы сами и пришли к методу деления пополам а вот за один проход вопрос открыт ... в один проход не решить, если следовать условиям задачи авторИспользовать массивы или иные структуры данных, их заменяющие, запрещается. По моему алгоритм двоичного поиска непрерывного интервала тут будет самый эффективный. Только реализации выше кривоваты, т.к. при min >= 2 можно сразу дать ответ 1. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 10:24 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Значит для 1 и для 2 дырок достаточно одного прохода. А для трёх?.... Только биткарта или сортировка. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 14:39 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonЗначит для 1 и для 2 дырок достаточно одного прохода. А для трёх?.... Только биткарта или сортировка. Тут не понял, а по какому алгоритму в один проход определяется меньшая из двух дырок? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 14:49 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonЗначит для 1 и для 2 дырок достаточно одного прохода. А для трёх?.... Только биткарта или сортировка. Про одну понятно, а две как? Вроде выше про две не было предложений Биткарта - массив, сортировка по большому счету тоже использование файла как "иные структуры данных, заменяющие массив". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 14:52 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima TmaytonЗначит для 1 и для 2 дырок достаточно одного прохода. А для трёх?.... Только биткарта или сортировка. Про одну понятно, а две как? Вроде выше про две не было предложений Вот такая идейка есть на два выброса из интервала 1..N, a и b найти Код: pascal 1. 2. сумма 1..N = N*(N+1)/2 сумма 1^2..N^2 = N*(N+1)(2N+1)/6 64-битного целого должно хватить произведение можно найти на основании ln(a*b)=ln(a)+ln(b) можно даже найти и 3 выброса: a,b,c найти Код: pascal 1. 2. 3. система довольно легко преобразуется к кубическому уравнению корни которого и будут a,b,c можно и дальше, но будет попахивать мазохизмом :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2014, 21:41 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
вчера придумал аналогичную систему a + b = const a XOR b = const Правда не смог доказать что у неё единственное решение. Но это не очень интересно,2,3,4 это частный случай ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 02:11 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
SashaMercuryвчера придумал аналогичную систему a + b = const a XOR b = const Правда не смог доказать что у неё единственное решение. Но это не очень интересно,2,3,4 это частный случай Код: pascal 1. 2. Код: pascal 1. 2. и у него по идее должно быть два гарантированных решения ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 06:09 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan) Код: pascal 1. 2. и у него по идее должно быть два гарантированных решения Порешай A1 = 1023 и A2 = 1023 Тут ответы :) ab23100024999259982699727996289952999430993319923299133990349893598836987379863898539984409834198242981439804497945978469774797648975499745097351972529715397054969559685696757966589655996460963619626296163960649596595866957679566895569954709537195272951739507494975948769477794678945799448094381942829418394084939859388693787936889358993490933919329293193930949299592896927979269892599924100923101922102921103920104919105918106917107916108915109914110913111912112911113910114909115908116907117906118905119904120903121902122901123900124899125898126897127896128895129894130893131892132891133890134889135888136887137886138885139884140883141882142881143880144879145878146877147876148875149874150873151872152871153870154869155868156867157866158865159864160863161862162861163860164859165858166857167856168855169854170853171852172851173850174849175848176847177846178845179844180843181842182841183840184839185838186837187836188835189834190833191832192831193830194829195828196827197826198825199824200823201822202821203820204819205818206817207816208815209814210813211812212811213810214809215808216807217806218805219804220803221802222801223800224799225798226797227796228795229794230793231792232791233790234789235788236787237786238785239784240783241782242781243780244779245778246777247776248775249774250773251772252771253770254769255768256767257766258765259764260763261762262761263760264759265758266757267756268755269754270753271752272751273750274749275748276747277746278745279744280743281742282741283740284739285738286737287736288735289734290733291732292731293730294729295728296727297726298725299724300723301722302721303720304719305718306717307716308715309714310713311712312711313710314709315708316707317706318705319704320703321702322701323700324699325698326697327696328695329694330693331692332691333690334689335688336687337686338685339684340683341682342681343680344679345678346677347676348675349674350673351672352671353670354669355668356667357666358665359664360663361662362661363660364659365658366657367656368655369654370653371652372651373650374649375648376647377646378645379644380643381642382641383640384639385638386637387636388635389634390633391632392631393630394629395628396627397626398625399624400623401622402621403620404619405618406617407616408615409614410613411612412611413610414609415608416607417606418605419604420603421602422601423600424599425598426597427596428595429594430593431592432591433590434589435588436587437586438585439584440583441582442581443580444579445578446577447576448575449574450573451572452571453570454569455568456567457566458565459564460563461562462561463560464559465558466557467556468555469554470553471552472551473550474549475548476547477546478545479544480543481542482541483540484539485538486537487536488535489534490533491532492531493530494529495528496527497526498525499524500523501522502521503520504519505518506517507516508515509514510513511512 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 06:53 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
вот про это я и говорил. Но так вроде-бы будет с любой степенью двойки без единицы, и не только ) Сейчас проверю Дмитрий, вот наверняка через цикл прогнали ? ;) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 07:07 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
SashaMercuryДмитрий, вот наверняка через цикл прогнали ? ;) Конечно. Все варианты a и b до 1000. На бумажке долго доказывать :) Вот код на фоксе поиска количества пар (a,b) для конкретного значения A1,A2 Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. Результат A1A2Количество пар (a b)10231023489511511255767767255895895255959959255991991255100710072491015101524810191019245102110212451022102224510191027244102110252441022102424410151031241100710392405111535233767127923389511512339591087233991105523325576712825512791283836391283831407128447575128447147112847954312847915031284955271285035191285075151285095131285105121286398951286391151128703831128703121512873579912873512471287517831287597751287637711287657691287667681288319591288311087128863927128863111912887991112888790312889189912889389712889489612892799112892710551289439751289519671289559631289579611289589601289751007128983999128987995128989993128990992128255255127383383127447447127479479127495495127503503127507507127509509127510510127639639127703703127735735127751751127759759127763763127765765127766766127831831127863863127879879127887887127891891127893893127894894127927927127943943127951951127955955127957957127958958127975975127983983127987987127989989127990990127999999127......... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 07:18 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
значит XOR не вариант, надо юзать другие агрегаты :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 07:47 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan)значит XOR не вариант, надо юзать другие агрегаты :-) Умножение (a*b) уникально по определению, но большие цифры будут. Главное не масштабируется до N пропусков ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 07:57 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima_TГлавное не масштабируется до N пропусков вот-вот ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 08:02 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima Tkealon(Ruslan)значит XOR не вариант, надо юзать другие агрегаты :-) Умножение (a*b) уникально по определению, но большие цифры будут. Главное не масштабируется до N пропусков не надо умножать все цифры, это невозможно нужно суммировать логарифмы, точности double хватит для разделения Ln(N-1) и Ln(N) Сумма (ln(1)..ln(N)) - ln (каждого значения) в итоге получится ln(a*b) если вы найдёте решение для всех случаев то там без массива уже не обойтись ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 08:56 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Можно еще взять матлибу для работы с большими числами и использовать систему счисления с основанием миллион (миллионричная система счисления) дальше писать в каждый разряд - формально это не массив, а одно очень большое число :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 09:22 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima TМожно еще взять матлибу для работы с большими числами и использовать систему счисления с основанием миллион (миллионричная система счисления) дальше писать в каждый разряд - формально это не массив, а одно очень большое число :) это же олимпиадная задачка вы знаете реальную задачу где нужно искать пропуски :-)? массив имелся виду для хранения агрегатов A1,A2,A3 ... а вот для развития ума и расширения кругозора олимпиадные задачки самое то их решение позволяет нестандартно смотреть на вещи, которые решаются эн-ным количеством трудодней постоянно лепить лапшу из сортировок, поиска, форматирования текста и прочей пакости - скучно да и деградируешь быстро ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 12:03 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan)вы знаете реальную задачу где нужно искать пропуски :-)? Знаю. Генерация ID при интенсивной вставке/удалении в таблицу. Ключ обычно int делают. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 12:16 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima Tkealon(Ruslan)значит XOR не вариант, надо юзать другие агрегаты :-) Умножение (a*b) уникально по определению, но большие цифры будут. Главное не масштабируется до N пропусков Я думал об аналогии с кодами Хэмминга. Только Хэмминг гарантирует исправление нужного количества бит. А у нас речь идёт о поиске 32-битного (или меньше) значения. Которое выпало из выборки. Или для общего случая - добавлено некорректное (шумовое) значение числа. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 12:22 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonЯ думал об аналогии с кодами Хэмминга. Только Хэмминг гарантирует исправление нужного количества бит. Хэмминг для того и нужен чтобы добавить избыточную инфу для восстановления исходного значения. maytonА у нас речь идёт о поиске 32-битного (или меньше) значения. Которое выпало из выборки. Или для общего случая - добавлено некорректное (шумовое) значение числа. Я так думаю о решении в один проход: промежуточную инфу надо где-то хранить, минимально - битовая карта, т.е. 1 млн. бит или 12500 байт. Возможно есть более компактное решение, но не намного. В обычных языках нет типов данных размером 10-12Кб (строки не учитываем), отсюда вывод - за один проход не решается. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 12:54 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima Tkealon(Ruslan)вы знаете реальную задачу где нужно искать пропуски :-)? Знаю. Генерация ID при интенсивной вставке/удалении в таблицу. Ключ обычно int делают. ну наверное сложность O(N) не самый лучший вариант в данном случае ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 12:55 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima TmaytonЯ думал об аналогии с кодами Хэмминга. Только Хэмминг гарантирует исправление нужного количества бит. Хэмминг для того и нужен чтобы добавить избыточную инфу для восстановления исходного значения. Хэмминг работает в условиях неопределённного (шумового) потока битов. А у нас - детерминизм. В некотором простом случае мы ищем функцию вида: F(n) = Hamming(Sequence(0,n)) Или F(n) = Hamming(RandomShuffle(Sequence(0,n))) и используя свойство функции указывать на номера инвертированных битиков - восстанавливаем дырку. Но в данном ТЗ нас интересует не восстановление а порядковый номер int в этой последовательности который также вычисляем от номера испорченного битика. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 13:24 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonХэмминг работает в условиях неопределённного (шумового) потока битов. А у нас - детерминизм. ... Хэмминг работает с блоками конкретной длинны. Хэмминг требует подготовки данных перед отправкой (добавление служебной инфы для контроля и восстановления), а мы имеем поток рандомных значений без какой-либо доп.инфы. ИМХУ Хэмминга тут никак не задействовать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 13:32 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
С учетом большого числа дырок, лично мне кажется оптимальный алгоритм - сначала поиск интервала с дыркой от единицы вверх, затем поиск непрерывного вниз двоичным поиском. т.е. берем 1 - сканируем весь поток, затем 2,4,8 и т.д. как получили дырку - продолжаем между предыдущим и текущим, т.е. дальше чистый двоичный поиск. вероятность что нет первого составляет 10^3 к 1, нет второго 10^6 к 1 и т.д. (если теорию вероятностей правильно помню), т.е. скорее всего за один проход все найдется. В худшем случае 40 сканов для непрерывной последовательности в миллион. Т.е. тут сложность O(log2(n) + log2(n)) но по сравнению с чистым двоичным поиском высока вероятность решить в один проход. Двоичным от миллиона поиск значения 1 потребует 20 проходов. Также получается универсально, т.к. тут нет ограничения сверху, т.е. без разницы сколько значений хоть миллион, хоть олимпиард :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 14:41 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima TС учетом большого числа дырок, лично мне кажется оптимальный алгоритм - сначала поиск интервала с дыркой от единицы вверх, затем поиск непрерывного вниз двоичным поиском. т.е. берем 1 - сканируем весь поток, затем 2,4,8 и т.д. как получили дырку - продолжаем между предыдущим и текущим, т.е. дальше чистый двоичный поиск. вероятность что нет первого составляет 10^3 к 1, нет второго 10^6 к 1 и т.д. (если теорию вероятностей правильно помню), т.е. скорее всего за один проход все найдется. В худшем случае 40 сканов для непрерывной последовательности в миллион. Т.е. тут сложность O(log2(n) + log2(n)) но по сравнению с чистым двоичным поиском высока вероятность решить в один проход. Двоичным от миллиона поиск значения 1 потребует 20 проходов. Также получается универсально, т.к. тут нет ограничения сверху, т.е. без разницы сколько значений хоть миллион, хоть олимпиард :) а что мешает объединить два этих метода ? пусть будет бинарный поиск с нижним расширением :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 18:54 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan)а что мешает объединить два этих метода ? пусть будет бинарный поиск с нижним расширением :-) распиши подробнее ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 18:59 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima T, ну в бинарном поиске ты всё равно весь файл читаешь что мешает вести L,R бинарного поиска и попутно считать число значений меньше L+степени двойки чтение из файла ведь всё равно затратнее ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 19:03 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
kealon(Ruslan)Dima T, ну в бинарном поиске ты всё равно весь файл читаешь что мешает вести L,R бинарного поиска и попутно считать число значений меньше L+степени двойки чтение из файла ведь всё равно затратнее можно параллельно считать обоими способами, потом переходить к двоичному поиску, только польза будет при большой искомой непрерывной последовательности 1...N, а вероятность изначальной генерации такой последовательности 1 из 10^(N*3), т.е. практически невозможно, поэтому можно не усложнять. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 19:38 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima T, задача олимпиадная, проверяют такие вещи самыми неудобными наборами ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.05.2014, 21:21 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Задумался как сделать Shuffle последовательности без временных массивов. По сути речь идёт об ограниченном ГПСЧ "без повторений" только для решения данной задачи. Для последовательности кратной 2^N вроде-бы всё просто. А вот для произвольного size = 1 000 000 000 пока не знаю как такой Shuffle сделать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2014, 15:03 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonДля последовательности кратной 2^N вроде-бы всё просто. А вот для произвольного size = 1 000 000 000 тогда делаешь последовательность 2^30 и все что больше 1 000 000 000 пропускаешь Для 2^N ты как хотел сделать просто? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2014, 15:36 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Dima T, перестановкой битов в целом числе. Я до этого так делал псевдо-ГПСЧ с уникальностью. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2014, 15:54 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Для миллиарда думаю можно взять 30 битиков и использовать тот-же самый алгоритм но проверять что результат попадает в диапазаон [0..999 999 999] ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2014, 15:57 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Не получился у меня ГПСЧ. Вобщем сходу энтропия плохая. Глазом видно что все чётные - меньше. А ну его в болото. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. Вобщем лучшее решение у kealon(Ruslan). Фух ... надоёло всё. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.05.2014, 21:59 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonНе получился у меня ГПСЧ. Ну и отлично, а то я весь мозг сломал как можно последовательность из неповторяющихся чисел сгенерить :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.05.2014, 06:25 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
Можно легко. Только я себе ограничение поставил. Не использовать массивы и сортировки. Надо-б еще сдвиговый регистр с хорём попробовать но уже лень и у него тоже энтропия плохая. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.05.2014, 11:23 |
|
||
|
Выборка из миллиарда
|
|||
|---|---|---|---|
|
#18+
maytonМожно легко. Только я себе ограничение поставил. Не использовать массивы и сортировки. Надо-б еще сдвиговый регистр с хорём попробовать но уже лень и у него тоже энтропия плохая. А мне кажется, как не крути, псевдослучайная генерация без повторов уже не является ни случайной, ни даже псевдослучайной. Всё очень просто.... в таком алгоритме появляется чёткая закономерность. И скажем например, сгенерировав 999'999 значений, я точно буду знать следующее генерируемое значение (хотя конечно всего одно значение можно и не брать в счёт). При этом мы не можем взять какой либо генератор энтропии с хорошими параметрами, так как тогда мы автоматически исключаем пункт "без повторений" пока просто не начнём явно определять (с помощью массива), что это значение уже показывали и надо выбрать случайное среди оставшихся. Потому без массивов, думаю, задача не решаема. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.05.2014, 13:27 |
|
||
|
|

start [/forum/topic.php?all=1&fid=16&tid=1341363]: |
0ms |
get settings: |
7ms |
get forum list: |
13ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
157ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
74ms |
get tp. blocked users: |
1ms |
| others: | 209ms |
| total: | 474ms |

| 0 / 0 |
