Выборка из миллиарда / Программирование

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Выборка из миллиарда

13 сообщений из 88, страница 4 из 4

все

Выборка из миллиарда

#38642713

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

Dima TС учетом большого числа дырок, лично мне кажется оптимальный алгоритм - сначала поиск интервала с дыркой от единицы вверх, затем поиск непрерывного вниз двоичным поиском.
т.е. берем 1 - сканируем весь поток, затем 2,4,8 и т.д.
как получили дырку - продолжаем между предыдущим и текущим, т.е. дальше чистый двоичный поиск.
вероятность что нет первого составляет 10^3 к 1, нет второго 10^6 к 1 и т.д. (если теорию вероятностей правильно помню), т.е. скорее всего за один проход все найдется. В худшем случае 40 сканов для непрерывной последовательности в миллион. Т.е. тут сложность O(log2(n) + log2(n)) но по сравнению с чистым двоичным поиском высока вероятность решить в один проход. Двоичным от миллиона поиск значения 1 потребует 20 проходов.

Также получается универсально, т.к. тут нет ограничения сверху, т.е. без разницы сколько значений хоть миллион, хоть олимпиард :)
а что мешает объединить два этих метода ? пусть будет бинарный поиск с нижним расширением :-)

...

Рейтинг:

0 / 0

15.05.2014, 18:54:01

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38642717

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

kealon(Ruslan)а что мешает объединить два этих метода ? пусть будет бинарный поиск с нижним расширением :-)
распиши подробнее

...

Рейтинг:

0 / 0

15.05.2014, 18:59:03

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38642718

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

Dima T,
ну в бинарном поиске ты всё равно весь файл читаешь
что мешает вести
L,R бинарного поиска
и попутно считать число значений меньше L+степени двойки

чтение из файла ведь всё равно затратнее

...

Рейтинг:

0 / 0

15.05.2014, 19:03:03

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38642736

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

kealon(Ruslan)Dima T,
ну в бинарном поиске ты всё равно весь файл читаешь
что мешает вести
L,R бинарного поиска
и попутно считать число значений меньше L+степени двойки

чтение из файла ведь всё равно затратнее
можно параллельно считать обоими способами, потом переходить к двоичному поиску, только польза будет при большой искомой непрерывной последовательности 1...N, а вероятность изначальной генерации такой последовательности 1 из 10^(N*3), т.е. практически невозможно, поэтому можно не усложнять.

...

Рейтинг:

0 / 0

15.05.2014, 19:38:04

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38642791

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

Dima T,

задача олимпиадная, проверяют такие вещи самыми неудобными наборами

...

Рейтинг:

0 / 0

15.05.2014, 21:21:44

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38643558

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Задумался как сделать Shuffle последовательности без временных массивов.
По сути речь идёт об ограниченном ГПСЧ "без повторений" только для решения
данной задачи.

Для последовательности кратной 2^N вроде-бы всё просто. А вот для произвольного size = 1 000 000 000
пока не знаю как такой Shuffle сделать.

...

Рейтинг:

0 / 0

16.05.2014, 15:03:42

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38643625

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonДля последовательности кратной 2^N вроде-бы всё просто. А вот для произвольного size = 1 000 000 000

тогда делаешь последовательность 2^30 и все что больше 1 000 000 000 пропускаешь

Для 2^N ты как хотел сделать просто?

...

Рейтинг:

0 / 0

16.05.2014, 15:36:47

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38643650

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Dima T, перестановкой битов в целом числе. Я до этого так делал псевдо-ГПСЧ
с уникальностью.

...

Рейтинг:

0 / 0

16.05.2014, 15:54:03

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38643656

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Для миллиарда думаю можно взять 30 битиков и использовать тот-же самый алгоритм
но проверять что результат попадает в диапазаон [0..999 999 999]

...

Рейтинг:

0 / 0

16.05.2014, 15:57:27

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38644667

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Не получился у меня ГПСЧ. Вобщем сходу энтропия плохая. Глазом видно что все чётные - меньше.

А ну его в болото.

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.

Вобщем лучшее решение у kealon(Ruslan).

Фух ... надоёло всё.

...

Рейтинг:

0 / 0

18.05.2014, 21:59:32

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38644758

Dima T

Участник

Сообщения: 15 530

Рейтинг: 0 / 0

maytonНе получился у меня ГПСЧ.
Ну и отлично, а то я весь мозг сломал как можно последовательность из неповторяющихся чисел сгенерить :)

...

Рейтинг:

0 / 0

19.05.2014, 06:25:54

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38644952

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 2 / 0

Можно легко. Только я себе ограничение поставил. Не использовать массивы и сортировки.
Надо-б еще сдвиговый регистр с хорём попробовать но уже лень и у него тоже энтропия плохая.

...

Рейтинг:

0 / 0

19.05.2014, 11:23:02

| Ответить | Цитировать | Написать

Выборка из миллиарда

#38645095

Програмёр

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

maytonМожно легко. Только я себе ограничение поставил. Не использовать массивы и сортировки.
Надо-б еще сдвиговый регистр с хорём попробовать но уже лень и у него тоже энтропия плохая.

А мне кажется, как не крути, псевдослучайная генерация без повторов уже не является ни случайной, ни даже псевдослучайной.

Всё очень просто.... в таком алгоритме появляется чёткая закономерность. И скажем например, сгенерировав 999'999 значений, я точно буду знать следующее генерируемое значение (хотя конечно всего одно значение можно и не брать в счёт). При этом мы не можем взять какой либо генератор энтропии с хорошими параметрами, так как тогда мы автоматически исключаем пункт "без повторений" пока просто не начнём явно определять (с помощью массива), что это значение уже показывали и надо выбрать случайное среди оставшихся.

Потому без массивов, думаю, задача не решаема.

...

Рейтинг:

0 / 0

19.05.2014, 13:27:10

| Ответить | Цитировать | Написать

13 сообщений из 88, страница 4 из 4

все

Форумы / Программирование [игнор отключен] [закрыт для гостей] / Выборка из миллиарда

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=16&msg=38643650&tid=1341363]:	0ms
get settings:	4ms
get forum list:	14ms
check forum access:	2ms
check topic access:	2ms
track hit:	57ms
get topic data:	7ms
get forum data:	2ms
get page messages:	43ms
get tp. blocked users:	1ms
others:	196ms

total:	328ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы