|
|
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
как бы сказал Дивижин, блджад. maytonБаз. Давай задачу подкину. Сколько нужно памяти чтобы быстро отделять клиентов бан ка от не-клиентов? 1) Для простоты считаем что клиенты идентифицируются Украинскими ИНН. Это целые вида: [0000000000...9999999999] Первые 5 цифр - это дата рождения клиента в виде количества дней с 1900 года (плюс минус 1 день не помню точно). Клиентом может быть чел достигший 16 лет и (хе-хе) желательно не старше 100 лет ибо нефих. Клиенты - обычное не все люди а какой-то процент от всех налогоплательщиков к примеру (1-5%). Но система должна иметь возможность зарегистрировать и всё 100% населения если возникнет необходимость (банк стал гос-банком). Население Украины составляет 45 633 600 чел за 2012 год по данным wiki. 2) Предусмотреть расширение структуры для случая с Гос-Банком. Вот так вот. Первые 5 цифр сжимаются константно до 80 килобайт (показал как!) Остаются еще 5 цифр. 5 цифр кодируются 17ти битами. Итого: 80 кб + 3.2 * 17 / 8 = 7.6 мб ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 01:50 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
7.6 Мб. Это твоё "заднее" слово? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 01:59 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
mayton7.6 Мб. Это твоё "заднее" слово? Если база ридонли, могу пожать задачу ММ 3Б Лопушком. В мегабайт вложимся ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:04 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
Cool... А есть Java-имплементация? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:05 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
по дефолту, методами которые лежат "на поверхности", 7.6 мегабайт ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:05 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
maytonCool... А есть Java-имплементация? нет, и некогда делать. Короче делай сам, реально задача ОЧЕНЬ простая. Вырожденное в массив РадиксТри. К 7.6 мегабайт жмется легко. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:08 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
RadixTree традиционно используется для умных Combo-Boxes при наборе префиксов. Те имплементации что я смотрел просто прогружают справочники из БД целиком в оперативку и испольуют. А у меня интерес - сериализовать их оптимально. Такую реализацию я еще не находил. Пару дней потрачу на поиск - потом плюну и поломаю исходники http://www.badgenow.com/p/radixtree/ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:11 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
Я тут немножко поправил цифры. Забыл что я сливал в файл несортированные INN. После ранжирования и gzip как-то лучше сработал. AlgorithmTable SizeCompressed ratioCreation timeRandom access time Iterator supportOrdered iterationUpdate/deleteFlat Table(CSV)33M 1.0++-Gzipped flat table6.5M0.19++(forward)- ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:20 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
А что ты будешь делать с этими ИННами ? Будешь просто определять есть в списке, нет в списке при вводе пользователем ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:29 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
В изначальной постановке - определения клиентов банка - это так. Но даже в такой постановке (фильтр свой-чужой, файрвол, база угнанных авто, краденые паспорта) реализация может быть полезной. Хотя-бы как одна из фаз поисковой операции. Или как проксирование поиска. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 02:35 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
BAZlSTЧестно гря, с формулой сразу сообразить тяжело. На практике: Вероятность ~0.05832, или примерно один к двадцати. Вообще-то от распределения случайной величины зависит... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 09:12 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
MasterZivBAZlSTЧестно гря, с формулой сразу сообразить тяжело. На практике: Вероятность ~0.05832, или примерно один к двадцати. Вообще-то от распределения случайной величины зависит... формулы есть, генераторы псевдослучайных тоже их подтверждают с небольшой погрешностью ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 15:10 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
BAZlST, есть относительная частота и вероятность. Это вобщем-то не совсем одинаковы вещи. Вобщем Теорема Бернулли тебе в помощь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 17:38 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
FVMas 3.1.0 выпусе 2 - лучшая СУБД в мире! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.01.2013, 18:20 |
|
||
|
Лучшие задачи проекта
|
|||
|---|---|---|---|
|
#18+
[quot mayton] AlgorithmTable SizeCompressed ratioCreation timeRandom access time Iterator supportOrdered iterationUpdate/deleteFlat Table(CSV)33M 1.0++-Bitmap??+++ Здесь я гоню. И никто за руку не схватил. Для битмапы размер считается по свободным слотам. Хехе... 1 0 000 000 000 / 8 = 1 250 000 000 bytes = 1G ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.01.2013, 12:54 |
|
||
|
|

start [/forum/topic.php?fid=56&msg=38101310&tid=2015281]: |
0ms |
get settings: |
9ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
151ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
55ms |
get tp. blocked users: |
2ms |
| others: | 226ms |
| total: | 475ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...