|
|
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Last_Alien Автор поставил глобальную задачу, что в этом плохого? Если Вы ищете работу за деньги, идите в форум Работа... Я и так работаю за деньги, спасибо Просто я неоднократно видел уже таких вот "генераторов идей в плоскости теории" и даже по молодости пытался на них пахать бесплатно или за гроши Эффект один и тот же, причм всегда - сначала что-то делают, потом выясняется что денег это не приносит, потому что остальные давно сделали лучше и что вообще для того чтобы просто кого-то хоть немного заинтересовать нужно вбухать кучу денег Проект забрасывается. а у генератора рождается очередная "гениальная" мысль, и все сначала Это же ведь не образовательный проект, где получил грант и купил дом яхту и дом на канарах а в отдельное от отдыха время че-то делаешь Это надо спонсора найти. а спонсора нынче днем с огнем не сыщещь, особенно на такой проект В Яндекс вбухивали очень неслабые деньги 5 лет прежде чем он просто начал окупаться Поэтому задача совершенно другая: КАК сначала найти спонсора, а потом уж задаваться вопросом о СУБД, которая как здесь правильно заметили отнюдь не на первом месте по важности Тем более что таких проектов никто не делал и опыта просто нет, а если и есть то не поделятся (вряд ли тут тусуются пьяные в попу отцы-программисты из Гугла или Яндекса) поэтому вопрос просто некорректен А вообще, прежде чем фантазировать о ядерной войне надо сначала раздобыть боеголовку Наоборот только дети поступают ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:18 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Привет, Last_Alien! Ты пишешь: Last_AlienLA> Автор поставил глобальную задачу, что в этом плохого? автор плавает в теме как ЗОЛОТО в проруби. базовых знаний, и тем более, опыта, практически 0. почему бы ему не помечтать о лунном садоводстве? или о ландышах на марсе. практически, выхлоп будет идентичен. -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:21 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Мимопроходящий автор плавает в теме как ЗОЛОТО в проруби. базовых знаний, и тем более, опыта, практически 0. почему бы ему не помечтать о лунном садоводстве? или о ландышах на марсе. практически, выхлоп будет идентичен. подписываюсь, это стихи ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:23 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
При удвоении мощьностей процессоров каждые 1,8 года через 5 лет это будет уже в ~8 раз. Причем в индустрии кажется начинается очередная революция - массовое распаралеливание и децентрализация. Чего на пацана накинулись? Задача интересная, пусть сегодня и неразрешимая (кажется). Эпл в гараже начинался. Лари вообще идею чужую подхватил и до ума довел. Все когда то начинается, причем когда "специалистов, имеющих опыт в данной области" еще нет и в помине. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:33 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Привет, casmith! Ты пишешь: casmithc> Эпл в гараже начинался. а Моцарт написал свою первую симфонию, когда ему было 7-8 лет. но ведь он никого не спрашивал КАК?.. -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:41 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
casmithПри удвоении мощьностей процессоров каждые 1,8 года через 5 лет это будет уже в ~8 раз. Причем в индустрии кажется начинается очередная революция - массовое распаралеливание и децентрализация. Чего на пацана накинулись? Задача интересная, пусть сегодня и неразрешимая (кажется). Эпл в гараже начинался. Лари вообще идею чужую подхватил и до ума довел. Все когда то начинается, причем когда "специалистов, имеющих опыт в данной области" еще нет и в помине. подпесалсо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:44 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Random_Goodman, у тебя ведь денег никто не просит. По существу вопроса ты ничего сказать не можешь. Так к чему весь этот оффтоп? Тебе не повезло по молодости с работодателями? Сочувствую. Но автор топа к этому никакого отношения не имеет и тебя за уши в проект не тянет :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:48 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
casmithЭпл в гараже начинался. Лари вообще идею чужую подхватил и до ума довел. Все когда то начинается, причем когда "специалистов, имеющих опыт в данной области" еще нет и в помине. Вот именно потому что они взяли и тихо собрали в гараже то что было всем нужно, а не ходили и не спрашивали всех "какой именно конфигурации гараж нам нужен. чтобы убить IBM" они это и сделали. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:49 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
casmith Задача интересная, пусть сегодня и неразрешимая (кажется). Брось, она даже сегодня решается, как я уже писал выше. Вот только придется отвлечься от маниловщины и точно выяснить вопросы которые я же задавал в соседней теме. Хотя бы первый. Ну еще и параметры запросов неплохо бы уточнить. Чтобы можно было структуру подгонять под допустимое время отклика (только не надо говорить "требуется мгновенно"). Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:49 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Random_Goodman casmithЭпл в гараже начинался. Лари вообще идею чужую подхватил и до ума довел. Все когда то начинается, причем когда "специалистов, имеющих опыт в данной области" еще нет и в помине. Вот именно потому что они взяли и тихо собрали в гараже то что было всем нужно, а не ходили и не спрашивали всех "какой именно конфигурации гараж нам нужен. чтобы убить IBM" они это и сделали. Если ты не понял, этот топ может закончится сбором тима, который тихо решит эту задачу. А остальные просто забудут о ней лет на 5... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:51 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Last_AlienЕсли ты не понял, этот топ может закончится сбором тима, который тихо решит эту задачу. А остальные просто забудут о ней лет на 5... Может, но не закончится. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:54 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Dimitry Sibiryakov casmith Задача интересная, пусть сегодня и неразрешимая (кажется). Брось, она даже сегодня решается, как я уже писал выше. Вот только придется отвлечься от маниловщины и точно выяснить вопросы которые я же задавал в соседней теме. Хотя бы первый. Ну еще и параметры запросов неплохо бы уточнить. Чтобы можно было структуру подгонять под допустимое время отклика (только не надо говорить "требуется мгновенно"). Posted via ActualForum NNTP Server 1.3 На критику твоего решения ты почему-то не отреагировал... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:54 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Привет, Last_Alien! Ты пишешь: Last_AlienLA> Если ты не понял, этот топ может закончится сбором тима, LA> который тихо решит эту задачу. LA> А остальные просто забудут о ней лет на 5...какого нах тыма... видели мы таких шапкозакидателей. проект NOGANO, не слышал? где вы хлопцы? ау-у!!! -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 15:57 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Мимопроходящий Привет, Last_Alien! Ты пишешь: Last_AlienLA> Если ты не понял, этот топ может закончится сбором тима, LA> который тихо решит эту задачу. LA> А остальные просто забудут о ней лет на 5...какого нах тыма... видели мы таких шапкозакидателей. проект NOGANO, не слышал? где вы хлопцы? ау-у!!! -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 Дай сцылку, посмотрю. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:02 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Привет, Last_Alien! Ты пишешь: Last_AlienLA> Дай сцылку, посмотрю.у них был сайт nagano.ru сейчас этот домен свободен. видимо альтруизм и шапкозакидательство не позволили хлопцам оплатить поддержку домена ЗЫ: не путать с IBM WebSphere Performance Pack (aka Nagano) -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:09 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Last_Alien На критику твоего решения ты почему-то не отреагировал... Ты меня с кем-то спутал. Я не предлагал никаких решений. Но могу и предложить. В стандартной "Тенцеровской" двухтабличной схеме "сущность - аттрибуты" запрос Код: plaintext 1. 2. 3. 4. 5. убыванию релевантности. Заставить этот вопрос работать приемлемо быстро - задача подбора СУБД и железа. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:10 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Привет, Last_Alien! Ты пишешь: Last_AlienLA> Дай сцылку, посмотрю.вот последнее, что от них осталось... http://www.delphiplus.org/articles/press_release/nagano.html -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:11 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Dimitry SibiryakovЕсли думать о будущем, то надо принимать во внимание что планируется глобальный проект, а это означает тысячи серверов распределенных по всему миру. Наличие такого количества серверов уменьшает нагрузку на каждый отдельно взятый сервер до приемлемых сотен запросов в секунду. Сотовой связью сейчас тоже пользуются миллиарды, но никто же не требует супермощности от отдельной базовой станции. Совершенно правильно. Однако даже при наличие у нас такой инфраструктуры (скажем тысячи серверов, раскиданных по миру, с очень скоростными каналами связи между ними) и имея теоретическую возможность раскидать между ними работу (предположим, что задача создания кластера решена) все равно можно упереться в тупик, если нет алгоритма для эффективного поиска в пространстве с большой (к тому же переменной) размерностью. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:11 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Мимопроходящий Привет, Last_Alien! Ты пишешь: Last_AlienLA> Дай сцылку, посмотрю.вот последнее, что от них осталось... http://www.delphiplus.org/articles/press_release/nagano.html -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 Ну и что??? Сходи на sourceforge.org, там сотни (если не тысячи) умерших и закончившихся выкидышем проектов. Это не повод, чтобы не делать ничего нового, или заниматься оффтопом и мешать другим. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:17 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Привет, Last_Alien! Ты пишешь: Last_AlienLA> Ну и что??? Сходи на sourceforge.org, там сотни (если не тысячи) LA> умерших и закончившихся выкидышем проектов. Это не повод, LA> чтобы не делать ничего нового, или заниматься оффтопом и мешать LA> другим.хорошему танцору, яйца не мешают. а плохому, даже хороший хирург помочь не в силах... -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:21 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
sysprg упереться в тупик, если нет алгоритма для эффективного поиска в пространстве с большой (к тому же переменной) размерностью. Если предыдущий приведенный мною запрос не справится, релевантность только полная а количество критериев ограничено парой дюжин то self-join с правильными индексами обеспечит работу влет. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:22 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
pavelvpДля начала могу предложить автору топика посмотреть в сторону Teradata...Спасибо, посмотреть, конечно, можно - да вот только совсем непонятно, как это поможет собственно решить содержательную часть проблемы - сделать поиск по нескольким выбранным пользователем критериям быстрым. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:24 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
sysprg Совершенно правильно. Однако даже при наличие у нас такой инфраструктуры (скажем тысячи серверов, раскиданных по миру, с очень скоростными каналами связи между ними) и имея теоретическую возможность раскидать между ними работу (предположим, что задача создания кластера решена) все равно можно упереться в тупик, если нет алгоритма для эффективного поиска в пространстве с большой (к тому же переменной) размерностью. Алгоритм есть. Только здесь я его выкладывать не буду :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:26 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
_niсht_schissen_- Кластер брокеров запросов получает запрос, разбирает критерии и посылает запросы по отдельным критериям соответствующим кластерам атрибутов. - Получает от них информацию по количеству идентификаторов с данным значением соответствующего атрибута, составляет список опроса. - По списку опроса запрашивает у соответствующего кластера с мин. кол-вом объектов список их идентификаторов. - Список идентификаторов последовательно рассылается оставшимся кластерам для корректировки на вхождение идентификаторов. - Итоговый список идентификаторов посылается на оставшиеся атрибутные кластеры для получения значений атрибутов. - Результат отправляется на клиент.Ваше решение - это продвинутый вариант решения, предложенного здесь Last_Alien . Решение хорошее для маленькой базы, однако для большой с ним будут проблемы. Предположим, что по одному "популярному" атрибуту у нас в среднем в запрос попадает 2 миллиона записей, а по другому, который в каждом запросе свой - в среднем по 10 тысяч записей. Интуитивно ясно, что если у нас есть 100 миллионов записей и у них очень много разных атрибутов, то такая картина вполне реальна. Один атрибут соответствует какой-то базисной, часто используемой характеристике - и по нему у нас в среднем выпадает по паре миллионов записей при поиске. Другой атрибут - уже более интересный, по нему у нас всего-навсего 10 тысяч записей. А пересечение - вообще маленькое, в 100 записей. За этим пересечением и гонится пользователь - на умении его искать мы и делаем свой бизнес... И вот мы получили компактный список на 10 тысяч записей с одной машины. Но теперь нам нужно "проредить" его пользуясь длинным списком на 2 миллиона элементов. Даже 10 тысяч прямых проб в этом списке займут много времени, даже если он целиком в памяти... А если он еще и популярен, его многие пользователи в своих запросах указывают - тогда работа с этим длинным списком станет "бутылочным горлом" системы и станет лимитировать скорость ее работы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:40 |
|
||
|
Многокритериальный поиск в очень-очень большой базе
|
|||
|---|---|---|---|
|
#18+
Last_AlienПрочитай внимательно первый авторский пост. Какие идеи по решению основной задачи в рамках классической СУБД? Сделать таблицу с 1000 ключами и 10^8 записями? Думаю не потянет. Не знаю откуда взялись 1000 ключей, но это как раз для Teradata. Именно для таких задач она и разработана. Правда нифига не "слабосвязанный" кластер ей нужен, а нормальная MPP. Но архитектурно именно под такие вещи заточена - хеш-секционирование с перманентной привязкой данных к узлу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.08.2006, 16:44 |
|
||
|
|

start [/forum/topic.php?fid=32&msg=33955907&tid=1545033]: |
0ms |
get settings: |
10ms |
get forum list: |
16ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
39ms |
get topic data: |
14ms |
get forum data: |
3ms |
get page messages: |
76ms |
get tp. blocked users: |
2ms |
| others: | 238ms |
| total: | 404ms |

| 0 / 0 |
