|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
> Данные, поулченные в течение научного эксперимента - часто имеют множество излишней информации, которую быстрее > удалить, чем сохранить. Ну и отлично. Raw и production никто не мешает различать. С разными требованиями к доступности и срокам хранения. > Т.е. нужна система с настариваемыми метаданными, настраиваемыми управлениями железом Достаточно один раз спроектировать метаописание. Это действительно очень просто. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2008, 14:07 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
> И почему Lepsik сразу баран? Потому что это не первое и даже не второе обсуждение, в котором он принял участие. И все - с одинаковым результатом. > Я бы лично посмотрел на того барана, кто за неделю возьмется сделать. Дружище, вашу квалификацию оценить или вы просто научитесь молчать? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2008, 14:09 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
такую ИС невозможно дописать до конца, там постоянно надо будет что-нить шаманить... вам нужно делать мего кластер, брать в шаты программера, лучше 2-х, хорошего админа а всем "учёным" начинать учить SQL... можно даже свободные СУБД использовать (слыхал как-то что научная европпа сидит на постгрисе)... если привлечь стороннюю контору, то вы ТАК на них подсядите... и исходного кода вам всёравно никто не покажет :) только и будете успевать готовить документы и платёжки на "внесение изменений"... программист должен сидеть с вами рядом, вариться в проблемме, а лучше всего быть одним из вас (учёных) ИМХО исходные данные должны лежать в файлах, которые АЦП формирует, а что обработается (отфильтруется, обрежется) всякие кореляции, тренды то в СУБД... чтобы хранить описание эксперимента, и связать с ними файлы/таблицы - с этим можно справиться относительно быстро... а далее, ваши программисты, для каждого нового исследования, будут чё-нить шаманить... админы следить чтоб всё это не падало, докручивать железо.... универсальную модель на все случае жизни здесь не сделать, к каждому случаю должен быть индивидуальный подход (особенно когда речь идёт о терабайтах)... вот... дальше пусть студенты, аспиранты дрочатся над программками для анализа, обработки, под курсовые, дипломы... может из этого зоопарка со временем что-нить выдающееся выделится ... |
|||
:
Нравится:
Не нравится:
|
|||
16.08.2008, 01:14 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
> такую ИС невозможно дописать до конца, там постоянно надо будет что-нить шаманить... Еще один гуру, бл%. Чувак, я тебе расскажу, как сделать такую систему на коленке за четыре часа. Берем пакет для управления проектами, который поддерживает wiki-style контент, управление документами, файловое хранилище, управление доступом, нормальные средства коммуникации между разработчиками и имеет веб-интерфейс. Я знаю как минимум четыре таких open source пакета. Берем СУБД, поддерживающую схемы; каждый проект - это отдельная база данных, данные экспериментов хранятся в видей файлов и управляются средствами пакета для управления проектами и/или лежат в соответствующей схеме базы данных. Берем пакет для веб-интерфейса к СУБД с поддержкой отчетов и аналитикой. Их море. Берем библиотеку для математической обработки результатов экспериментов. Все перечисленное - open source. Администрирование такой системы сводится к созданию структуры данных для каждого эксперимента и раздаче прав пользователям - сотрудникам исследовательской группы. Стоимость ПО - нулевая, стоимость администрирования - близка к нулевой. Время на создание - четыре часа при готовой инфраструктуре. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.08.2008, 10:15 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
guest_20040621Еще один гуру, бл%. Чувак, я тебе расскажу, как сделать такую систему на коленке за четыре часа. Уважаемый, у тебя есть возможность за 4-ре часа заработать пару тройку килобаксов... давай... на коленке, за сутки.. в том, что можно легко обойтись OpenSource - полностью согласен. и схемы в СУБД тоже хорошая идея... и хранить описание эксперимента, файлы, и PM wiki-style - удобное решение... но это всё должен кто-то собрать в кучу. кто это должен сделать? чёт я не слышал о разработчиках, которые тебе чисто на open source всё сваяют, и ещё специально для вас, изучат пакеты по обработке данных какого-нить американского универститета... скорее скажут что нужен как миниум Oracl и два человеко-года... и ещё прочитают лекцию про то как круто .NET или Java даже если уже есть собранные и настроенный project manager, при хранении данных для каждого исследования - будут свои нюансы, которые будут выпадать из обобщённой схемы... про обработку и аналитику я вообще молчу... два разных учёных, могут одно и тоже делать по разному... для исследования одного явления могут быть разные модели, каждое исследованеи уникально ... |
|||
:
Нравится:
Не нравится:
|
|||
16.08.2008, 14:41 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
> есть возможность за 4-ре часа заработать пару тройку килобаксов... Херней не занимаюсь. Ни за деньги, ни просто так. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.08.2008, 17:33 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
авторPM wiki-style Че это такое? автордаже если уже есть собранные и настроенный project manager, при хранении данных для каждого исследования - будут свои нюансы, которые будут выпадать из обобщённой схемы... Вот я и хочу выделить только общее, а специфические вещи уже пусть каждая лаборатория для себя сама делает авторпро обработку и аналитику я вообще молчу я тоже про это молчу. Я и хочу "тупое хранилище". Трудным скорей всего будет делать синхронизацию данных, если центральное хранилище находится в одном месте, а данные заполняются в другом месте. И их потом нужно смержить. авторпрограммист должен сидеть с вами рядом, вариться в проблемме, а лучше всего быть одним из вас (учёных) я так и хотел но мне не дадут заниматься "ненаукой". ... |
|||
:
Нравится:
Не нравится:
|
|||
18.08.2008, 03:57 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
recvezitor авторPM wiki-style Че это такое? project manager - "пакет для управления проектами", wiki-style это типа довольно гибкая среда описания/хранения данных... recvezitor Вот я и хочу выделить только общее, а специфические вещи уже пусть каждая лаборатория для себя сама делает ... Я и хочу "тупое хранилище". Трудным скорей всего будет делать синхронизацию данных, если центральное хранилище находится в одном месте, а данные заполняются в другом месте. И их потом нужно смержить. тогда вам действительно нужен project manager, копайте в этом направлении, может и бесплатный есть... в wiki может разберётесь. будет что-то типа дерева проектов... для веток можно делать различное описание, прикреплять файлы, ссылка на базу данных... разделение доступа синхронизация - не думаю что будет сложно... там где они пишутся, то скорее всего пишутся в файлы, а каждый файл будет иметь описание и дату... записали где-нибудь, подключились к ИС, загрузили файл, описание, конвертируете в таблицу ... |
|||
:
Нравится:
Не нравится:
|
|||
18.08.2008, 13:34 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
Вот что вам нужно: - DokuWiki для описаний/метаданных. - Network File System для хранения, любая подходящая реализация (как одноранговая сеть. Центр/отдел/синхронизация и прочая мудата ни разу тут не в тему). Про предварительную обработку нормализацию и прочие кружева: во первых подозреваю что это нахрен никому не нужно а во вторых достаточно того что вопервых ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2008, 02:47 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
private Про предварительную обработку нормализацию и прочие кружева: во первых подозреваю что это нахрен никому не нужно а во вторых достаточно того что вопервых Тут вы не правы, предварительная обработка нужна и сильно (поверьте мне, я в этом варилась), но она не отменяет вашего предложения . Обработка делается при создании файла, а к чему его потом присоединять - это значения для обработки не имеет. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2008, 04:09 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
privateВот что вам нужно: - DokuWiki для описаний/метаданных. Не нашла пока, вы не знаете, а у них есть возможность организовывать поиск по метаданным (ну не на точное соовтетсвие, а чтобы в диапазоне, больше, меньше и т.п.? или это нужно делать самим?). ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2008, 06:45 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
http://www.dokuwiki.org/dokuwiki Там куча всяких плагинов, но большеменьше насколько знаю нет. Нужндо делать ... |
|||
:
Нравится:
Не нравится:
|
|||
22.08.2008, 10:19 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
Привет Мы делаем Web базу данных и мне кажется, что она может подойти, если у Вас есть возможность и желание работать с ней через Интернет. Как минимум ей пользуется клиент, который использует ее для ведения научных экспериментов. Все приложение они делали сами, а мы помогали только в сложных моментах. recvezitor авторпрограммист должен сидеть с вами рядом, вариться в проблемме, а лучше всего быть одним из вас (учёных) я так и хотел но мне не дадут заниматься "ненаукой". Создание приложения не требует знания программирования и не занимает столько времени, поэтому сможете воплотить свое видение без программиста. Объемные файлы можно хранить локальных компьютерах, а в базе держать только ссылки на них, может еще ключевые слова для полнотекстового поиска. ... |
|||
:
Нравится:
Не нравится:
|
|||
23.08.2008, 23:53 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
Всем спасибо за обсуждение. Но скорей всего тему можно закрывать. Так как у нас обнаружилась группа исследователей которая этим вопросом занимается. И выбить финансирование на мою затеюврядли удастся. Прийдется подстраиваться под их разработки ... |
|||
:
Нравится:
Не нравится:
|
|||
25.08.2008, 04:59 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
может кому будет интересно, щас работаю с похожей задачей, оказывается для нее уже есть готовое решение - Apache Hadoop, открытый клон архитектуры гугла. Бесплатен, работает на дешевом железе, "разумен" - выстраивает и балансирует распределенное хранилище самостоятельно, может хранить терабайты на тысяч машин, помимо хранения имеется мощный процессинг и метаданные, безлимитная база данных (HBase) и инструменты аналитики (Pig, Hive). судя по всему уже продакшен реди энд батл тестед в твиттере, фейсбуке, яху и ряде других. Ну и вообще, сама по себе интересная штуковина. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.10.2010, 20:29 |
|
Хранилище данных для научного учреждения. Стоимость, возможные особенности и т.д.
|
|||
---|---|---|---|
#18+
recvezitor, функциональность хранилища "Классификатора объектов": - любой объект может быть как «узлом», так и «листом» (т.е. иметь или не иметь собственную ветку «потомков»); - множественное наследование объекта (у любого объекта может быть более одного «родителя»); - дополнительно к наследованию можно указать связь и тип связи между объектами; - возможность удаления объекта (группы объектов) с заменой во всех ссылках на удаляемый объект на другой объект (по сути слияние двух объектов с учетом значений их атрибутов); - копирование, групповое переподчинение объектов; - объект может иметь произвольное число атрибутов; - поддержка числовых, строковых и «дата-время» значений атрибутов; - поддержка ограничения на диапазон значений в числовом типе атрибута; - поддержка значения атрибута, выбираемого из списка значений (список значений создается в другой «ветке» классификатора); - наследование атрибутов от родителей (каждый «потомок имеет атрибуты от «родителя» плюс свои собственные); - возможность наследования значений атрибутов от родителей (указывается для каждого атрибута); - исторические и перечисляемые значения для атрибутов (поддержка более одного значения атрибута, в историческом типе указываются даты действия значения); - возможность контроля уникальности значений атрибута в пределах родителя; - группирование атрибутов; - разделение прав доступа к атрибутам; - возможность прикрепить к объекту неограниченное число файлов любого типа (изображения, документы DOC, PDF, HTML и т.д.) - поиск в классификаторе «И-ИЛИ» по атрибутам; - поиск в классификаторе по вхождению для строковых значений; - поиск в классификаторе по диапазону для числовых значений и значений типа «дата-время»; - автоматический парсинг, классификация и индексация документов (текстовый, doc, rtf) по настраиваемым шаблонам; - полнотекстовый поиск по индексированным документам; - разграничение доступа к объектам классификатора (по иерархии, по уровню секретности и по префиксу подсистемы); - журналирование всех действий пользователя в классификаторе. Исходные коды - нет Стоимость на условиях аренды Сроки - два дня на подключение и обучение ... |
|||
:
Нравится:
Не нравится:
|
|||
10.11.2010, 01:24 |
|
|
start [/forum/moderation_log.php?user_name=Guest+%D0%98%D0%A2]: |
0ms |
get settings: |
8ms |
get forum list: |
12ms |
get settings: |
10ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
40ms |
get topic data: |
9ms |
get first new msg: |
7ms |
get forum data: |
2ms |
get page messages: |
57ms |
get tp. blocked users: |
1ms |
others: | 846ms |
total: | 1016ms |
0 / 0 |