powered by simpleCommunicator - 2.0.59     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / teradata сравнение
33 сообщений из 33, показаны все 2 страниц
teradata сравнение
    #32488478
Фотография brahew
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А что, кто слышал, про то где работает, как работает и с чем сравнивается и на чем работает. Что за зверь вообще?
...
Рейтинг: 0 / 0
teradata сравнение
    #32488504
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Реляционная СУБД (совместимая с SQL-92,99) с массивно-параллельной архитектурой предназначенная специально для хранилищ данных.\r
\r
Работает на платформе Intel под управлением ОС Windows и UNIX.\r
Способна эффективно обрабатывать большие объёмы данных на сложных запросах. Показывает линейную масштабируемость в архитектуре MPP. Очень легко администрируется.\r
\r
Обсуждалась здесь.\r
\r
Какие конкретно подробности интересуют?\r
\r
С уважением,\r
Константин Лисянский\r
http://lissianski.narod.ru\r
\r
P.S. Зверь очень хороший - рекомендую :)
...
Рейтинг: 0 / 0
teradata сравнение
    #32488606
Nikolay Kulikov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Терадата, очень и очень дорогой продукт. Они ушли с TPC-H говоря про то что это простой тест, но есть еще одна причина TPC требует публикацию в том числе и цен, что для терадаты не есть гуд. Закрытый продукт работает только на своих NCR-ax (помоему еще в ограниченной форме на HP-UX). Если у вас есть желание переплачивать раза в 3-4 за обычный Intel Server и насколько я помню присоединить можно только их же storage который дороже чем, IBM, EMC, Hitachi, а так же OLTP для вас не важен, то это для вас. Основной конкурент наверное это DB2 с DPF (Distributed Partitioning Feature)
...
Рейтинг: 0 / 0
teradata сравнение
    #32489025
Фотография brahew
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Какие то безрадостные отклики. А про примеры внедрения в Росии слыал кто нить?
...
Рейтинг: 0 / 0
teradata сравнение
    #32490705
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Николай Куликов.

Терадата, очень и очень дорогой продукт.

А сколько стоит не знаете?

Они ушли с TPC-H говоря про то что это простой тест
Действительно, ушли. Побив перед этим Oracle и IBM.

Закрытый продукт работает только на своих NCR-ax

Насколько я знаю, Терадата замечательно работает на платформе не-NCR под управлением Windows (и HP-UX, как Вы правильно заметили).

"Закрытый продукт" поддерживает все открытые стандарты - ODBC, JDBC, XML, CWM, ANSI SQL 92-99. Работает с любым стореджем, который подключается по интерфейсу SCSI.

Является лидером в области хранилищ данных.
Основной конкурент - действительно IBM DB2 в массивно-параллельной конфигурации.


С уважением,
Константин Лисянский
http://lissianski.narod.ru

P.S. Кстати, вы забыли подпись - Николай Куликов, IBM :)
...
Рейтинг: 0 / 0
teradata сравнение
    #32494205
_Dog
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сравнение - посмотри Sybase IQ. Например здесь: http://www.sybase.ru/Syb/corporate/events/iq_30-03-2004.htm

Просто _Dog, не sybase.ru :)

P.S. libo : http://www.sybase.com/products/bi и Terradate не надо...
...
Рейтинг: 0 / 0
teradata сравнение
    #32494266
Nikolay Kulikov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин.

На счет побили IBM и Oracle. Посмотри на 10 Тb результат. Price perfomance одинаковый с точностью до цента. Какое удивительное совпадение :) Только IBM сделал этот результат раньше и Teradat'e было от чего плясать при проведении тестов и выборе политики лицензирования :)

Добавить еще одну регату и та же производительность будет и у DB2.

Поддерживает стандарты и работает в 95% cлучаях только на своих NCR (Windows в том числе) помоему это не есть полная открытость.

Nikolay Kulikov, IBM.

P.S. Вышеизложенное является моей личной точкой зрения и не может быть расценено как официальное заявление IBM.
...
Рейтинг: 0 / 0
teradata сравнение
    #32494505
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Николай:

Price perfomance одинаковый с точностью до цента. Какое удивительное совпадение :)
Это чтобы показать, что можно получить одинаковый price/performance, только с более высоким performancом. Это очевидно.

Только IBM сделал этот результат раньше и Teradat'e было от чего плясать при проведении тестов и выборе политики лицензирования :)

На всякий случай процитирую:

Teradata 81,501.6 $266 December 20, 2002
IBM 62,214 $266 May 15, 2003


Откуда видно, что availability date отличается на полгода. Причём, у IBM он позже.
Смотрим дату пресс-релиза - 1/9/2003 . Это означает, что система, на которой производился тест у NCR уже была доступна, а у IBM она только должна была появиться. Делаем выводы сами...

А вопрос по ценам Терадаты так и канул в Лету?
Если делается заявление, его надо бы подтвердить. Пока мы имеем неподтверждённое утверждение Терадата, очень и очень дорогой продукт

Поддерживает стандарты и работает в 95% cлучаях только на своих NCR (Windows в том числе) помоему это не есть полная открытость.

Николай, это несерьёзно. Откуда такая точность - 95%?
Какие из вышеперечисленных мной стандартов являются неоткрытыми? И, вообще, что надо понимать под открытостью?
Если есть система, которая для доступа к ней предоставляет кучу открытых интерфейсов (например ODBC, JDBC) плюс механизмы доступа с "закрытых" платформ (с мэйнфреймов, например), то такая система, на мой взгляд, и есть открытая. Или я что-то не понимаю?


P.S. Вышеизложенное является моей личной точкой зрения и не может быть расценено как официальное заявление IBM

Верю :)


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32494551
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сравнение - посмотри Sybase IQ. Например здесь: http://www.sybase.ru/Syb/corporate/events/iq_30-03-2004.htm

Посмотрел. Внимательно посмотрел на Пример незапланированного запроса, сформированного пользователем с помощью Business Objects
Комментарии следующие:
1. Могли бы и отформатировать запрос для начала. Или рассчитывали запутать читателя сложностью текста?
2. Я всё-таки отформатировал его чтобы посмотреть насколько он сложен. Сделал вывод, что это несложный запрос, и со стороны Sybase, мне кажется, было непрофессионально его публиковать. Думаю, они его уберут, когда опомнятся.
Итак:
Сложность запроса заключается лишь в наличии там 32 джойнов. Про бизнес-значимость такого "аналитического" запроса сказать вообще трудно. Делается выборка клиентов со всеми их контрактами, менеджерами и названиями подразделений. Какие бизнес-решения можно принимать на основе таких запросов? А где вычисления? Где агрегирование?
Сначала эти самые большие таблицы укорачиваются путём наложения фильтров (причём, всё по индексам), а потом что получилось джойнится. Характеристики таблиц не привели - 500 миллионов строк в какой таблице? Выборка из неё по индексу сокращает её до 1 строки, которая дальше джойнится? Показали бы план запроса хотя бы.

В общем, весьма неубедительный пример.
Может быть IQ действительно хорошая штука, но только не в этом примере.


http://www.sybase.com/products/bi и Terradate не надо...
А здесь что имелось в виду?


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32494650
_Dog
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Посмотрел. Внимательно посмотрел на Пример незапланированного запроса, сформированного пользователем с помощью Business Objects
Комментарии следующие:
1. Могли бы и отформатировать запрос для начала. Или рассчитывали запутать читателя сложностью текста?
2. Я всё-таки отформатировал его чтобы посмотреть насколько он сложен. Сделал вывод, что это несложный запрос, и со стороны Sybase, мне кажется, было непрофессионально его публиковать. Думаю, они его уберут, когда опомнятся.
Итак:
Сложность запроса заключается лишь в наличии там 32 джойнов. Про бизнес-значимость такого "аналитического" запроса сказать вообще трудно. Делается выборка клиентов со всеми их контрактами, менеджерами и названиями подразделений. Какие бизнес-решения можно принимать на основе таких запросов? А где вычисления? Где агрегирование?
Сначала эти самые большие таблицы укорачиваются путём наложения фильтров (причём, всё по индексам), а потом что получилось джойнится. Характеристики таблиц не привели - 500 миллионов строк в какой таблице? Выборка из неё по индексу сокращает её до 1 строки, которая дальше джойнится? Показали бы план запроса хотя бы.


Dumaju etot zapros - prosto primet togo, kakoj SELECT mozet polucit'sia pri ispolzovanii ad-hoc sistem tipa Businessobjects. V IQ kazdyj stolbec v kazdoi tablice - avtomaticeski index. Pri etom, objem mesta na diske ne rastet a umensaetsia s uveliceniem kolicestwa dannyh. Ideja takova, cto pri zaprose liuboi sloznosti dopolnitelnogo tiuninga delat nenado + vozmozny zaprosy liuboj sloznosti (inogda liuboi "gluposti").

Может быть IQ действительно хорошая штука, но только не в этом примере.
Soglasen, cto i Terradata stuka neplohaja, t.k. i IQ i Terradata - bazy iznacalno sozdannye dlia DW. Ostaetsia lish vopros cena, sloznost i cena zeleza v okoncatelnoj konfiguracii.

Neznaju skolko stoit TData, mogu tolko predpolozit, cto est kakieto usecennye varianty pod Windy - podesevle (mozet daze i ~20k$ CPU) - zdes ja tak ponimaju ty znaes lutse (tolko ne govoris ;) ) a IQ CPU dlia liuboi platformy ~30k$ (eshop.sybase.com).
Sloznost i cena zeleza (trebovanija k HW) - dumaju u IQ polutse.

http://www.sybase.com/products/bi и Terradate не надо...
А здесь что имелось в виду?

Primery vnedrenii i drugaja info. Eto bolse na pervyi post.
...
Рейтинг: 0 / 0
teradata сравнение
    #32494790
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 _Dog:

Спасибо. По крайней мере, конструктивно. В отличие от некоторых :)

Neznaju skolko stoit TData, mogu tolko predpolozit, cto est kakieto usecennye varianty pod Windy - podesevle (mozet daze i ~20k$ CPU)

Версия под Windows имеет абсолютно ту же самую функциональность, что и под UNIX. Она не усечённая.


- zdes ja tak ponimaju ty znaes lutse (tolko ne govoris ;) )
Может, и знаю, а может и нет, кто меня знает? :)) Я немного про неё изнутри знаю.


a IQ CPU dlia liuboi platformy ~30k$ (eshop.sybase.com).


Sloznost i cena zeleza (trebovanija k HW) - dumaju u IQ polutse.
Гы :) Что значит получше? У меня зарплата хорошая, только маленькая :))
Это в смысле самый мощный Sun - требования получше? :)

V IQ kazdyj stolbec v kazdoi tablice - avtomaticeski index. Pri etom, objem mesta na diske ne rastet a umensaetsia s uveliceniem kolicestwa dannyh. Ideja takova, cto pri zaprose liuboi sloznosti dopolnitelnogo tiuninga delat nenado + vozmozny zaprosy liuboj sloznosti (inogda liuboi "gluposti").

Я знаю какой метод хранения использует IQ. Вне сомнения, для определённых запросов этот подход имеет очевидные преимущества (кстати, Терадата тоже поддерживает компрессию столбцов, хотя это не является её архитектурным принципом), но не для "любых". По поводу уменьшения количества данных при росте объёма - надо быть поосторожнее, а то можем дойти до того, что бесконечный объём данных можно хранить на дискете (тут следует выход Юрия, но, будем надеяться, что он не читает этот пост :). Вспомним теорию кодирования информации - эффективное кодирование возможно при хорошей повторяемости, что не всегда возможно. Опять-таки, я не сомневаюсь в том, что данные сжимаются, но не неадо шапкозакидательства.
Про доплонительный тьюнинг и глупые запросы - в идеале оптимизатор СУБД должен стремиться к тому, чтобы уметь переписать "глупый" запрос с целью сокращения количества ресурсов, необходимых для его выполнения. Однако такой оптимизатор - вещь чисто теоретическая, чем ближе реальный оптимизатор к этому идеалу - тем лучше. Ну, а если я сделаю кросс-джойн трёх-четырёх таблиц по 500 миллионов записей, какая СУБД это выдержит?
Так что про "любую" сложность можно писать с определёнными оговорками.
Для меня слово "любой" означает "никакой". Это в качестве защиты от нахрапистого маркетинга (не с Вашей стороны, конечно же, а вообще).

Да, вот слышал о том, что грузить данные в IQ можно только через специальный узел, предназначенный для загрузки. Это правда? То есть, если в системе 10 узлов, а только один из них для загрузки, то в процессе загрузки используется только 1/10 часть системы?
Ещё слышал, что он не очень любит транзакций, что не очень хорошо, если вы собираетесь строить активное хранилище данных с загрузкой в on-line. По этой же причине, похоже, Sybase рекомендует весь ETL делать на другой платформе (Sybase ASE), что добавляет к общей стоимости владения определённые расходы, ну и скорость загрузки тоже может снижаться за счёт необходимости дополнительных манипуляций с данными.



С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32494933
_Dog
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Версия под Windows имеет абсолютно ту же самую функциональность, что и под UNIX. Она не усечённая.

Sekretnost vezde :) nu ne hoces ne govori o cenah. to cto ja slysal, eto cto normalnoe vnedrenie TD stoit ot 1m$. (Znaju o neskolkih bankah v Skandinavii). Ne dumaju cto krupnye TD instaliacii stojat na prostom Win ili Unix servere.

Sloznost i cena zeleza (trebovanija k HW) - dumaju u IQ polutse.
Гы :) Что значит получше? У меня зарплата хорошая, только маленькая :))
Это в смысле самый мощный Sun - требования получше? :)


Da net :) ~100-150Gb row data, 10-15 userov online, Windows s 1CPU hvataet (vse zelezo ~10k$) i otvety max do 0.5min. Retail kstati :)

повторяемости, что не всегда возможно. Опять-таки, я не сомневаюсь в том, что данные сжимаются, но не неадо шапкозакидательства.

To cto ja slysal (ot Sybase), TD zmet dannye lutse liubogo Ora, IBM, MS no ne tak horoso kak IQ. Esli horoso pomniu na 40-50TB row data v IQ do 30TB poluhaetsia. To cto sam videl, iz 150gb v IQ ostalos 110gb.

Про доплонительный тьюнинг и глупые запросы - в идеале оптимизатор СУБД должен стремиться к тому, чтобы уметь переписать "глупый" запрос с целью сокращения количества ресурсов, необходимых для его выполнения.

Tut ja dumaju i est osodno iz osnovnyh olicii IQ i TD ot OLTP baz. Optimizatory namnogo 'umnee'.

Да, вот слышал о том, что грузить данные в IQ можно только через специальный узел, предназначенный для загрузки. Это правда?

net. i rabotat vo vremia dozagruzki mozno.

Ещё слышал, что он не очень любит транзакций, что не очень хорошо, если вы собираетесь строить активное хранилище данных с загрузкой в on-line.

Tranzakcii ne liubit - ne dlia etogo sozdan. A tak liubopytno - TD tranzakcii liubit?

По этой же причине, похоже, Sybase рекомендует весь ETL делать на другой платформе (Sybase ASE), что добавляет к общей стоимости владения определённые расходы, ну и скорость загрузки тоже может снижаться за счёт необходимости дополнительных манипуляций с данными

ja o takih 'ekomendacijah' tolko ot Oracle slysal. Vidno u nih na etom 'how to fight Sybase' stroitsia ;) U TD toze takie internal doci? :)
ETL eto drugaja istorija. Kotoraja po moemu zavisit ot mnozestva drugih pricin i faktorov. IQ i Sybase v etom smysle ocen flexible.
...
Рейтинг: 0 / 0
teradata сравнение
    #32495012
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
eto cto normalnoe vnedrenie TD stoit ot 1m$
Не знаю, но был тут недавно на конференции, где представители IBM оценили проект по созданию хранилища данных в $300K-$4M.

Ne dumaju cto krupnye TD instaliacii stojat na prostom Win ili Unix servere.
Не думаю, что крупные инсталяции IQ стоят на писюке с одним процом :)
Крупные инсталяции TD стоят на массивно-параллельных серверах (UNIX или NT), состоящих из простых серверов, соединённых специальным коммутатором, который называется BYNET (с офигительной пропускной способностью :).

Tranzakcii ne liubit - ne dlia etogo sozdan. A tak liubopytno - TD tranzakcii liubit?
Терадата в этом смысле - стандартная реляционная СУБД. Поддерживает блокировки и даже протокол двухфазного коммита (для связки с MQSERIES, например), поддерживает и апдейты (которые как и все остальные операции выполняются параллельно) что делает её пригодной для активных хранилищ данных.
Кроме этого в придачу имеется куча утилит для загрузки (FastLoad, Multiload, TPump, WarehouseBuilder). Ну, и, естественно, можно загружать данные когда пользователи делают запросы.

ETL eto drugaja istorija. Kotoraja po moemu zavisit ot mnozestva drugih pricin i faktorov. IQ i Sybase v etom smysle ocen flexible.

А можно примеры этого being flexible?

С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32495040
Nikolay Kulikov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
>Откуда видно, что availability date отличается на полгода. Причём, у IBM он
>позже.
>Смотрим дату пресс-релиза - 1/9/2003. Это означает, что система, на которой >производился тест у NCR уже была доступна, а у IBM она только должна была >появиться. Делаем выводы сами...

Какие выводы??? После availability IBM'кой системы терадата ушла c tpc.org ??? :)
A если серьезно cистемы на Power4 с 1.3 Gz доступны с этого времени.

>А вопрос по ценам Терадаты так и канул в Лету?
>Если делается заявление, его надо бы подтвердить. Пока мы имеем >неподтверждённое утверждение Терадата, очень и очень дорогой продукт

Description Per Node Per CPU
Teradata/DB V2R4.1 MP-RAS 4900 (2-CPU node) $118,181 $59,091
1 month warranty
Teradata/DB V2R4.1 MP-RAS 5300 (2-CPU node) $154,545 $77,273
1 month warranty
Source: NCR GSA-IT Schedule # GS-35F-4933H as of September 2002

эти цены староваты, насколько мне известно эти цены повысились.
К сожалению терадата их открыто нe выставляет, не странно ли.

>Николай, это несерьёзно. Откуда такая точность - 95%?
>Какие из вышеперечисленных мной стандартов являются неоткрытыми? И, >вообще, что надо понимать под открытостью?
Хорошо ~95% - сейчас не вспомню но в каком-то отчете это проскакивало.
Доступность Теradata на HP-UX это "Приманка", почти все референсы это NCR.

Константин, открытость помимо стандартов это еще и возможность смены аппаратной платформы.

>Если есть система, которая для доступа к ней предоставляет кучу открытых >интерфейсов (например ODBC, JDBC) плюс механизмы доступа с "закрытых" >платформ (с мэйнфреймов, например), то такая система, на мой взгляд, и есть >открытая. Или я что-то не понимаю?

Mэйнфреймы не более закрыты чем Teradata.

Nikolay Kulikov
P.S. Вышеизложенное является моей личной точкой зрения и не может быть расценено как официальное заявление IBM
...
Рейтинг: 0 / 0
teradata сравнение
    #32495084
Nikolay Kulikov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот еще
http://www.teradatalibrary.com/pdf/meta_052103.pdf

Код: plaintext
1.
2.
3.
4.
Component Description Average Observed           Cost Teradata  Industry Typical Costs
Server hardware  2 - or  4 -way Intel servers         $167  ,253         $20  ,000 - $30  ,000 
Storage devices Typically LSI disks/GB price      $144             $20 - $30 /GB
Software Database, query tools, load tools, etc.  $168  ,245         $100  ,000  /4  processors
...
Рейтинг: 0 / 0
teradata сравнение
    #32495131
_Dog
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Tut ja s Nikolaem soglasus - skolko ezdil po Evrope, tam skazat cto TD desevo - kak na duraka posmotriat :) Teradata dlia nih, eto servak s softom cut' ne pod klienta sobranyi.

Hot i budet kakaja nibud reklamnaja fiska, tipo TD na NT - naprimer 20k$

No eto ne umaliaet dostoinst TD kak bazy dlia DW. Glavnoe ne ogranicitsia odnoi TD. I Sybase IQ (#1DW pod Win po Winteru, dobraja polovina Telco DW v Evrope) i IBM est cto skazat.

+ po sluham TD for Retail verojatno neplohoi produkt. No eto sovsem ne baza i ne 1CPU WinNt :)
...
Рейтинг: 0 / 0
teradata сравнение
    #32499590
Зл0й
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У нас в банке стоял Оракл 8i, на нем крутился Data Warehouse на несколько терабайт. Ну очень много депозитных счетов - банк американский. Все это дело работало на 8й соляре и на сантехнике марки Е десять тыщ (Е10000). Периодически оно грохалось, из-за глюков комплекса ОС+СУБД, отказов сантехники и разгильдяйсва DBA. Грохалось примерно раз в месяц. В конце концов начальство пораскинуло мозгами и решило переползать на Терадату. Основной аргумент - "чтобы было все как у взрослых". Кто-то им напел, что Терадэйта масштабируецца лучше Оракла и вообще "блатнее". Наверное это был продавец Терадэйты.

В общем, to make the long story short, теперь у нас раз в месяц Терадэйта падает вместо Оракла. Самое смешное в том, что причины те же: глюки комплекса ОС+СУБД, отказы NCRовской железяки, и неистребимое разгильдяйсво DBA. Вот чего умеет Терадэйта и не умеет Оракл - так это сделать быстрый full table scan немерянной таблицы. При всей моей пламенной любви к Ораклу, тут Терадэйта однозначно рулит. Другой вопрос, а так уж ли необходим быстрый full table scan немерянной таблицы. ИМХО почти всегда можно обойтись и без него, запросы надо уметь писать, и индексы создавать. Фишка в том что у нас как подключится какой-нибудь горе-аналитик к базе, как начнет с помощью Cognos или ему подобного уродца запускать сгенеренные SQL-запросы которые быстренько кладут базу. И усо. Все отдыхают. Единственный способ бороться с таким юзером - "административный фашизм". Я бы полечил таких юзеров квотами, да мне не дали. Сказали "поставим Терадату и все будет пучком". Денег уложили - жуть сколько! Одним только консультантам из Терадаты было уплачено НУ ОЧЕНЬ много, за то чтобы они "под ключ" все сделали. Они сделали, работает так же как и на Оракле.

Имя банка называть не буду, ато мне еще за это по шапке настучат. Но в десятку крупнейших банков США мы входим. Кстати, Оракл похвалялся как он немерянный многотерабайтный Data Warehouse для французской телеком-компании перевел с Терадэйты. Вроде клиент писАл кипятком от восторга, со слов Оракла.

Мораь такая - И Оракл и Терадэйта вполне приличные продукты, каждый со своими достоинствами и недостатками. Нужно свою СУБД знать и любить. И тогда все у вас получится.
...
Рейтинг: 0 / 0
teradata сравнение
    #32511902
Павел Новокшонов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По службе мне приходится администрить Teradata, DB2 UDB и Informix IDS в одном из американских казино. Teradata у нас используется как основной движок для ХД. Пользователи, а их порядка 1500, кидают запросы различной сложности посредством Cognos. Что могу сказать по поводу Teradata. Реляционная СУБД, поддерживает все основные стандарты SQL, ODBC т.д., отлично масштабируется, начиная с пары сотен гиг и заканчивая сотнями терабайт (пример Wal Mart и SBC Communications). Падает редко. За 4 года работы у нас был всего лишь один серьезный сбой вызванный неполадками со железом. Если и приходится перегружать сервер, то лишь при серьезных апдейтах версий. Иной раз бывало отваливался один из SMP узлов в кластере, в течении 5-7 минут Teradata рестартовала на оставшихся 5 узлах и система снова была в онлайне. В качестве диск сторадж мы используем EMC Symmetrix. Система доступна пользователям в режиме 24/7/365, включая то время когда работают процессы по подгрузке/обновлению данных, а также бэкапы и collect statistics. Teradata очень легко администрить. Т.к. для распределения данных на диске используется хэш-партишонинг, нет необходимости перестраивать индексы. В Informix приходится это делать регулярно. Оговорюсь правда, что это древняя 7-я версия Informix'a.
Хранилище данных на Teradata у нас в компании используется не только для т.н. "тяжелых" SQL запросов, но и для оперативных запросов пользователей выполняющихся с секундным временем ответа. В терминолгии NCR это звучит как ADW - active datawarehosing. В Терадата есть механизмы позволяющие регулировать распределение ресурсов ЦПУ и диска в зависимости от типа пользователя выполняющего тот или иной запрос. Что аналогично DB2 Governor. Кроме того имеются возможнсти ограничивать количество одновременно выполняемых запросов того или иного типа. Если время выполнения запроса не критично, а установленная квота уже выбрана, то запрос откладывается и выполняется позднее. Вся эта фигня используется когда ХД используется в одном флаконе как для DSS, так и для OLTP задач. В силу своей параллельной MPP архитектуры Терадата отлично выполняет full table scans. В этом сила брат. :-) Но кроме того есть возможности строить т.н. join индексы, пре-джойня большие таблицы под определенные запросы пользователей. Есть возможности стоить т.н. PPI - partitioned primary index. Полезно когда запрос читает данные за какой-то период времени по месяцам, кварталам. Ну и наконец, когда нужно достать данные по значению поля используемого для hash-partitioning запрос выполняется моментально, в силу того, что Teradata уже знает на каком узле параллелизма/диске лежит запись. Teradata работает на интеловской архитектуре, на железе от NCR, Dell и Компак. OC - NCR Unix MP-RAS либо ЭнТя. По последним слухам вроде как будет версия по Линух.

Про цену. Дорого. Даже в штатах клиенты Teradata это как правило компании Fortune 500, для которых потратить "мильон" на базу данных не проблема. По поводу TPC бенчмарков и прочих сравнений. Сугобо ИМХО. Мужики не парьтесь - все эти игры от лукавого. Каждый вендор загнет их под себя как ему надо, навешает лапшу на уши менеджерам, а DBA потом мучается и по ночам пейджеры звонят.
...
Рейтинг: 0 / 0
teradata сравнение
    #32512336
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Павел Новокшонов:

Павел, а сколько у вас сейчас в хранилище данных?
А сколько в день запросов к нему делается?

Каждый вендор загнет их под себя как ему надо, навешает лапшу на уши менеджерам, а DBA потом мучается и по ночам пейджеры звонят.

У тебя-то не звонит, небось, если говоришь, что администрировать почти не приходится?

2 Злой:
Кстати, Оракл похвалялся как он немерянный многотерабайтный Data Warehouse для французской телеком-компании перевел с Терадэйты.

Насколько мне известно, не перевёл, а просто другую систему построил. Но, говорят, что это не хранилище, а просто архивная ситема для хранения звонков (типа, местным органам чтобы можно было быстро выдать справку кто и когда с такого-то номера звонил). Ещё слышал, что хранилище на Терадате так и работает у них.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32512517
Павел Новокшонов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Объем ХД порядка 800Гб. В среднем в день выполняется порядка 4500-5000 DSS запросов и ~50000 "быстрых" OLTP запросов. Администрировать конечно же приходится, но скорее на предмет анализа производитльности различных запросов пользователей, capacity planning и т.п.
...
Рейтинг: 0 / 0
teradata сравнение
    #32514048
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Павел:

А какое количество записей в самых больших таблицах?
А ещё можешь привести текст какого-нибудь аналитического запроса?

2 Злой:
Кстати, Оракл похвалялся как он немерянный многотерабайтный Data Warehouse для французской телеком-компании перевел с Терадэйты.

А здесь пишут как Oracle не справился и был заменён на Терадату.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32514052
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот, ещё DHL с Oracle на Терадату перешёл . Совсем недавно, кстати.

Вот тут ещё пара таких миграций описана.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32514055
Gt.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Gt.
Гость
Scores of customers have already replaced their Teradata systems with Oracle, including Abbey National, British Telecom, France Telecom, Orange Switzerland, Banco de Credito, and more. In fact, Banco de Credito expects to save US$1 million a year with Oracle.
...
Рейтинг: 0 / 0
teradata сравнение
    #32514063
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Gt:

А Вы, вероятно, Oracle представляете?

Насколько мне известно, British Telecom отказался от использования Терадаты в силу того, что в тот момент произошло поглощение Терадаты компанией AT&T, прямым конкурентом British Telecom, который не хотел, чтобы конкурирующей компании были доступны его конфиденциальные данные.

Про France Telecom я уже написал - похоже, что там не заменили Терадату. Вроде бы, работает она там.

А можно ссылочки на success stories или на независимые источники?
Особенно в части and more очень интересно. Может, Вы точную цифру знаете? NCR заявляют, что заменили более 120 систем c Oracle на Терадату .
Вон, даже документ на сайт выложили.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32514311
Gt.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Gt.
Гость
авторА Вы, вероятно, Oracle представляете?

да нет, просто вы тут устроили впечатление что тут какие-то масовые миграции с оракла на терадату :)
просто оракл терадату похоже вооще не воспринимает как конкурента, они могут что-либо показать только на DW и занимают 6% от рынка - я только через гугл нашел документ по миграции :)

авторА можно ссылочки на success stories или на независимые источники?

http://www.oracle.com/customers/
...
Рейтинг: 0 / 0
teradata сравнение
    #32514356
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Oracle - прекрасная СУБД для OLTP вне сомнений. Терадата позиционируется исключительно как СУБД для хранилищ данных. Однако в последнее время они делают упор на так называемые "активные хранилища данных", когда хранилище грузится в режиме реального времени и отвечает не только на стратегические вопросы, но и на тактические. См. выше пост Павла.

Я не думаю, что Oracle не рассматривает Терадату как конкурента, поскольку с недавнего времени также стал уделять хранилищам данных внимание.

да нет, просто вы тут устроили впечатление что тут какие-то масовые миграции с оракла на терадату :)
В области хранилищ данных - возможно. Наверное, Оракл ещё не так хорош в этой области, если заменили его 120 инсталляций на Терадату, а наоборот не больше десятка (да, и то непонятно на этой странице про миграции явно сказано только про Abbey National и Banco De Credito). Прикиньте, компания, имеющая 6% рынка хранилищ данных (с Ваших слов) заменяет системы, построенные лидером рынка СУБД. Как тут не рассматривать такую компанию как конкурента?



С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32514540
Gt.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Gt.
Гость
авторЯ не думаю, что Oracle не рассматривает Терадату как конкурента, поскольку с недавнего времени также стал уделять хранилищам данных внимание.

в смысле хранилище это вроде DW, в DW круче оракла только горы (37% процентов рынка). TPC-H меряет запросы - тут как бы тоже круче оракла никого. или вы о чем-то другом ?

авторКак тут не рассматривать такую компанию как конкурента?

так это всего лишь 1 задача и в ней 6% ... а есть еще OLPT, OLAP, Oracle Aplications, App server, и туча другого хлама за немеряные деньги. вот IBM и MS - конкуренты, и в TPC/SAP бенчмарках и в индустриальных решения, а терадата ? ну да есть бд, наверно хорошая - но к ней все равно нужно оракл для OLPT ...
...
Рейтинг: 0 / 0
teradata сравнение
    #32514639
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
в смысле хранилище это вроде DW, в DW круче оракла только горы (37% процентов рынка). TPC-H меряет запросы - тут как бы тоже круче оракла никого. или вы о чем-то другом ?

Крутость решения не измеряется только долей рынка.
По оценкам аналитиков впереди шагают Терадата и IBM. Oracle пока challenger.

TPC-H - это база данных из 8 таблиц "моделирующая" реальную систему и 22 заранее известных запроса. Где Вы видели реальное хранилище из 8 таблиц и заранее известные запросы к нему? К таким тестам можно очень хорошо подготовиться заранее, встроить специальные фичи в СУБД чтобы всё работало быстро. Так что, тесты - это ещё не показатель. См. реплику Павла Новокшонова по этому поводу.
Терадата по какой-то причине перестала выступать в этих тестах (вероятно, решили вкладывать деньги более правильно - посмотрите сколько стоит собрать систему для теста - под 10 миллионов).
Хотя ещё год назад они били оракл раза в 3. Неужели Вы думаете, что за год что-то изменилось?

Так что, я думаю Oracle должен побаиваться Терадаты в этом сегменте рынка.

С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32514706
Gt.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Gt.
Гость
авторПо оценкам аналитиков впереди шагают Терадата и IBM. Oracle пока challenger.

странно а по данным IDC картина совсем другая:
http://www.oracle.com/corporate/analystportal/insider/idc_dwsurvey.pdf

Overall data shows that Oracle presence stands at 37%, followed by Microsoft (35%), IBM (18%), Teradata (6%), Sybase (3%), and SAS (2%). (Note that other database vendors were not included in the question).

Oracle dominates the LDW market at the 500GB+, 1TB+, and 4TB+ levels. However,
its lead disappears at the highest level of 6TB+. In this segment, both IBM and
NCR/Teradata have higher market presence than Oracle.


на счет TPC-H
http://www.oracle.com/corporate/analystportal/insider/forrester_teradata_exits_tpc-h_17mar04.pdf

E X E C U T I V E S U MMA R Y
Teradata quietly withdrew its 10 TB and 3 TB TPC-H decision-support (data warehousing)benchmarks
on March 4,2004,without formal,public comment and will abstain from future publications of TPC-
H benchmarks.Teradata asserts the bene fits of not competing will outweigh the flak it will take from
its competitors,which continue to compete.However,the real loss will be experienced by clients and
prospects that will be poorer in information and the innovations driven by the benchmark.
TERADATA EXITS THE TPC-H SHOWCASE
Teradata has withdrawn its participation in the TPC-H data warehousing benchmarks.Long the
highest-powered — and highest--priced — player in large--scale data warehousing,the vendor
leaves the field while it is 31%ahead of the nearest competitor,IBM,in the composite power and
throughput metric (QphH).Teradata is tied with IBM for price/performance at $243 and it lags by
30.8%in the pure price category at the 10 TB volume point.1 Teradata ’s reasons for quitting the TPC-
H include:
· The TPC-H benchmark is an arti ficial and solved problem.In exiting from the TPC-H,
Teradata cites many of the concerns Forrester has raised in the past about these benchmarks:
Customer workloads are di fferent than the benchmark in terms of data model,numbers of
users,and mixture of queries.The actual queries have been known since the TPC-D,which was
discontinued in 1999.Vendors have reverse engineered them up,down,and sideways — there
is little more for them to learn.
· Teradata customer prospects require custom benchmarks.Teradata acknowledges that the
benchmark has driven database innovations — such as join index and partitioned primary
index — from which customers have bene fited.However,it claims that approach has run its
course and the resources are better devoted to performing more custom benchmarks for speci fic
customers to close pending deals.(Teradata reportedly completes more than 40 annually.)The
TPC-H makes data warehousing seem like one size fits all,which it is not.
...
Рейтинг: 0 / 0
teradata сравнение
    #32515450
Зл0й
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Что меня лично конкретно не порадовало в Teradata, так это что можно было "неправильным" SQL запросом заставить базу упасть и перезапуститься. Был такой нехороший баг. В оракле тоже глюков хватает, например hash join between a local and a remote table в 8i. Но в Oracle обычно там падает dedicated server process и пользователь получает "end of file on communication channel". А база как была в up так и осталась. А юзер может быстренько перезапустить сессию sqlplus и попробовать тот же запрос, но уже с хинтом. Или analyze table какой-нибудь. А не сидеть курить бамбук пока база сделает restart. Ну это так, мои личные наблюдения. На звание гуру по Teradata я не претендую. А что до быстрых full table scans, в оракле тоже parallel query есть. Если мы к тому же самому EMC подключим SMP-машину и MPP кластер и начнем гонять базу "в хвост и в гриву" то где у нас скорее всего будет затык по производительности? "Между кантупером и диском" грубо говоря. Посему я не вижу причины по которой MPP архитектура должна превосходить SMP для субд, если узкое место - диск. Но это так, из общих соображений.
...
Рейтинг: 0 / 0
teradata сравнение
    #32515550
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Что меня лично конкретно не порадовало в Teradata, так это что можно было "неправильным" SQL запросом заставить базу упасть и перезапуститься. Был такой нехороший баг.

Скорее всего, что-то не настроили. У меня пару раз такое бывало с AS/400. Потом админы поправили и он перестал перезагружаться.
А Вы фичи типа Priority Scheduler не используете? Эта штука позволяет ограничивать ресурсы, которые может потреблять отдельный пользователь. Например, можно для начинающих юзеров пока они тренируются выставить квоты на системные ресурсы пониже.

Посему я не вижу причины по которой MPP архитектура должна превосходить SMP для субд, если узкое место - диск

Ага. А если к болиду Формулы-1 приделать деревянные колёса, то может и не поехать как хотелось бы :)
Это к тому, что к каждой СУБД есть оптимальная для её архитектуры конфигурация.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
teradata сравнение
    #32515682
Павел Новокшонов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Самая большая таблица в хранилище чуть больше 1 миллиарда записей. Грубо говоря когда чувак приходит в казино, вставляет свою карточку игрока в определенную слот-машину и играет, в хранилище появляется запись о том сколько времени он играл, сколько проиграл/выиграл, на сколько сорвал джекпот и т.п. Меньшие таблицы имеют порядка 400-500 миллионов записей.

To Зл0й

Я согласен на все 100, что глюков везде хватает. Как правило месяца через 2-3 после выхода нового релиза будь то Teradata или DB2 появляется многостраничный документ с описанием найденных bugs. У меня даже закрадывается мысль, а не пихают ли разработчики СУБД сознательно энное кол-во жуков в код, что-бы потом их "устранять" и на большие бабки клиентов раскручивать засчет maintenance fees, minor release updates и т.п. Проблем также добавляет Cognos, который зачастую генерит отвратительный SQL. В идеале люди ответственные за разработу и поддержку каталогов должны неплохо разбираться в СУБД, но это не всегда соответствует жизненным реалиям. Честно говоря я не видел, чтобы плохой SQL убивал-бы Teradata и выливался бы в ре-старт. Иногда бывает что парсинг энджин сблеванет на плохой сиквел и база делает т.н. snapshot dump. Но это не рассматривается как outage т.к. все в онлайне, скорее это сигнал - hey this SQL is causing problems. В этом случае Teradata автоматически подгружает крэш-дамп в Калифорнию, а там умельцы из тех-сапорта извлекают SQL и имя юзера.

По вопросу MPP v.s. SMP. Как можно делать ХД терабайт эдак на 100 в SMP архитектуре? Было бы просто интересно посмотреть на эту систему. В том же DB2 версия EEE позиционируется как база для ХД в кластерной MPP архитектуре. У информикса есть или была аналогичная версия XPS. Про Оракл не скажу, поскольку ничего про него не знаю.

Priority Scheduler в Терадате штука хорошая, но она служит скорее не для "борьбы" с плохим SQL, а для оптимального управления загрузкой хранилища. Тобишь когда надо дать одному парню раза в четыре больше CPU чем другому. Priority Scheduler бывет особенно полезен, когда тяжелые запросы должны сочетаться с оперативными запросами, требующими быстрого времени ответа системы.
...
Рейтинг: 0 / 0
teradata сравнение
    #32517089
Зл0й
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У нас база делала рестарт из-за криво написанных ХП. Привожу дословно ответ от саппорта Терадэйты (copy-paste):

The problem is identified as "3906 crash for stored procedure
call statement". The crash occurs when a stored procedure with a derived
table is called and there is an error from the derived table.

In a procedure if you are trying to refer an object (table, index, view etc)which is not existing while running the procedure - then the Database would crash.

So please make sure all the objects you are referring thru' a procedure are exits before running them. Most of the time recompiling the procedure would catch it except in Dynamic SQL.

Вот такие пирожки. С котятами. Я конечно понимаю, что обращаться в ХП к несуществующим таблицам нехорошо. Но я не понимаю почему при такой банальной ошибке база должна ложиться. Ну да ладно.

Что касается MPP архитектуры, то я понимаю как и почему она полезна когда узкое место - CPU. NCR когда-то баловался такими системами с большим количеством интеловых процессоров. Я на такой заразе даже работал, операционка Dynix/ptx называлась. по моему личному опыту проблема производительности хорошо настроенной СУБД чаще всего упирается в быстродействие дисковой подсистемы. Я не беру экстремальные случаи когда кто-то на однопроцессорной Sun ultra 5 пытается data warehouse делать. По моему опыту когда сервак - адекватный решаемой задаче, все настроено как полодено, то мы обычно упираемся в i/o. Я не вижу как MPP железяка может эту проблему решить. Чем восьмипроцессорная SMP машина будет хуже кластера из восьми сопоставимых по производительности процессора blade servers, при условии что они подключены к одинаковому дивайсу фирмы EMC? ИМХО как только io всю сожрут так и устаканится производительность. На уровне обусловленном моделью нашего EMC, а вовсе не архитектурой.
...
Рейтинг: 0 / 0
33 сообщений из 33, показаны все 2 страниц
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / teradata сравнение
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]