Последние несколько дней я задаюсь вопросом: а зачем люди выбирают большую очень дорогую железку с очень дорогим софтом (всё от одного производителя) для того, чтобы построить хранилище данных? Когда начинаешь ковырять тему поглубже начинаешь задаваться ещё одним вопросом: зачем выбирать это супер дорогое решение, если его даже протестировать нельзя у себя?
Вот у Microsoft видение на архитектуру хранилищ данных иное (речь идёт о Parallel Data Warehouse или PDW):
1. Хранилище данных не обязательно должно быть дорогим с точки зрения аппаратуры (можно использовать стандартное железо)
2. Хранилище данных может быть распараллеливаемым и строиться из модулей
3. виртуализация в полный рост. Я в данном моменте имею в виду, виртуализацию, как абстрагирование софта от конкретного серверного железа.
4. Хранилище данных можно строить на менее дорогом ПО. (в тему статья о том, почему SQL Server реально дешевле Oracle)
Получаем решение, которое заказчики могут строить на различных протестированных конфигурациях (appliances) от разных вендоров железа. Можно построить распределённую параллельную конструкцию, которая увязывает воедино различные источники и витрины данных, при этом пользователи работают в привычной среде с привычных устройств (никто не мешает ходить с iPad к порталу на SharePoint 2010 и работать с отчётами через Office Web Apps).
Я считаю главным преимуществом этого подхода именно вариативность по железкам. Вы можете использовать сначала железо одного вендора, а потом другого. В случае нехватки мощностей, можно докупить дополнительный модуль (от третьего уже производителя). Никаких проблем с тестированием решения для обкатки архитектуры, никаких проблем с выбиванием хороших цен – конкуренция двигатель снижения расходов заказчиков.
Почитать можно подробнее здесь:
SQL Server 2008 Parallel Data Warehouse Edition – http://www.microsoft.com/sqlserver/en/us/editions/data-warehouse.aspx
Enterprise Data Warehousing -http://www.microsoft.com/sqlserver/en/us/solutions-technologies/data-warehousing.aspx
Презентация PDW – http://www.microsoft.com/global/sqlserver/2008/en/us/RichMedia/Parallel%20Data%20Warehouse/Default.html
upd После дискуссии в Twitter добавил в заголовок поста слово очень. Так справедливей.
View Comments