После того, как кластер №2 более чем на 50% умер, было решено заменить его полностью. Оставалась энная сумма денег, которые, конечно же, нужно было потратить. В этот раз всё было несколько сложнее. За попыткой вписаться в бюджет последовало написание технического задания, объявление тендера.
В итоге было куплено 15 материнских плат, 15 трехядерных Phenom’ов и немного более слабая конфигурация для головной машины.
Установка ПО на кластер началась с выяснения того, что BIOS, с которым поставляются материнские платы, нестабильно работает с быстрой памятью. 16 раз пришлось обновить BIOS. Дальше, впрочем, всё стало проще.
Первая мысль о том, как развернуть кластер была - не хочется возиться со всяческими загрузками по сети, давайте установим операционную систему на один узел, а после в помощью dd скопируем ее на все остальные узлы. Что и было предпринято с некоторыми нюансами.
В таком виде кластер просуществовал этак месяцев 6, за эти 6 месяцев пришлось ещё поднять большой кластер, что несколько поменяло представления о развертывании кластеров. Поэтому через полгода было решено переставить ОС на узлах. Началось всё с ещё одного обновления BIOS. На сей раз только на сильно нестабильно работающих машинах.
А далее было всё весьма прозаично: DHCP, DNS, TFTP, PXE, Kickstart.
И не смотря на наличие большого кластера, народ не спешит с этого маленького куда-то перемещаться.
Aucun commentaire:
Enregistrer un commentaire