О буднях инженера или почему я жду OpenFlow

К написанию этой заметки, меня подтолкнула статья про уязвимость сетевых чипов Intel. Я считаю, что описанное в статье является обычной практикой при эксплуатации современного оборудования.
В своей практике мне неоднократно пришлось наблюдать сбои в встроенном ПО.
Расскажу о своем бодании с оборудованием одного из главных сетевых вендоров (правый верхний угол всем известного квадрата).

Читая Release Notes к очередной прошивке, удивляешься, как много проблем обошел стороной.
Вкратце, процесс внесения исправлений в ПО состоит из:
  • Обнаружение проблемы
  • Открытие заявки
  • Многомесячное «бодание» с многочисленными level'ами техподдержки
  • Признание наличия проблемы, эскалация на разработчиков
  • Ожидание исправленной сборки
Постепенно сложилось впечатление, что с тестированием новых фич ПО у вендора все плохо: стандартный функционал работает из коробки, но стоит начать использовать какую-то отличную от базовой технологию, обязательно будут проблемы, либо сразу или после обновления (паранойя безопасников требует).
Вот с чем мне пришлось столкнуться лишь за пару лет:
  • После обновления ПО сломался sFlow-сенсор в коммутаторе (исправили ~ за 3 месяца)
  • При наличии в DHCP-ответе чужого Vendor Options, коммутатор игнорировал маску сети (мы пытались разворачивать сетевые устройства без ручного конфигурирования — не исправлено).
  • Модульный L3 коммутатор, после маршрутизации, самостоятельно добавляет в multicast-поток лишние кадры (ранее переданные пакеты), от чего софт на STB и даже программные клиенты типа VLC аварийно завершаются (проблема локализована до конкретного модуля, но по-прежнему не решена).
Было еще пара проблем, но они покажутся совсем уж «высосанными из пальца»: например, модульный коммутатор перегрузился во время заливки SSH-ключа на него, в середине рабочего дня (заявку даже не открывал, сгенерировал и залил новый ключ — пока не падало).
Каждый раз приходится доказывать вендору, что это не ты идиот криворукий: последний случай — по одной из проблем было переправлено два лога с падения прошивки с разницей в ~14 дней, после месяца молчания (!) они заметили, что в одном из 30 VLAN поменялась адресация и запросили вновь собрать все данные и описать всю топологию сети (слабо представляю как они будут воспроизводить сеть из 200 устройств).

Вот поэтому я жду OpenFlow, надеюсь в рамках этой инициативы вендоры смогут создать, наконец, нормальный софт.

А в Вашей практике часто ли происходит подобное или у только мне попадаются такие железки?


0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.