Техническая поддержка Atos Servers

Мы здесь, чтобы помочь Вам

 

Получите консультацию от экспертов Atos.
Мы здесь, чтобы помочь вам оперативно решить Ваши технические проблемы и запросы, ускорить восстановление и беспрерывную деятельность серверов Atos.

 

Создание тикета

Самостоятельное создание инцидента на сайтеПерейти к созданию

По телефону горячей линии

+7 (495) 737 2556

Необходимые технические инструкции доступны для скачивания по ссылке.

Потребуется предварительно создать учетную запись,
указав серийный номер установленного оборудования.

Перейти к документации


 

Утилиты, инструменты и прошивки по ссылке

Утилиты

Памятка

 

Получение помощи и связь с техподдержкой

  • Самостоятельное создание инцидента на сайте https://tickets.bull.com/otrs/customer.pl
  • По телефону горячей линии +7 (495) 737 2556
  • Отправить письмо на адрес Servers.Support@atos.net
  • По контактам выделенного для вас сервис менеджера (если предусмотрено)

Документация, утилиты управления и дистрибутивы ПО

Документация и утилиты доступны тремя основными путями:

  • С сайта https://support.bull.com/ols/product/platforms/bullion (требуется регистрация с указанием серийного номера оборудования)
  • Через техподдержку
  • При пусконаладочных работах, проведённых Atos, передается комплект документации, а также проводится ознакомление с утилитами и ПО

Что делает поддержка Атос, а что Заказчик?

  • Все компоненты сервера делятся на FRU (Field Replaceable Unit) и CRU (Customer Replaceable Unit).
    • FRU – заменяется только инженерами Atos или сертифицированными специалистами партнеров за счет компании Атос.
      • Примеры – материнская плата, процессор, индикаторная панель, NFC-панель.
    • CRU – должно быть заменено силами Заказчика. Инструкции по замене таких компонентов приведены в документе CustomerServiceGuide из пакета документации. Проведение работ силами и за счет компании Атос возможны по отдельной договоренности.
      • Примеры – блоки питания, оперативная память, жесткие диски, вентиляторные модули, PCIe-устройства в монтажных корзинах.
  • Техподдержка Atos отвечает за аппаратную часть серверов и микропрограммное обеспечение. Мы не можем гарантировать поддержку по вопросам: настройки ОС (кроме рекомендаций в документации производителя), клиентского ПО (кроме фирменных утилит Atos), сетей (IP и FC) и т.д.
  • Запчасти – для использования в серверах допустимо использовать только компоненты, приобретенные у Atos. Установка компонентов, приобретенных у третьих лиц, например, RAID-контроллеры, оперативная память и т.д. – не разрешается.
  • Замененные запчасти должны быть возвращены компании Atos, либо заказчик должен возместить их полную стоимость.
  • FW (прошивки):
    • Technical State (TS) – так называется комплект поставки прошивок, ПО и документации, которые гарантированно работают друг с другом.
    • Обновление прошивок компонентов производства Atos – техподдержка может оказать консультацию, выполнить бесплатно удаленно, либо сделать платный выезд для обновления силами инженеров Atos. Исключение – работы по обновлению, требующие специальных навыков/оборудования/ПО. О каждом таком исключении делается отдельное оповещение.
    • Обновление прошивок PCIe-устройств – при обновлении FW утилитами Atos (BSM HW CLI, iCare, BPM) обновляются только компоненты производства Atos, PCIe-устройства не затрагиваются. Обычно, обновление прошивок PCIe-устройств остается в руках Заказчика, поскольку требует выполнения из-под ОС. В комплект TS входят проверенные версии прошивок и некоторые утилиты для выполнения таких работ.

Что нужно для того, чтобы техническая поддержка смогла помочь

Для того, чтобы техническая поддержка смогла помочь быстро и качественно, потребуется следующее:

  • Укажите серийный номер сервера и описание проблемы, а так же крайне желательно сразу предоставлять аппаратные логи.
  • Нам могут понадобиться логи операционной системы, как правило, это messages и mcelog для *nix и vmkernel.log для ESXi
  • У вас должно быть установлено ПО управления серверами, как минимум – BSM HW CLI (Command Line Interface) и сотрудник, имеющий логин и пароль к BMC сервера.
  • В некоторых случаях потребуется физический доступ к серверу для сотрудника заказчика.
  • При замене компонентов силами компании Атос потребуется физический доступ к оборудованию. Если такое предусмотрено уровнем поддержки, то и вне рабочих часов (24/7).
  • Обеспечение физического доступа (пропуска, сопровождение в ЦОДе) к обслуживаемому оборудованию для специалистов Atos – ответственность заказчика. Обращение ставится «на паузу» на время организации доступа.
  • В случае ожидания специалистов Атос или партнеров доступа к оборудованию по вине заказчика, Атос может выставить Заказчику счет на оплату рабочего времени специалистов.

Что нужно знать при настройке и использовании оборудования производства Atos

  • Необходимо строго следовать документации и Release Notes к TS. В документации есть наборы инструкций по настройке и эксплуатации оборудования, в Release Notes есть рекомендации по настройке оборудования и ОС, а также списки исправлений, версии интегрированных драйверов в ОС ESXi, замеченных недостатков и т.д.,например, в Release Notes к TS 21.05 серверов серии BullSequana S приведены настройки ОС семейства *nix, которые необходимы, чтобы аппаратные логи отражали ошибки памяти
  • Изменять настройки BIOS без прямого указания специалистов Atos не допускается
  • Перед тем, как обновлять прошивки, перемещать оборудование, разбирать сервер, требуется уведомить техподдержку Atos и совместно проработать корректность плана проведения работ
  • Компания Атос не несет ответственности за любые неисправности, вызванные некорректными действиями Заказчика, нарушением процедур обслуживания, физические повреждения, нарушения условий эксплуатации. Данные случаи не покрываются сервисными контрактами, устранение последствий происходит на возмездной основе

Инструкции по снятию аппаратных логов

Для серверов серии Bullion S

  • For windows please perform the following actions for log collection
    • use PC with installed BSM HW CLI
    • run cmd as admnin
    • cd C:\Program Files (x86)\BULL\BSM HW NG CLI\engine\bin\
    • C:\Program Files (x86)\BULL\BSM HW NG CLI\engine\bin\bash.exe —login
    • bsmsnapshot.sh -m lanplus -H xxx.xxx.xxx.xxx -u super -p pass (If you use -d (destination) option on MS Windows systems then use it like in example below)
      EXP:
      ./bsmsnapshot.sh -m lanplus -H 192.168.0.10 -u super -p pass -d ‘/cygdrive/c/logfolder/’
      Where ‘/cygdrive/c/’ it’s ‘C:\’ on MS Windows and ‘logfolder’ it’s folder in root of “C” drive -> ‘C:\logfolder\’
      !!! IF your password contain special symbols like #, $, & and so on you should conclude it into single quotes (EXP: ‘Pa$$word’ ))
    • the result files will be placed in C:\Program Files (x86)\BULL\BSM HW NG CLI\engine\var with name part_date_time.tar.gz
  • For linux or mgmt. virtual appliance
    • Please use the manual “86A143FL11 bullion S Remote Hardware Management CLI Reference Guide” for full information about installation and usage of BSM HW CLI

 

Для серверов серии BullSequana S

  • Login to SHC (Server Hardware Console)
  • From the Maintenance tab, click Maintenance Operations > Log Collect to open the Log Collect page.
  • Click Get Logs to collect the logs.
  • Click OK in the message web page.
  • Download the log files.
  • The log files are downloaded into a single tar file collectlogs_servername_date_time.tar.gz
  • Полученный архив зашифруйте, пожалуйста, и пришлите вместе с паролем ответным письмом.

Рекомендации по использованию BSM HW CLI

  • Это ПО рекомендуется иметь на рабочей станции сотрудника, который работает с оборудованием.
  • Для работы этого ПО необходим доступ к интерфейсу управления сервером (BMC)
  • Данное ПО входит в комплект и автоматичеки устанавливается как часть ПО iCare и BPM, но также есть отдельные дистрибутивы для *nix и Windows.
  • Рекомендуется обновлять это ПО на регулярной основе, минимально до версии, соответствующей TS на управляемых серверах.

Рекомендации по настройке ПО мониторинга (iCare)

  • Данное ПО предназначено для мониторинга состояния и управления серверами производства Atos, обновления прошивок серверов серии BullSequana S.
  • Каждый сервер подключается и работает только с одной установкой iCare
  • Рекомендуется регулярное обновление этого ПО, минимально до версии, соответствующей TS на управляемых серверах.
  • Рекомендуется настройка Autocalls и heartbeat-сообщений
  • Рекомендуется настройка кастомизированных фильтров Autocalls (см. iCare Release Note в дистрибутиве ПО, см. iCare Console Reference Guide в комплекте документации)

Рекомендуемые регламентные работы

Регламентные работы предназначены как для обеспечения работы самого оборудования, так и для проверки бизнес-процессов, связанных с обслуживанием и ремонтом серверов Атос. Работы выполняются сотрудниками Заказчика по соответствующим инструкциям и рекомендациям производителя.

Рекомендуемые регламентные работы

Регламентные работы предназначены как для обеспечения работы самого оборудования, так и для проверки бизнес-процессов, связанных с обслуживанием и ремонтом серверов Атос. Работы выполняются сотрудниками Заказчика по соответствующим инструкциям и рекомендациям производителя.

Проверка технического окружения

Данная группа проверок направлена на технические элементы серверного окружения и служит для подтверждения работоспособности основных инструментов управления/мониторинга серверами.

Утилита мониторинга iCare

  • Проверка версии iCare
    Документ: «iCare Console Reference Guide», раздел «1.3. Displaying Software Version Information»
    Действие: проверка версии iCare.
    Результат: установлено ПО iCare версии, соотвествующей TS или выше.
  • Контроль соединения iCare с управляющими модулями серверов.
    Документ: «iCare Console Reference Guide», раздел «2.7.2. Setting up Manual Resource Connection Tests»
    Действие: Проверка соединения iCare с оборудованием, как описано в документации.
    Результат: iCare соединяется с управляющими модулями серверов.
  • Проверка настроек сообщений мониторинга
    Документ: «iCare Console Reference Guide», раздел «5.2. Configuring Autocalls»
    Действие: Проверка разделов iCare: Target Email Addresses, Global Autocall Policies, Specific Autocall Policies.
    Результат: Сообщения мониторинга настроены корректно.
  • Проверка получения автоколлов
    Документ: «iCare Console Reference Guide».
    Действие: Проверить последнее тестовое письмо-heartbeat (если настроено)
    Результат: Последнее тестовое письмо пришло не более настроенного периода тестового автоколла назад.


Утилиты командной строки BSM HW CLI

  • Проверка установки и работоспособности
    Документ: «Remote Hardware Management CLI Reference Guide»
    Действие: Выполнение команды bsmsnapshot или любой другой для получения информации.
    Результат: Команда выполнена, результат соответствует описанию в документе.

Проверка организационного окружения

Данная группа работ предназначена для поддержки сотрудников Заказчика, работающими с аппаратным обеспечением серверов Атос, предоставление инструкций и т.д.

  • Проверка контактов технической поддержки
    Документ: текущая инструкция, оповещения об изменении контактов технической поддержки, если есть.
    Действие: Воспользоваться любым контактом технической поддержки.
    Результат: Получен ответ (телефон/почта)/Создана заявка и получена обратная связь (тикет-тул)
  • Проверка BSM HW CLI
    Документ: «Remote Hardware Management CLI Reference Guide»
    Действие: Ознакомиться с документом, выполнить любую команду на чтение параметров.
    Результат: Знание инструмента BSM HW CLI
  • Проверка SHC
    Документ: «SHC Reference Guide»
    Действие: подключиться к управляющему веб-интерфесу сервера, проверить показания сенсоров/логи, проверить серийные номера и т.д.
    Результат: Знание инструмента SHC

Проверка оборудования на ошибки

  • Выполняется сотрудниками техподдержки производителя путем анализа логов и других источников информации, полученных от Заказчика.
  • Исходные данные: Набор логов оборудования bsmsnapshot (для Bullion S) или архив аппаратных логов (BullSequana S), дополнительные данные, необходимые для поиска ошибок, если нужны.
  • Предоставляется заключение о работоспособности или согласовываются работы по устранению ошибок.

Проверка оборудования на версии прошивок

  • Выполняется сотрудниками техподдержки производителя путем анализа логов и других источников информации, полученных от Заказчика.
  • Исходные данные: Identity Card (см. «bullion S SHC Reference Guide», раздел «5.1.2. Getting FRU Information»), набор логов оборудования bsmsnapshot (для Bullion S) или архив аппаратных логов (BullSequana S), дополнительные данные, если нужны.
  • Предоставляется заключение о необходимости или отсутствии необходимости обновления прошивок.