Базовый SNMP тест оценки 'здоровья' серверов Linux/UNIX

реклама
Базовый SNMP тест оценки 'здоровья' серверов
Linux/UNIX
Тест используется для оценки производительности серверов с UNIX-подобными
системами, включая GNU, Linux, Minix, OpenSolaris, Plan 9, BSD, FreeBSD, NetBSD,
OpenBSD, AIX, HP-UX, IRIX, Mac OS X, LynxOS, QNX, SCO OpenServer, Solaris, Tru64
UNIX, UnixWare, Xenix и VxWorks. Тест основан на использовании данных,
предоставляемых демоном SNMPD, входящего в состав пакета net-snmp UNIX-подобных
операционных систем. Пороговые значения основаны на рекомендациях U.C. Davis, ECE
Dept. Tom.
Измеряемые характеристики и пороговые значения (по группам)
Availability (%). Тестовое приложение периодически обращается к серверу по SNMP и
«забирает» статистическую информацию, т.е. выполняет транзакцию получения
статистической информации. Транзакция может закончиться успешно или с ошибкой. За
каждый период усреднения данных вычисляется процентное отношение числа успешных
транзакций получения статистической информации к общему числу выполненных
транзакций.
Использование памяти
Total Swap Size (kB). Виртуальная память системы это сумма оперативной памяти
(RAM) и зарезервированного дискового пространства (Swap). Swap используется
системой как временное хранилище страниц памяти при нехватке свободной
оперативной памяти. Типично размер Swap выбирается равным удвоенному
размеру физической памяти, но это не является жестким ограничением. Для
архитектуры x86 размер Swap области ограничен 2 ГБ. Некоторые ОС используют
методику динамического расширения размера Swap области при ее нехватке.
Негативным фактором размещения страниц памяти в области Swap является
дополнительное время, затрачиваемое на выделение, запись и считывание
страниц из памяти на диск и обратно, что сказывается на производительности
работы системы и приложений.
Available Swap Space (kB). Размер свободной Swap области. Если в области
Swap осталось мало свободного места, то операционной системе может не
хватить виртуальной памяти для запуска новой задачи или выделения новых
ресурсов виртуальной памяти. Если при этом максимальный размер Swap не
установлен, то операционная система будет динамически его расширять. В эти
моменты времени производительность сервера снижается. Если же максимальный
размер Swap области установлен и этого размера не хватает, то задача не будет
запущена из-за нехватки памяти.
Total Real/Physical Memory Size (kB). Объем оперативной памяти на сервере.
Available Real/Physical Memory Space (kB). Размер свободной (не
распределенной системой) оперативной памяти, которая доступна операционной
системе в момент измерения.
Total Available Memory (kB). Сумма свободной памяти в области Swap и
свободной оперативной памяти.
Minimum Amount of Free Swap (kB). Минимальный размер свободного
пространства в области Swap. Если размер свободного места в Swap становится
меньше этого значения, то в тесте устанавливается флаг very little swap space
(С) ПРОЛАН 2005-2010
left (серьезная нехватка свободного места в Swap). Порог значения данной
характеристики автоматически устанавливается самой операционной системой
сервера.
Total Shared Memory (kB). Суммарный размер разделяемой памяти, совместно
использующейся процессами для сохранения и получения данных и обеспечения
коммуникации между процессами. Существуют также проблемы использования
разделяемой памяти. Когда множество программ нуждаются в быстром доступе к
памяти, то возрастает вероятность кэширования памяти, приводящего к двум
осложнениям:
- Связь процессор-память становится узким местом. Разделяемая процессорами
память плохо масштабируется.
- Последовательность кэширования: Всякий раз, когда информация в кэш
обновлена одним процессором, изменение должно быть отражено на другие
процессоры, иначе различные процессоры будут работать с несвязными данными.
С одной стороны такой протокол обеспечивает чрезвычайно быстродействующий
доступ к разделенной информации между процессорами. С другой стороны это
приводит к перезагрузкам и снижает производительность системы.
Total Buffered Memory (kB). Суммарный размер буферизированной памяти
(находящейся в буферах между модулями памяти и системным контроллером
памяти).
Total Cached Memory (kB). Суммарный размер кэшированной системой памяти.
Very little swap space left flag. Значение характеристики автоматически
устанавливается системой сервера в единицу при нехватке свободного места в
Swap области памяти. В противном случае, значение содержит ноль.
Процессоры
Percentages of user CPU time. Процент использования процессоров в режиме
пользователя.
Percentages of system CPU time. Процент использования процессоров в режиме
системы.
Percentages of CPU Utilization. Сумма процентов использования процессоров в
режиме пользователя и режиме системы.
Percentages of idle CPU time. Процент простоя процессоров. Как правило, при
небольшой загрузке, эта величина равна 100% - Percentages of CPU Utilization. Но
при значительной загрузке, процент простоя может иметь значение 0, но при этом
утилизация процессоров не достигает 100%.
Прочая статистика работы системы
Amount of memory swapped in from disk (kB/s). Количество памяти, записанное в
Swap область за секунду. Величина характеризует скорость, с которой система
сохраняет страницы оперативной памяти на диск при ее нехватке. Большое
текущее значение этой характеристики свидетельствует о снижении
производительности системы.
Amount of memory swapped to disk (kB/s). Количество памяти, считанное
системой из Swap области за секунду. Величина характеризует скорость, с которой
система загружает страницы памяти с диска. Операционная система вынуждена
(С) ПРОЛАН 2005-2010
загружать данные с диска, если запрашиваемые данные отсутствуют в кэш-памяти
сервера. Большое текущее значение этой характеристики свидетельствует о
снижении производительности системы.
Blocks sent to a block device (blocks/s). Количество блоков информации (размер
блока можно принять равным 4kB), записанных на блочные устройства (дисковые
устройства системы), включая жесткие диски, сменные носители, DVD приводы и
т.п. Большое значение характеристики свидетельствует о значительной загрузке
дисковой подсистемы сервера и, косвенным образом, о снижении
производительности системы в целом.
Blocks received from a block device (blocks/s). Количество блоков информации
считанных с блочных устройств. Большое значение характеристики
свидетельствует о значительной загрузке дисковой подсистемы сервера и,
косвенным образом, о снижении производительности системы в целом.
Number of interrupts per second. Количество прерываний процессора, включая
прерывания таймера, в секунду. Если число прерываний превышает 10 000 в
секунду, то это свидетельствует либо о проблемах с устройствами (аппаратные
прерывания), либо о наличии ошибок в программном обеспечении (в случае
программных прерываний). Используйте команду procinfo для выявления
проблемного номера прерывания и связанного с ним процесса.
Number of context switches per second. Число переключений контекста в секунду.
Характеризует частоту переключений процессора на обслуживание работы
потоков процессов в системе. Величина данной характеристики самостоятельного
значения не имеет, и может рассматриваться только в контексте совместного
анализа нескольких величин (например, высокая утилизация процессора, большое
число прерываний …).
Load Averages\Load-<n minutes> (Средняя загрузка системы за 1, 5 и 15 минут).
Операционная система сервера самостоятельно рассчитывает величину загрузки
системы, в соответствии с рекомендациями U.C. Davis, ECE Dept. Tom. Загрузка
усредняется за интервалы времени 1, 5 и 15 последних минут. Пороговые значения
задаются на сервере, в файле конфигурации snmpd.conf.
Свободное место на дисках.
Available space on the disk ‘<volume name>’ (kB). В файле конфигурации
snmpd.conf на сервере задается список томов, свободное место на которых
необходимо контролировать. Там же задается и пороговое значение, в килобайтах.
Available space on the disk ‘<volume name>’ (%). Эта характеристика
присутствует, если в качестве порогового значения указано не абсолютное
значение в kB, а процент свободного места на диске.
Число процессов. В файле конфигурации snmpd.conf на сервере задается список имен
процессов, количество выполняющихся экземпляров которых необходимо
контролировать. Для каждого процесса может быть задан порог максимального числа
процессов, минимального числа процессов, или оба значения.
Number of processes <process name>. Показывает текущее число процессов с
заданным именем, для сравнения с пороговыми значениями максимума и
минимума числа процессов.
(С) ПРОЛАН 2005-2010
Size of file ‘<file path>’ (kB). В файле конфигурации snmpd.conf на сервере задается
список файлов, размеры которых необходимо контролировать. Опционально, может быть
задано пороговое значение размера, в kB.
(С) ПРОЛАН 2005-2010
>
/
<
Пороговое
значение
Availability (%)
<
90
Very little swap space left
>
0
Percentages of CPU Utilization
>
90
Amount of memory swapped in from disk (kB/s)
>
5000
Amount of memory swapped to disk (kB/s)
>
5000
Blocks sent to a block device (blocks/s)
>
40000
Blocks received from a block device (blocks/s)
>
40000
Load Averages\Load-1
>
10 (default)
Load Averages\Load-5
>
10 (default)
Load Averages\Load-15
>
10 (default)
Availability (%)
<
94
Very little swap space left
>
0
Percentages of CPU Utilization
>
70
Amount of memory swapped in from disk (kB/s)
>
4000
Amount of memory swapped to disk (kB/s)
>
4000
Blocks sent to a block device (blocks/s)
>
30000
Blocks received from a block device (blocks/s)
>
30000
Load Averages\Load-1
>
10 (default)
Load Averages\Load-5
>
10 (default)
Load Averages\Load-15
>
10 (default)
Availability (%)
<
96
Very little swap space left
>
0
Percentages of CPU Utilization
>
50
Amount of memory swapped in from disk (kB/s)
>
3000
Amount of memory swapped to disk (kB/s)
>
3000
Blocks sent to a block device (blocks/s)
>
20000
Blocks received from a block device (blocks/s)
>
20000
Load Averages\Load-1
>
10 (default)
Load Averages\Load-5
>
10 (default)
Load Averages\Load-15
>
10 (default)
Availability (%)
<
99
Very little swap space left
>
0
Percentages of CPU Utilization
>
30
Amount of memory swapped in from disk (kB/s)
>
2000
Amount of memory swapped to disk (kB/s)
>
2000
Blocks sent to a block device (blocks/s)
>
10000
Blocks received from a block device (blocks/s)
>
10000
Load Averages\Load-1
>
10 (default)
Load Averages\Load-5
>
10 (default)
Оценка Качества
Измеряемая характеристика
(цвет «светофора»)
Плохо
(красный)
На грани
(мигающий красный)
Требует внимания
(желтый)
Допустимо
(мигающий желтый)
(С) ПРОЛАН 2005-2010
Хорошо
(зеленый)
Load Averages\Load-15
>
10 (default)
Availability (%)
>
99
Very little swap space left
<
1
Percentages of CPU Utilization
<
30
Amount of memory swapped in from disk (kB/s)
<
2000
Amount of memory swapped to disk (kB/s)
<
2000
Blocks sent to a block device (blocks/s)
<
10000
Blocks received from a block device (blocks/s)
<
10000
Load Averages\Load-1
<
10 (default)
Load Averages\Load-5
<
10 (default)
Load Averages\Load-15
<
10 (default)
Установка и конфигурация демона SNMPD на сервере
На сервере с UNIX-подобной системой должен быть установлен и настроен демон
SNMPD. Демон обеспечивает хранение данных в MIB-базе сервера и предоставляет
доступ к данным по протоколу SNMP.
ШАГ 1. Установка SNMPD. Последовательность установки зависит от версии
операционной системы. Как правило, необходимые компоненты входят в состав mibsnmp. Подробные инструкции вы можете найти в руководствах администратора системы
или в интернет.
ШАГ 2. Настройка SNMPD. Демон SNMPD представляет собой службу, которая при
запуске читает файл конфигурации /etc/snmp/snpmp.conf и использует заданные в нем
настройки. Создайте резервную копию файла. Затем файл может быть отредактирован в
любом текстовом редакторе.
Настройка community name. Для доступа к данным MIB-базы, зонд использует
запросы по протоколу SNMP с именем сообщества на чтение (RO). Задайте в
файле snpmp.conf строку вида:
rocommunity communityname [default|hostname|network/bits] [oid]
Например:
rocommunity public
Настройка системной информации. Для представления информации о системе
сервера задайте описание размещения сервера и контактное лицо.
Например:
syslocation ProLAN office
syscontact SUPPORT <support@prolan.ru>
Настройка вида представления в MIB. Для отображения всей имеющейся
информации в MIB-базе задайте строку
view all included .1
Настройка порогов для средней загрузки системы. Для оценки значений
характеристик Load Averages\Load-1, Load Averages\Load-2, Load Averages\Load-15
(С) ПРОЛАН 2005-2010
задайте строку с порогами загрузки системы за 1, 5 и 15 минут, например:
load 20 15 10
Если строка будет отсутствовать в файле, то будут приняты пороги в 10%.
Настройка списка и порогов для контроля свободного места на дисках.
Задайте необходимое количество строк вида:
disk <volume name> <free space[%]>
Где volume name – имя смонтированного тома системы, free space – порог размера
свободного места в kB. Если после значения порога используется символ %, то
контролируется не абсолютное значение свободного места, а процент свободного
места на диске. Например:
disk / 100000
disk /media/disk 10%
Если имя тома содержит пробелы, то экранируйте их символами \. Например для
имени ‘sr0 12 i386 DVD’ строка будет выглядеть так:
disk sr0 12\ i386\ DVD 20%
Настройка списка и порогов для контроля числа выполняющихся процессов.
Задайте необходимое количество строк вида:
proc <NAME> [MAX=0] [MIN=0]>
Где NAME – имя процесса, MAX и MIN – максимальное и минимальное число
экземпляров процесса, по умолчанию 0. Если значения и MAX и MIN отсутствуют,
то максимальное число не ограничивается а минимальное принимается равным 1.
Например:
proc pdflush 2
proc bash -1 5
Настройка списка и порогов для контроля длин файлов. Задайте необходимое
количество строк вида:
file <file path> [max size]
Где file path – путь к файлу, max size – максимальный размер файла в kB. Если
значение максимального размера отсутствует, то контролируется только его
абсолютная длина.
(С) ПРОЛАН 2005-2010
Скачать