六、配置Nagios
創(chuàng)新互聯(lián)公司為客戶提供專業(yè)的網(wǎng)站建設(shè)、成都做網(wǎng)站、程序、域名、空間一條龍服務(wù),提供基于WEB的系統(tǒng)開(kāi)發(fā). 服務(wù)項(xiàng)目涵蓋了網(wǎng)頁(yè)設(shè)計(jì)、網(wǎng)站程序開(kāi)發(fā)、WEB系統(tǒng)開(kāi)發(fā)、微信二次開(kāi)發(fā)、成都做手機(jī)網(wǎng)站等網(wǎng)站方面業(yè)務(wù)。
Nagios 主要用于監(jiān)控一臺(tái)或者多臺(tái)本地主機(jī)及遠(yuǎn)程的各種信息,包括本機(jī)資源及對(duì)外的服務(wù)等。默認(rèn)的Nagios 配置沒(méi)有任何監(jiān)控內(nèi)容,僅是一些模板文件。若要讓Nagios 提供服務(wù),就必須修改配置文件,增加要監(jiān)控的主機(jī)和服務(wù),下面將詳細(xì)介紹。
6.1 默認(rèn)配置文件介紹
Nagios 安裝完畢后,默認(rèn)的配置文件在/usr/local/nagios/etc目錄下。
每個(gè)文件或目錄含義如下表所示:
文件名或目錄名 | 用途 |
cgi.cfg | 控制CGI訪問(wèn)的配置文件 |
nagios.cfg | Nagios 主配置文件 |
resource.cfg | 變量定義文件,又稱為資源文件,在些文件中定義變量,以便由其他配置文件引用,如$USER1$ |
objects | objects 是一個(gè)目錄,在此目錄下有很多配置文件模板,用于定義Nagios 對(duì)象 |
objects/commands.cfg | 命令定義配置文件,其中定義的命令可以被其他配置文件引用 |
objects/contacts.cfg | 定義聯(lián)系人和聯(lián)系人組的配置文件 |
objects/localhost.cfg | 定義監(jiān)控本地主機(jī)的配置文件 |
objects/printer.cfg | 定義監(jiān)控打印機(jī)的一個(gè)配置文件模板,默認(rèn)沒(méi)有啟用此文件 |
objects/switch.cfg | 定義監(jiān)控路由器的一個(gè)配置文件模板,默認(rèn)沒(méi)有啟用此文件 |
objects/templates.cfg | 定義主機(jī)和服務(wù)的一個(gè)模板配置文件,可以在其他配置文件中引用 |
objects/timeperiods.cfg | 定義Nagios 監(jiān)控時(shí)間段的配置文件 |
objects/windows.cfg | 監(jiān)控Windows 主機(jī)的一個(gè)配置文件模板,默認(rèn)沒(méi)有啟用此文件 |
6.2 配置文件之間的關(guān)系
在nagios的配置過(guò)程中涉及到的幾個(gè)定義有:主機(jī)、主機(jī)組,服務(wù)、服務(wù)組,聯(lián)系人、聯(lián)系人組,監(jiān)控時(shí)間,監(jiān)控命令等,從這些定義可以看出,nagios各個(gè)配置文件之間是互為關(guān)聯(lián),彼此引用的。
成功配置出一臺(tái)nagios監(jiān)控系統(tǒng),必須要弄清楚每個(gè)配置文件之間依賴與被依賴的關(guān)系,最重要的有四點(diǎn):
第一:定義監(jiān)控哪些主機(jī)、主機(jī)組、服務(wù)和服務(wù)組;
第二:定義這個(gè)監(jiān)控要用什么命令實(shí)現(xiàn);
第三:定義監(jiān)控的時(shí)間段;
第四:定義主機(jī)或服務(wù)出現(xiàn)問(wèn)題時(shí)要通知的聯(lián)系人和聯(lián)系人組。
6.3 配置Nagios
為了能更清楚的說(shuō)明問(wèn)題,同時(shí)也為了維護(hù)方便,建議將nagios各個(gè)定義對(duì)象創(chuàng)建獨(dú)立的配置文件:
創(chuàng)建hosts.cfg文件來(lái)定義主機(jī)和主機(jī)組
創(chuàng)建services.cfg文件來(lái)定義服務(wù)
用默認(rèn)的contacts.cfg文件來(lái)定義聯(lián)系人和聯(lián)系人組
用默認(rèn)的commands.cfg文件來(lái)定義命令
用默認(rèn)的timeperiods.cfg來(lái)定義監(jiān)控時(shí)間段
用默認(rèn)的templates.cfg文件作為資源引用文件
a. templates.cfg文件
nagios主要用于監(jiān)控主機(jī)資源以及服務(wù),在nagios配置中稱為對(duì)象,為了不必重復(fù)定義一些監(jiān)控對(duì)象,Nagios引入了一個(gè)模板配置文件,將一些共性的屬性定義成模板,以便于多次引用。這就是templates.cfg的作用。
下面詳細(xì)介紹下templates.cfg文件中每個(gè)參數(shù)的含義:
define contact{ name generic-contact ; 聯(lián)系人名稱 service_notification_period 24x7 ; 當(dāng)服務(wù)出現(xiàn)異常時(shí),發(fā)送通知的時(shí)間段,這個(gè)時(shí)間段"24x7"在timeperiods.cfg文件中定義 host_notification_period 24x7 ; 當(dāng)主機(jī)出現(xiàn)異常時(shí),發(fā)送通知的時(shí)間段,這個(gè)時(shí)間段"24x7"在timeperiods.cfg文件中定義 service_notification_options w,u,c,r ; 這個(gè)定義的是“通知可以被發(fā)出的情況”。w即warn,表示警告狀態(tài),u即unknown,表示不明狀態(tài);
; c即criticle,表示緊急狀態(tài),r即recover,表示恢復(fù)狀態(tài);
; 也就是在服務(wù)出現(xiàn)警告狀態(tài)、未知狀態(tài)、緊急狀態(tài)和重新恢復(fù)狀態(tài)時(shí)都發(fā)送通知給使用者。 host_notification_options d,u,r ; 定義主機(jī)在什么狀態(tài)下需要發(fā)送通知給使用者,d即down,表示宕機(jī)狀態(tài);
; u即unreachable,表示不可到達(dá)狀態(tài),r即recovery,表示重新恢復(fù)狀態(tài)。 service_notification_commands notify-service-by-email ; 服務(wù)故障時(shí),發(fā)送通知的方式,可以是郵件和短信,這里發(fā)送的方式是郵件;
; 其中“notify-service-by-email”在commands.cfg文件中定義。 host_notification_commands notify-host-by-email ; 主機(jī)故障時(shí),發(fā)送通知的方式,可以是郵件和短信,這里發(fā)送的方式是郵件;
; 其中“notify-host-by-email”在commands.cfg文件中定義。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL CONTACT, JUST A TEMPLATE! }define host{ name generic-host ; 主機(jī)名稱,這里的主機(jī)名,并不是直接對(duì)應(yīng)到真正機(jī)器的主機(jī)名;
; 乃是對(duì)應(yīng)到在主機(jī)配置文件里所設(shè)定的主機(jī)名。 notifications_enabled 1 ; Host notifications are enabled event_handler_enabled 1 ; Host event handler is enabled flap_detection_enabled 1 ; Flap detection is enabled failure_prediction_enabled 1 ; Failure prediction is enabled process_perf_data 1 ; 其值可以為0或1,其作用為是否啟用Nagios的數(shù)據(jù)輸出功能;
; 如果將此項(xiàng)賦值為1,那么Nagios就會(huì)將收集的數(shù)據(jù)寫(xiě)入某個(gè)文件中,以備提取。 retain_status_information 1 ; Retain status information across program restarts retain_nonstatus_information 1 ; Retain non-status information across program restarts notification_period 24x7 ; 指定“發(fā)送通知”的時(shí)間段,也就是可以在什么時(shí)候發(fā)送通知給使用者。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL HOST, JUST A TEMPLATE! }define host{ name linux-server ; 主機(jī)名稱 use generic-host ; use表示引用,也就是將主機(jī)generic-host的所有屬性引用到linux-server中來(lái);
; 在nagios配置中,很多情況下會(huì)用到引用。 check_period 24x7 ; 這里的check_period告訴nagios檢查主機(jī)的時(shí)間段 check_interval 5 ; nagios對(duì)主機(jī)的檢查時(shí)間間隔,這里是5分鐘。 retry_interval 1 ; 重試檢查時(shí)間間隔,單位是分鐘。 max_check_attempts 10 ; nagios對(duì)主機(jī)的最大檢查次數(shù),也就是nagios在檢查發(fā)現(xiàn)某主機(jī)異常時(shí),并不馬上判斷為異常狀況;
; 而是多試幾次,因?yàn)橛锌赡苤皇且粫r(shí)網(wǎng)絡(luò)太擁擠,或是一些其他原因,讓主機(jī)受到了一點(diǎn)影響;
; 這里的10就是最多試10次的意思。 check_command check-host-alive ; 指定檢查主機(jī)狀態(tài)的命令,其中“check-host-alive”在commands.cfg文件中定義。 notification_period 24x7 ; 主機(jī)故障時(shí),發(fā)送通知的時(shí)間范圍,其中“workhours”在timeperiods.cfg中進(jìn)行了定義;
; 下面會(huì)陸續(xù)講到。 notification_interval 10 ; 在主機(jī)出現(xiàn)異常后,故障一直沒(méi)有解決,nagios再次對(duì)使用者發(fā)出通知的時(shí)間。單位是分鐘;
; 如果你覺(jué)得,所有的事件只需要一次通知就夠了,可以把這里的選項(xiàng)設(shè)為0 notification_options d,u,r ; 定義主機(jī)在什么狀態(tài)下可以發(fā)送通知給使用者,d即down,表示宕機(jī)狀態(tài);
; u即unreachable,表示不可到達(dá)狀態(tài);
; r即recovery,表示重新恢復(fù)狀態(tài)。 contact_groups ts ; 指定聯(lián)系人組,這個(gè)“admins”在contacts.cfg文件中定義。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL HOST, JUST A TEMPLATE! }define host{ name windows-server ; The name of this host template use generic-host ; Inherit default values from the generic-host template check_period 24x7 ; By default, Windows servers are monitored round the clock check_interval 5 ; Actively check the server every 5 minutes retry_interval 1 ; Schedule host check retries at 1 minute intervals max_check_attempts 10 ; Check each server 10 times (max) check_command check-host-alive ; Default command to check if servers are "alive" notification_period 24x7 ; Send notification out at any time - day or night notification_interval 10 ; Resend notifications every 30 minutes notification_options d,r ; Only send notifications for specific host states contact_groups ts ; Notifications get sent to the admins by default hostgroups windows-servers ; Host groups that Windows servers should be a member of register 0 ; DONT REGISTER THIS - ITS JUST A TEMPLATE }define service{ name generic-service ; 定義一個(gè)服務(wù)名稱 active_checks_enabled 1 ; Active service checks are enabled passive_checks_enabled 1 ; Passive service checks are enabled/accepted parallelize_check 1 ; Active service checks should be parallelized;
; (disabling this can lead to major performance problems) obsess_over_service 1 ; We should obsess over this service (if necessary) check_freshness 0 ; Default is to NOT check service 'freshness' notifications_enabled 1 ; Service notifications are enabled event_handler_enabled 1 ; Service event handler is enabled flap_detection_enabled 1 ; Flap detection is enabled failure_prediction_enabled 1 ; Failure prediction is enabled process_perf_data 1 ; Process performance data retain_status_information 1 ; Retain status information across program restarts retain_nonstatus_information 1 ; Retain non-status information across program restarts is_volatile 0 ; The service is not volatile check_period 24x7 ; 這里的check_period告訴nagios檢查服務(wù)的時(shí)間段。 max_check_attempts 3 ; nagios對(duì)服務(wù)的最大檢查次數(shù)。 normal_check_interval 5 ; 此選項(xiàng)是用來(lái)設(shè)置服務(wù)檢查時(shí)間間隔,也就是說(shuō),nagios這一次檢查和下一次檢查之間所隔的時(shí)間;
; 這里是5分鐘。 retry_check_interval 2 ; 重試檢查時(shí)間間隔,單位是分鐘。 contact_groups ts ; 指定聯(lián)系人組 notification_options w,u,c,r ; 這個(gè)定義的是“通知可以被發(fā)出的情況”。w即warn,表示警告狀態(tài);
; u即unknown,表示不明狀態(tài);
; c即criticle,表示緊急狀態(tài),r即recover,表示恢復(fù)狀態(tài);
; 也就是在服務(wù)出現(xiàn)警告狀態(tài)、未知狀態(tài)、緊急狀態(tài)和重新恢復(fù)后都發(fā)送通知給使用者。 notification_interval 10 ; Re-notify about service problems every hour notification_period 24x7 ; 指定“發(fā)送通知”的時(shí)間段,也就是可以在什么時(shí)候發(fā)送通知給使用者。 register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL SERVICE, JUST A TEMPLATE! }define service{ name local-service ; The name of this service template use generic-service ; Inherit default values from the generic-service definition max_check_attempts 4 ; Re-check the service up to 4 times in order to determine its final (hard) state normal_check_interval 5 ; Check the service every 5 minutes under normal conditions retry_check_interval 1 ; Re-check the service every minute until a hard state can be determined register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL SERVICE, JUST A TEMPLATE! }
b. resource.cfg文件
resource.cfg是nagios的變量定義文件,文件內(nèi)容只有一行:
$USER1$=/usr/local/nagios/libexec
其中,變量$USER1$指定了安裝nagios插件的路徑,如果把插件安裝在了其它路徑,只需在這里進(jìn)行修改即可。需要注意的是,變量必須先定義,然后才能在其它配置文件中進(jìn)行引用。
c. commands.cfg文件
此文件默認(rèn)是存在的,無(wú)需修改即可使用,當(dāng)然如果有新的命令需要加入時(shí),在此文件進(jìn)行添加即可。
#notify-host-by-email命令的定義
define command{ command_name notify-host-by-email #命令名稱,即定義了一個(gè)主機(jī)異常時(shí)發(fā)送郵件的命令。 command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\nHost: $HOSTNAME$\nState: $HOSTSTATE$\nAddress: $HOSTADDRESS$\nInfo: $HOSTOUTPUT$\n\nDate/Time: $LONGDATETIME$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is $HOSTSTATE$ **" $CONTACTEMAIL$ #命令具體的執(zhí)行方式。 }#notify-service-by-email命令的定義
define command{ command_name notify-service-by-email #命令名稱,即定義了一個(gè)服務(wù)異常時(shí)發(fā)送郵件的命令 command_line /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\n\nService: $SERVICEDESC$\nHost: $HOSTALIAS$\nAddress: $HOSTADDRESS$\nState: $SERVICESTATE$\n\nDate/Time: $LONGDATETIME$\n\nAdditional Info:\n\n$SERVICEOUTPUT$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Service Alert: $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ **" $CONTACTEMAIL$ }
#check-host-alive命令的定義define command{ command_name check-host-alive #命令名稱,用來(lái)檢測(cè)主機(jī)狀態(tài)。 command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 5
# 這里的變量$USER1$在resource.cfg文件中進(jìn)行定義,即$USER1$=/usr/local/nagios/libexec;
# 那么check_ping的完整路徑為/usr/local/nagios/libexec/check_ping;
# “-w 3000.0,80%”中“-w”說(shuō)明后面的一對(duì)值對(duì)應(yīng)的是“WARNING”狀態(tài),“80%”是其臨界值。
# “-c 5000.0,100%”中“-c”說(shuō)明后面的一對(duì)值對(duì)應(yīng)的是“CRITICAL”,“100%”是其臨界值。
# “-p 1”說(shuō)明每次探測(cè)發(fā)送一個(gè)包。
}define command{ command_name check_local_disk command_line $USER1$/check_disk -w $ARG1$ -c $ARG2$ -p $ARG3$ #$ARG1$是指在調(diào)用這個(gè)命令的時(shí)候,命令后面的第一個(gè)參數(shù)。 }define command{ command_name check_local_load command_line $USER1$/check_load -w $ARG1$ -c $ARG2$ }define command{ command_name check_local_procs command_line $USER1$/check_procs -w $ARG1$ -c $ARG2$ -s $ARG3$ }define command{ command_name check_local_users command_line $USER1$/check_users -w $ARG1$ -c $ARG2$ }define command{ command_name check_local_swap command_line $USER1$/check_swap -w $ARG1$ -c $ARG2$ }define command{ command_name check_ftp command_line $USER1$/check_ftp -H $HOSTADDRESS$ $ARG1$ }define command{ command_name check_http command_line $USER1$/check_http -I $HOSTADDRESS$ $ARG1$ }define command{ command_name check_ssh command_line $USER1$/check_ssh $ARG1$ $HOSTADDRESS$ }define command{ command_name check_ping command_line $USER1$/check_ping -H $HOSTADDRESS$ -w $ARG1$ -c $ARG2$ -p 5 }define command{ command_name check_nt command_line $USER1$/check_nt -H $HOSTADDRESS$ -p 12489 -v $ARG1$ $ARG2$ }
d. hosts.cfg文件
此文件默認(rèn)不存在,需要手動(dòng)創(chuàng)建,hosts.cfg主要用來(lái)指定被監(jiān)控的主機(jī)地址以及相關(guān)屬性信息,根據(jù)實(shí)驗(yàn)?zāi)繕?biāo)配置如下:
define host{ use linux-server #引用主機(jī)linux-server的屬性信息,linux-server主機(jī)在templates.cfg文件中進(jìn)行了定義。 host_name Nagios-Linux #主機(jī)名 alias Nagios-Linux #主機(jī)別名 address 192.168.1.111 #被監(jiān)控的主機(jī)地址,這個(gè)地址可以是ip,也可以是域名。 }
#定義一個(gè)主機(jī)組 define hostgroup{ hostgroup_name bsmart-servers #主機(jī)組名稱,可以隨意指定。 alias bsmart servers #主機(jī)組別名 members Nagios-Linux #主機(jī)組成員,其中“Nagios-Linux”就是上面定義的主機(jī)。
}
注意:在/usr/local/nagios/etc/objects 下默認(rèn)有l(wèi)ocalhost.cfg 和windows.cfg 這兩個(gè)配置文件,localhost.cfg 文件是定義監(jiān)控主機(jī)本身的,windows.cfg 文件是定義windows 主機(jī)的,其中包括了對(duì)host 和相關(guān)services 的定義。所以在本次實(shí)驗(yàn)中,將直接在localhost.cfg 中定義監(jiān)控主機(jī)(Nagios-Server),在windows.cfg中定義windows 主機(jī)(Nagios-Windows)。根據(jù)自己的需要修改其中的相關(guān)配置,詳細(xì)如下:
localhost.cfg
define host{ use linux-server ; Name of host template to use ; This host definition will inherit all variables that are defined ; in (or inherited by) the linux-server host template definition. host_name Nagios-Server alias Nagios-Server address 127.0.0.1 }define hostgroup{ hostgroup_name linux-servers ; The name of the hostgroup alias Linux Servers ; Long name of the group members Nagios-Server ; Comma separated list of hosts that belong to this group }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description PING check_command check_ping!100.0,20%!500.0,60% }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Root Partition check_command check_local_disk!20%!10%!/ }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Current Users check_command check_local_users!20!50 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Total Processes check_command check_local_procs!250!400!RSZDT }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Current Load check_command check_local_load!5.0,4.0,3.0!10.0,6.0,4.0 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description Swap Usage check_command check_local_swap!20!10 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description SSH check_command check_ssh notifications_enabled 0 }define service{ use local-service ; Name of service template to use host_name Nagios-Server service_description HTTP check_command check_http notifications_enabled 0 }
windows.cfg
define host{ use windows-server ; Inherit default values from a template host_name Nagios-Windows ; The name we're giving to this host alias My Windows Server ; A longer name associated with the host address 192.168.1.113 ; IP address of the host }define hostgroup{ hostgroup_name windows-servers ; The name of the hostgroup alias Windows Servers ; Long name of the group }define service{ use generic-service host_name Nagios-Windows service_description NSClient++ Version check_command check_nt!CLIENTVERSION }define service{ use generic-service host_name Nagios-Windows service_description Uptime check_command check_nt!UPTIME }define service{ use generic-service host_name Nagios-Windows service_description CPU Load check_command check_nt!CPULOAD!-l 5,80,90 }define service{ use generic-service host_name Nagios-Windows service_description Memory Usage check_command check_nt!MEMUSE!-w 80 -c 90 }define service{ use generic-service host_name Nagios-Windows service_description C:\ Drive Space check_command check_nt!USEDDISKSPACE!-l c -w 80 -c 90 }define service{ use generic-service host_name Nagios-Windows service_description W3SVC check_command check_nt!SERVICESTATE!-d SHOWALL -l W3SVC }define service{ use generic-service host_name Nagios-Windows service_description Explorer check_command check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe }
e.services.cfg文件
此文件默認(rèn)也不存在,需要手動(dòng)創(chuàng)建,services.cfg文件主要用于定義監(jiān)控的服務(wù)和主機(jī)資源,例如監(jiān)控http服務(wù)、ftp服務(wù)、主機(jī)磁盤(pán)空間、主機(jī)系統(tǒng)負(fù)載等等。Nagios-Server 和Nagios-Windows 相關(guān)服務(wù)已在相應(yīng)的配置文件中定義,所以這里只需要定義Nagios-Linux 相關(guān)服務(wù)即可,這里只定義一個(gè)檢測(cè)是否存活的服務(wù)來(lái)驗(yàn)證配置文件的正確性,其他服務(wù)的定義將在后面講到。
define service{ use local-service #引用local-service服務(wù)的屬性值,local-service在templates.cfg文件中進(jìn)行了定義。 host_name Nagios-Linux #指定要監(jiān)控哪個(gè)主機(jī)上的服務(wù),“Nagios-Server”在hosts.cfg文件中進(jìn)行了定義。 service_description check-host-alive #對(duì)監(jiān)控服務(wù)內(nèi)容的描述,以供維護(hù)人員參考。 check_command check-host-alive #指定檢查的命令。
}
f. contacts.cfg文件
contacts.cfg是一個(gè)定義聯(lián)系人和聯(lián)系人組的配置文件,當(dāng)監(jiān)控的主機(jī)或者服務(wù)出現(xiàn)故障,nagios會(huì)通過(guò)指定的通知方式(郵件或者短信)將信息發(fā)給這里指定的聯(lián)系人或者使用者。
define contact{ contact_name David #聯(lián)系人的名稱,這個(gè)地方不要有空格 use generic-contact #引用generic-contact的屬性信息,其中“generic-contact”在templates.cfg文件中進(jìn)行定義 alias Nagios Admin email david.tang@bsmart.cn }
define contactgroup{ contactgroup_name ts #聯(lián)系人組的名稱,同樣不能空格 alias Technical Support #聯(lián)系人組描述 members David #聯(lián)系人組成員,其中“david”就是上面定義的聯(lián)系人,如果有多個(gè)聯(lián)系人則以逗號(hào)相隔 }
g. timeperiods.cfg文件
此文件只要用于定義監(jiān)控的時(shí)間段,下面是一個(gè)配置好的實(shí)例:
#下面是定義一個(gè)名為24x7的時(shí)間段,即監(jiān)控所有時(shí)間段 define timeperiod{ timeperiod_name 24x7 #時(shí)間段的名稱,這個(gè)地方不要有空格 alias 24 Hours A Day, 7 Days A Week sunday 00:00-24:00 monday 00:00-24:00 tuesday 00:00-24:00 wednesday 00:00-24:00 thursday 00:00-24:00 friday 00:00-24:00 saturday 00:00-24:00 } #下面是定義一個(gè)名為workhours的時(shí)間段,即工作時(shí)間段。 define timeperiod{ timeperiod_name workhours alias Normal Work Hours monday 09:00-17:00 tuesday 09:00-17:00 wednesday 09:00-17:00 thursday 09:00-17:00 friday 09:00-17:00 }
h. cgi.cfg文件
此文件用來(lái)控制相關(guān)cgi腳本,如果想在nagios的web監(jiān)控界面執(zhí)行cgi腳本,例如重啟nagios進(jìn)程、關(guān)閉nagios通知、停止nagios主機(jī)檢測(cè)等,這時(shí)就需要配置cgi.cfg文件了。
由于nagios的web監(jiān)控界面驗(yàn)證用戶為david,所以只需在cgi.cfg文件中添加此用戶的執(zhí)行權(quán)限就可以了,需要修改的配置信息如下:
default_user_name=davidauthorized_for_system_information=nagiosadmin,david authorized_for_configuration_information=nagiosadmin,david authorized_for_system_commands=davidauthorized_for_all_services=nagiosadmin,david authorized_for_all_hosts=nagiosadmin,davidauthorized_for_all_service_commands=nagiosadmin,david authorized_for_all_host_commands=nagiosadmin,david
i. nagios.cfg文件
nagios.cfg默認(rèn)的路徑為/usr/local/nagios/etc/nagios.cfg,是nagios的核心配置文件,所有的對(duì)象配置文件都必須在這個(gè)文件中進(jìn)行定義才能發(fā)揮其作用,這里只需將對(duì)象配置文件在Nagios.cfg文件中進(jìn)行引用即可。
log_file=/usr/local/nagios/var/nagios.log # 定義nagios日志文件的路徑cfg_file=/usr/local/nagios/etc/objects/commands.cfg # “cfg_file”變量用來(lái)引用對(duì)象配置文件,如果有更多的對(duì)象配置文件,在這里依次添加即可。
cfg_file=/usr/local/nagios/etc/objects/contacts.cfg
cfg_file=/usr/local/nagios/etc/objects/hosts.cfg
cfg_file=/usr/local/nagios/etc/objects/services.cfg
cfg_file=/usr/local/nagios/etc/objects/timeperiods.cfgcfg_file=/usr/local/nagios/etc/objects/templates.cfg
cfg_file=/usr/local/nagios/etc/objects/localhost.cfg # 本機(jī)配置文件
cfg_file=/usr/local/nagios/etc/objects/windows.cfg # windows 主機(jī)配置文件object_cache_file=/usr/local/nagios/var/objects.cache # 該變量用于指定一個(gè)“所有對(duì)象配置文件”的副本文件,或者叫對(duì)象緩沖文件precached_object_file=/usr/local/nagios/var/objects.precache
resource_file=/usr/local/nagios/etc/resource.cfg # 該變量用于指定nagios資源文件的路徑,可以在nagios.cfg中定義多個(gè)資源文件。status_file=/usr/local/nagios/var/status.dat # 該變量用于定義一個(gè)狀態(tài)文件,此文件用于保存nagios的當(dāng)前狀態(tài)、注釋和宕機(jī)信息等。status_update_interval=10 # 該變量用于定義狀態(tài)文件(即status.dat)的更新時(shí)間間隔,單位是秒,最小更新間隔是1秒。nagios_user=nagios # 該變量指定了Nagios進(jìn)程使用哪個(gè)用戶運(yùn)行。
nagios_group=nagios # 該變量用于指定Nagios使用哪個(gè)用戶組運(yùn)行。check_external_commands=1 # 該變量用于設(shè)置是否允許nagios在web監(jiān)控界面運(yùn)行cgi命令;
# 也就是是否允許nagios在web界面下執(zhí)行重啟nagios、停止主機(jī)/服務(wù)檢查等操作;
# “1”為運(yùn)行,“0”為不允許。command_check_interval=10s # 該變量用于設(shè)置nagios對(duì)外部命令檢測(cè)的時(shí)間間隔,如果指定了一個(gè)數(shù)字加一個(gè)"s"(如10s);
# 那么外部檢測(cè)命令的間隔是這個(gè)數(shù)值以秒為單位的時(shí)間間隔;
# 如果沒(méi)有用"s",那么外部檢測(cè)命令的間隔是以這個(gè)數(shù)值的“時(shí)間單位”的時(shí)間間隔。
interval_length=60 # 該變量指定了nagios的時(shí)間單位,默認(rèn)值是60秒,也就是1分鐘;
# 即在nagios配置中所有的時(shí)間單位都是分鐘。
6.4 驗(yàn)證Nagios 配置文件的正確性
Nagios 在驗(yàn)證配置文件方面做的非常到位,只需通過(guò)一個(gè)命令即可完成:
# /usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
看到上面這些信息就說(shuō)明沒(méi)問(wèn)題了,然后啟動(dòng)Nagios 服務(wù)。
7.1 啟動(dòng)Nagios
a. 通過(guò)初始化腳本啟動(dòng)nagios
# /etc/init.d/nagios start
or
# service nagios start
b. 手工方式啟動(dòng)nagios
# /usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cfg
7.2 重啟Nagios
當(dāng)修改了配置文件讓其生效時(shí),需要重啟/重載Nagios服務(wù)。
a. 通過(guò)初始化腳本來(lái)重啟nagios
# /etc/init.d/nagios reload
or
# /etc/init.d/nagios restart
or
# service nagios restart
b. 通過(guò)web監(jiān)控頁(yè)重啟nagios
可以通過(guò)web監(jiān)控頁(yè)的 "Process Info" -> "Restart the Nagios process"來(lái)重啟nagios
c. 手工方式平滑重啟
# kill -HUP <nagios_pid>
7.3 停止Nagios
a. 通過(guò)初始化腳本關(guān)閉nagios服務(wù)
# /etc/init.d/nagios stop
or
# service nagios stop
b. 通過(guò)web監(jiān)控頁(yè)停止nagios
可以通過(guò)web監(jiān)控頁(yè)的 "Process Info" -> "Shutdown the Nagios process"來(lái)停止nagios
c. 手工方式停止Nagios
# kill <nagios_pid>
網(wǎng)站名稱:nagios部署安裝中篇
標(biāo)題路徑:http://vcdvsql.cn/article38/pegepp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供用戶體驗(yàn)、商城網(wǎng)站、面包屑導(dǎo)航、網(wǎng)站建設(shè)、App開(kāi)發(fā)、微信小程序
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)