资源预览内容
第1页 / 共23页
第2页 / 共23页
第3页 / 共23页
第4页 / 共23页
第5页 / 共23页
第6页 / 共23页
第7页 / 共23页
第8页 / 共23页
第9页 / 共23页
第10页 / 共23页
亲,该文档总共23页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Nagios操作说明编写 史辉核对 孙丰工程运维中心二OO九年一月目 录第一章.什么是Nagios3第二章 Nagios的WEB操作说明4前言42.1Nagios登录42.2.General选项说明52.3Monitoring52.3.1 Tactical Overview(总览)62.3.2 Service Detail(服务详细信息)72.3.3Host Detail (主机存活状态详细信息)112.3.4Hostgroup Overview(主机组汇总信息)122.3.5Hostgroup Summary(主机组摘要信息)122.3.6Hostgroup Grid(以表格形式显示的主机信息)132.3.7Servicegroup Overview(服务分组预览)132.3.8Servicegroup Summary(服务分组摘要)132.3.9Servicegroup Grip(表格形式显示服务分组)132.3.10Status Map和3-D Status Map132.3.11Service Problems152.3.12Host Problems152.3.13Network Outages152.3.14Show Host152.3.15Process Info(Nagios进程信息,管理员可见)152.3.16Performance Info (执行信息,管理员可见)162.3.17 Scheduling Queue(队列信息,管理员可见)172.4.Reporting182.4.1Trends182.4.2Avaiability182.4.3Alert Histogram192.4.4 Alert History202.4.5Alert Summary202.4.6Event Log213.1.Configuration21第一章. 什么是NagiosNagios是一款非常优秀的网络主机管理软件,是一款用于系统和网络监控的应用程序。它可以在你设定的条件下对主机和服务进行监控,在状态变差和变好的时候给出告警信息。Nagios更进一步的特征包括: 监控网络服务(SMTP、POP3、HTTP、NNTP、PING等); 监控主机资源(处理器负荷、磁盘空间、内存占用等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法; 并行服务检查机制; 具备定义网络分层结构的能力,用parent主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态; 当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式); 具备定义事件句柄功能,它可以在主机或服务的事件发生时获取更多问题定位; 自动的日志回滚; 可以支持并实现对主机的冗余监控; 可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等;第二章 Nagios的WEB操作说明前言推荐使用Firefox来浏览Naigos的页面,同为开源软件,Firefox与Nagios结合得很不错:1. Firefox登录Nagios页面后,当监控目标异常时,有声音告警,而且在故障没解决前,始终周期性声音告警,IE没有这个功能。2. Firefox提供了一个插件nagios checker,如果安装了这个插件,就不需要时时刻刻登录Nagios了,只要打开Firefox就可以了。当监控目标出错时,Firefox的插件会自动告警。见下图插件安装及设置方法略。 由于帐户权限可能有限,本文中提供的部分功能在部分帐号上无法看到。2.1Nagios登录打开浏览器,输入nagios页面地址,进入Nagios首页,会看到Nagios相关版本和操作选项。登录页面后,会看到Nagios默认页面的相关信息,左侧显示的是操作按钮选项,右侧是Nagios版本和帮助说明,我们就以Nagios页面中左侧显示的内容为参考,进行本章的划分,如下图所示。2.2.General选项说明单击“GeneralHome”会显示默认页面,如上图所示,单击“GeneralDocumentation”显示Nagios版本帮助信息,如下图:2.3Monitoring Monitoring包括的选项如下图左侧所示:下面针对Monitoring下面的选项的功能做具体的说明。2.3.1 Tactical Overview(总览)通过上面的介绍,相信对Nagios的登录界面有初步的认识,下面将介绍WEB页面的Monitoring监控选项具体监控操作,需重点掌握。单击“MonitoringTactical Overview(基本概况)”,如下图所示:这个页面上显示了所有主机的状态信息,可以看到停机(down)、不可达(Unreachble)、UP(启动)、等待返回状态(pending)。同时列出了所有服务的状态信息。所谓服务并非单纯指狭义上的Windows的系统服务,而是该设备上的进程、资源、系统服务等等的一个统称。此外,还对主机、服务的各种状态进行了描述。下图Notification项中可以看到有14个服务是不发布告警信息的,点击红色部分可以看到更详细的主机信息。这部分监控目标是因为各种原因手工禁止发布告警信息的,并非故障。 Network Outages: 显示网络中断的统计,如果有中断信息会在下面显示; Network Health: 显示网络健康状况,会列出主机和服务状况,以绿色进度条显示,进度条满格显示代表主机和服务状况正常。 Hosts:down代表宕机;Unreachable代表不可到达;UP代表主机在线,Pending表示该主机刚被纳入监控范围,等待第一次检测结果返回中。 Services:Critical代表紧急告警;Warning代表警告告警;Unknown代表未知告警;Ok代表服务运行正常; Pending代表待定。 Monitoring Features:Flap Detection代表抖动检测;Notifications代表告警,上图中看到有14个服务因为各种原因,手工设定不对外发布告警信息;Event Handlers代表事件句柄;Active Checks代表主动检测;Passive Checks代表被动检查; 上面的hosts/services/monitoring等都是超链接,可以直接点击上面的链接跳到你所关心的位置。2.3.2 Service Detail(服务详细信息)单击“MonitoringService Detail(服务内容)”,如下图所示: Current Network Status:列出当前网络的状态,上次更新的日期以及登录的用户名称等; Host Status Totals:显示主机状态的统计信息,相应的统计信息会在下面列出,具体包括:UP,DOWN,Unreachable,Pending,All Problems,All Types; 可双击相应的选项进入查看。 Service Status Totals:显示服务状态的统计信息,相应的信息会在下面列出;具体包括:UP,DOWN,Unreachable,Critical,Pending,All Problems,All Types;可双击相应的选项进入查看。 Service Status Details For All Hosts:列出所有的主机和服务相关状况的详细信息,包括:Host,Service,Status,Last check,Duration Attempt,Status Information。如果想查看相关信息,我们可以点击Host或Service列出的主机和服务名称进行查看。点击上图中Host所列的任意一主机名称如下图所示:针对图中“Host State Information和Host Commands”所列字段信息的说明: Host Status:主机存活的状态,UP代表存活,DOWN代表宕机。 Status Information:状态信息 Performance Data:性能数据信息 Current Attempt:目前的尝试次数 Last Check Time:最后检测时间 Check Type:检测类型 Check Latency/Duration:延时检测/持续检测 Next Scheduled Active Check:下次计划主动检测时间 Last State Change:上次状态改变时间 Last notification:上次告警时间 Is This Host Flapping:主机是否抖动,即反复出现故障,或刚从故障中恢复。 In Scheduled Downtime:是否计划宕机 Last Update:上次更新时间 Disable active checks of this host:不主动检测这台主机 Re-schedule the next check of this host:下一次计划检测这个主机,选中后可以自定义时间和是否强制检测,提交后执行即生效。这里默认的检测时间是距当前时间 Submit passive check result for this host:为这个主机提交被动检测结果 Stop accepting passive checks for this host:停止接受被动检测此主机 Stop obsessing over this host:停止被困扰的主机 Disable notifications for this host:不显示主机告警通知 Send custom host notification:发送自定义主机告警 Schedule downtime for this host:为主机提供停机功能,此功能为主机自定义停机时间,维护主机或者割接时常用到此功能,在指定的停机时间内,将不会发出通知;当预定的停机时间到期时,将发出通知些主机。里面会有起始时间和终止时间,可以选择固定或弹性停机,此功能需重点掌握,比较常用。 Disable notifications for all services on this host:本机上的所有服务不启用告警 Enable notifications for all services on this host:本机上的所有服务启用告警 Schedule a check of all services on this host:计划为本机检测所有的服务,用来排定下次检查所有服务指定的主机,可以强制检查。 Disable checks of all services on this host:禁用为本机检测所有的服务。 Enable checks of all services on this host:与上面的相反。 Disable event handler for this host:用来暂时阻止Nagios主机运行事件处理程序 Disable flap detection
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号