资源预览内容
第1页 / 共36页
第2页 / 共36页
第3页 / 共36页
第4页 / 共36页
第5页 / 共36页
第6页 / 共36页
第7页 / 共36页
第8页 / 共36页
第9页 / 共36页
第10页 / 共36页
亲,该文档总共36页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
广东粤港供水有限公司运维管理平台建设方案V1.0 13 / 36目 录1项目建设概述41.1项目建设背景41.2项目建设目标42平台方案设计62.1设计原则62.2功能架构72.3建设规划82.4平台功能需求102.4.1一期功能需求102.4.2二期功能需求172.5平台技术要求242.5.1系统性能要求242.5.2可扩展性要求262.5.3开放性要求272.5.4易用性要求272.6平台安全要求272.7平台部署方式283平台技术路线及选型303.1关键技术路线303.1.1国外产品与国内产品303.1.2传统架构与新型PaaS架构303.1.3运维功能全面性及功能联动303.2技术路线选择313.2.1技术对比313.2.2选型推荐324费用预算334.1一期建设预算334.2二期建设预算345实施计划361 项目建设概述1.1 项目建设背景近年来,随着虚拟化、云计算、大数据等技术快速发展并获得的广泛应用,公司的IT资源规模激剧增长,当前管理节点已超过200个,且随着业务的发展,此规模还会迅速提升,然而当前运维工作仍然以人工为维护为主,我方面临的运维压力前所未有,同时新技术的应用也让运维的技术复杂度增大,对人员的技术要求也随着提高。现有监控与运维管理模式已很难适应当前的运维管理的要求,当前面临的运维挑战主要包括:1、资源规模急剧增长,资产台账梳理不能及时同步,运维管理基础不足;2、虚拟化、云计算、大数据等新技术开始使用,现有监控手段不足;3、目前采用手工管理模式,IT服务质量难以监控和提升;4、运维方式以人工操作为主,效率不高且存在安全隐患;5、缺乏直观、可视化的运维展现;6、运维团队沟通方式分散,团队协同水平低。随着云数据中心业务的发展,IT规模激剧扩展,公司面临的运维压力也激剧增大,因此迫切需要一套一体化、自动化的运维管理平台来支持数据中心的运行保障工作,提升运维管理效率、降低运维管理风险。1.2 项目建设目标通过运维管理平台的建设,能够让在网络、业务系统的运行监控管理的基础上,实现统一运行维护工作,最终达到如下目标:一、梳理资产配置,构建精确、统一的资产配置管理库构建符合实际管理需求的资产配置模型,对资产配置信息进行梳理,实现资产配置的全生命周期管理,并实现资产配置的可视化展现。二、强化主动监控,构建内控体系,实现集中管理通过部署集中监控系统,实现网络、IT资源、业务应用的集中监控和统一操作,主动、及时地发现问题,解决被动救火的局面。三、规范运行流程管理,促进有序高效协作参照ITIL 规范,对运维管理工作进行优化,对服务管理进行改善,根据相关制度进行,对内完善流程,使运维人员具备更高的工作效率;同时把运维过程中产生的丰富经验进行积累和总结,形成有效的知识库,建立知识的共享机制。四、建设自动化能力,提高运维效率,降低操作风险参照互联网成功经验,建立自动化操作平台,实现对应用软件安装、系统巡检、合规检查、故障自愈等运维操作的自动化,提升运维效率、降低人工操作风险,同时为下一步走向智能化运维打下基础。 五、全方位数据展现,实现统计分析和决策支持通过提供各类性能分析报表、资源统计报表和运维分析报表,从各个侧面、各个角度反映系统的运行情况、性能情况和人员工作情况,为系统升级、改造、扩容提供科学依据;也为员工的绩效考核提供电子依据。2 平台方案设计2.1 设计原则n 先进性应采用成熟、先进的技术产品,设计和搭建IT运维管理基础平台,在该平台的基础上,结合运行管理业务,采用模块化设计方法,确保架构层次鲜明、有序,确保各个模块不会相互影响,最大限度的保障系统的稳定。与此同时,系统的各个模块应具有良好的发展潜力,适应技术的发展方向。n 可靠性平台应具备高可靠设计,当部分组件故障时应不影响整个系统的使用,平台应具备较强的容错能力。n 安全性应采用加密、数据缓存等方式保障数据传输中的安全和可靠性。提供系统用户管理功能,应可以对系统用户进行授权管理,提供完善的日志审计功能,对系统的登录日志、操作日志等均保持记录和归档,确保日后追查和跟踪取证。n 开放性平台设计应符合相关的技术规范,提高系统的兼容性,包括:Restful、SNMP、SysLog、CORBA、J2EE、JMS等标准和规范,遵循接口的标准化和规范化原则,提高系统的集成能力。n 可扩展性平台业务功能的实现应采用面向对象技术进行分析、设计和封装,系统功能实现应被封装成独立的业务组件。应采用模块化结构,以保证系统功能扩展和兼容。同时系统应具有很好的拓展性,并提供开放和标准的接口,如Restful、MIB、CORBA等,可以在不影响系统正常使用的情况下与第三方系统灵活对接。n 灵活性平台应具备灵活操作特性,支持各种异构的环境系统,提供充分的配置参数驱动能力,可通过调整参数配置来达到监控适应性,而不需要对系统程序进行修改才能实现。实现系统便捷修改、定义、维护、升级、备份等操作。n 标准性应提供标准的接口规范和完备的文档资料, FCAPS、eTOM、ITIL等国际规范,遵循业界公论的ITIL服务管理标准。2.2 功能架构综合运维平台的架构设计需要既从现有的应用需求出发,又要面对未来业务和技术发展的要求,在技术方案的先进性、实用性、扩展性、稳定性等方面保持一个良好的平衡,确保为我司的信息化建设提供长期的支撑,保证IT运维管理的不断发展需要。平台需要对我司现有网络、物理主机、虚拟主机、虚拟化平台、云平台、数据库/中间件、应用服务等IT资源进行统一管理,需要通过agent有代理或agentless无代理的模式对资源进行发现、采集、监控等操作,并最终实现资产配置管理、网络监控、系统监控、应用性能监控、用户体验监控、集中告警管理、运维可视化展示、服务流程管理、操作自动化管理等,提供统一的管理门户,并在平台层打通各功能模块数据形成统一资源库,实现不同功能间的运维联动,做到自动化、智能化运维。功能架构如下:附图1. 运维管理平台功能架构其中各模块应分别实现如下功能:n 资产配置管理库实现对数据中心所有IT资源的配置信息管理,保证数据中心中配置项的完整性和精准性,构建运维管理元数据,并为监控、运维流程提供资源数据。n 集中监控管理实现数据中心基础资源、业务应用、用户体验全方位监控,同时提供集中的监控告警管理及监控性能数据展示。 n 服务流程管理实现基于ITIL的规范化运维管理流程,建立基于服务目录的对外服务交付过程。n 操作自动化管理实现面向于服务器运维自动化,提升运维操作效率、降低人工操作风险。n 可视化展示与分析实现美观形象的可视化展示平台,帮忙准确掌握IT运行态势与运维服务水平。n 运维管理门户实现运维管理门户网站、个人工作台等形式的面向外部最终用户自服务及内部人员人性化的运维界面。此外,平台应预留多种标准接口及开放的接口体系,实现和第三方系统的功能或数据集成对接,包括云管理平台、PKI认证、短信系统、邮件系统、VOIP语音系统等。2.3 建设规划信息化建设是一个持续过程,业务、技术、管理都在持续发展,这些都要求运维工作也必须是一个持续建设、持续改进的过程,运维项目的建设不能着眼于当前的管理需求,还要充分考虑未来35年的发展规划,从而确保项目建设成果具备一定的扩展性和延伸性,能够满足或通过升级、扩展的方式逐步满足未来对运维工作的要求。根据本项目建设需求,运维管理平台的建设也遵循分阶段、分步的建设策略,逐步完成运维平台“一体化、自动化、智能化”的建设目标。附图2. 运维平台两步走建设策略1) 一期:平台搭建,建立一体化运维管理平台建设一体化运维管理平台,实现对IT基础设施的全面监控,针对关键基础设施进行网络监控、系统监控、集中告警管理,同时构建配置管理库(CMDB)实现对配置项的集中管理,然后根据实际需求,利用以获取的监控管理数据进行运维可视化展示。2) 二期:优化完善,提升运维自动化与对外服务交付能力根据运维工作的实际情况,进行运维流程管理的建设,实现运维工作规范化管理;同时建立运维自动化基础能力,实现环境准备自动化、应用安装自动化、巡检自动化等,提升运维效率、降低运维操作风险。最后,建设关键应用的用户体验监控和应用性能监控功能,进一步提升业务系统的性能,提高业务用户使用的满意度。同时,通过与华为VOIP语音系统进行对接,实现监控语音告警通知。2.4 平台功能需求2.4.1 一期功能需求2.4.1.1 资产配置管理需求(一) 总体要求配置管理工具作为本次项目的核心支撑功能,应具有以下能力:1) 数据收集容易,提供配置数据收集能力,减少人工维护工作量;2) 数据维护容易,自动化校验配置项变化,保证数据鲜活性;3) 数据分区容易,可划分区块进行权限控制和协作,满足精细管理需求;4) 数据消费容易,提供完整的API体系,方便扩展上层应用。(二) 配置建模配置库应支持灵活的动态建模能力,可根据IT架构分层,自由、灵活的定义和调整配置模型,需支持配置项类型、配置关系、配置表单的建模能力,所有设计与调整要求都基于可视化界面。(三) 配置发现配置管理库应支持多种配置项的发现和收集手段,包括:人工录入和批量导入、配置自动发现工具等。配置自动发现工具应支持通过代理和无代理方式进行配置数据发现,发现对象应包括网络设备、服务器、操作系统、数据库、中间件、虚拟化等,并需支持发现配置项关系的发现。应支持向导式发现配置功能,支持ICMP、TCP、SNMP、WMI、Telnet、SSH、CCLI、Http、DNS、JDBC、JMX、VMWare、libvirt、XenAPI等多种协议来实现配置信息的自动发现,可以通过发现配置向导来实现发现范围、发现参数的设置,应构建合理的配置发现策略,同时应支持将发现结果导入到配置管理库中。从不同采集源获取到相同的资源数据时,系统应能够识别并合并,并与配置库中标准数据进行比。(四) 配置维护数据维护应包括数据分区管理、配置审核管理。配置维护分区,应按照技术团队视角划分创建配置维护分区,各团队可进行资源认领并负责对该数据的维护管理。应采用社交协作化的思路,支持配置评论与配置的动态展示。从不同采集源获取到相同的资源数据时,系统应能够识别并合并,并与配置库中标准数据进行比对。系统应能够判断是否产生变化,并通知技术团队管理员进行审核,避免出现重复或不一致的配置信息。配置数据的变更生效应由工作区负责人审核决定,确保变更的快捷有效。变更审核时应支持查看配置数据变化报告。应支持对工作区内所有资源的数据变化时,实时通知数据的订阅者或第三方系统,并告知变化内容。(五) 配置数据消费应提供图形化配置数据展示视图,能够直观展示资源间的关系结构,同时提供业务系统级的资源关系图。配置关系图应提供多种样式的自动化布局,能够使用不同的形状、颜色、方向的箭头直观地展现配置项之间的关系,配置关系应支持图形化界面进行编辑。应支持基于配置关系视图的故障影响分析与变更影响分析等配置数据消费场景。应提供全文检索的能力,能够对所有配置信息通过全文检索的方式进行数据查询。全文检索应支持对配置信息的附件信息进行检索,应同时提供最近搜索记录功能,能将最近、常用的搜索的关键字进行记录,并通过点击快速进行检索。2.4.1
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号