业务背景:
客户是中國(guó)某大型金融集团,由于业务的快速转型,其云产品的数懂子据和内容在快速增長(cháng),运维對(duì)象和运维内年湖容的变化也越来越快,這(zhè)時(shí)减少故障發(fā)生,保障平台業紅平稳运行就(jiù)成(chéng)为了一个迫切的需求。自动化运营平山林台這(zhè)是這(zhè)个需求下的产物,其目的是成(chéng)为运他愛维的统一入口,提高运维的效率与质量,实现需求、故障的提前预测与一键式自匠頻动操作等功能(néng)。
解决方案:
佰钧成(生兵chéng)从三个维度确定這(zhè)个运维平台的開(kāi)笑刀發(fā)理念。
首先,是基錢但于ITIL的流程管理。由于该云产品承担了该客户一部分企业基础玩暗架构的角色,所以为了满足金融企业的高合规特征,云产品的运维要严格我綠遵守ITIL流程,包括按照公司的制度规范要求实施变更、事(s美來hì)件、问题、业务持续计划以及容量管理;针對(duì)云平呢雪台特有的工作内容,制定管理规范和文档;對(duì)运维人员進(jìn)行慢金思维模式、行为习惯和能(néng)力的培训和考核。
其次是用D那輛evOps的方法论去管理這(zhè)个运维产品的開(kāi)發自麗(fā),即在产品開(kāi)發(fā)阶段即引入运维参与,确保产品的可靠性与到制可运维性。
最後(hòu)是引入S多房RE运维平台系统,确保平台的可靠性,其中心思想有兩(liǎng)点:从姐媽软件或架构层面(miàn)分析问题解决问题,避免引入人的工作或影响;所有必房時需的操作都(dōu)要有工具支撑,避免随著(zhe)底层操作對輛你(duì)象资源的增加而增加工作人力。
客户收益:
² 對(duì)接科技运营制度与规范,制定了云产品内部的流程制度,保证了故障發(們務fā)生時(shí)的快速响应与多团队联动;
² 通過(guò)用户自助服务,提高了用户對(duì)于云主机的控制能(n風看éng)力,同時(shí)大幅减少了主机部分的交付与运维成(chéng火跳)本;
² 通過(guò)集中运维平台,自动化了一大批原本手工才能(né新要ng)完成(chéng)的工作,以少数人力支持了快速發(fā)展的业务需玩話求;
² 贯彻执行DevOps思想,在产品设计開(kāi)發(fā)阶段即考虑高學可运维能(néng)力,同時(shí)全员参与运维又提高了产品人员對(多費duì)稳定运维的重视和运维自动化水平的提高。
业务背景:
客户是國(guó)内某大型ICT服务提供商,自身拥有体量巨大的云平台和云服务紅錢,由于登入的用户和数据的增多,传统的“發(fā)现问题,解决问题”思路已這是經(jīng)不能(néng)适应新环境下的业务需求,而需要一个多指跳子标、高精度、自动化、实時(shí)的监控平台来确保云平台的稳定运行。
解决方案:
佰钧成(chéng)从“基础设施-云资源-中间件-应用业务”,实现可吃讀用性、性能(néng)、容量等维度实现全栈监控管理;适配公有云、私有云、内网農聽等云平台,面(miàn)向(xiàng)云化业务的底层基础设施、OS、站点、集高厭群、云服务器CPU利用率、内存利用率、云数据库、磁盘利用率等各项云服分雜务器负载和性能(néng)指标,支持多種(zhǒng)告警策略配妹草置,自定义告警阀值,通過(guò)多层主动监控,支持管理人员查看子筆云服务的监控和运行状况,保障云平台和云服务的高效稳定运行,为海量运维和资源数醫樂字化运营提供了准确实時(shí)的监控数据。
平台架构:
客户收益:
覆盖云平台网络、计算、存储、应用等多方面(miàn),实现對(duì)数十万票音對(duì)象、数千万指标的自动化监控,對(duì)平台全栈多用户(IT管理小北者、数据中心管理员、网络管理员……)開(kāi)發(fā)特定端口,在厘遠視定平台监控内容和职责的基础上,约束异常状态和告警显示值,自动中店化的將(jiāng)對(duì)应职责分派到(dào)對(duì)畫什应端口,快速有效的在每个环节進(jìn)行监控,避免风险。