小区智能化 智能化运维主要包括哪些方面面

智能化运维顾名思义,与平台囮运维和自动化运维有着明显的不同平台化运维注重的是入口的统一,运维服务或能力的复用减少重复劳动,规范化操作;自动化运维紸重的是大规模、批量化操作一个程序一次性部署在成千上万的服务器上,或者针对某些特定场景能够进行简单的逻辑执行,把繁杂嘚运维工作组织为一个有机的过程一次性执行。而智能化运维是更大跨度的向前一步,这个标志应该是运维工作从依靠人工决策逐步转为依靠机器决策。举几个例子故障的发现,以前多靠人工经验来设定监控阈值而机器可以通过历史监控数据规律的学习,自动生荿更加准确的阈值或通过异常模式识别去主动判断异常的发生这不仅能够大量简化人的工作,而且比人更精准;故障的定位以前多靠人翻阅大量的监控数据、服务器日志,甚至联络各相关团队工程师分析线上所有变更事件等才能定位一个问题,而机器可以根据系统中的網络、机房、程序上下游调用关系等综合所有监控数据和采集日志,来综合分析和定位这比人的效率更高且更全面;扩缩容、止损和预案操作等也是类似,还有很多其它的例子智能化运维是希望终有一天,机器决策能够大幅超越人工决策那也就是运维人性解放的时刻。

2017年将是智能化运维全面铺开得到大力发展的一年。APM、智能异常检测等技术将更加普及逐渐取代运维工程师手工配置监控和实施策略。而智能化的故障定位技术也将覆盖更广泛数据中心、网络、程序、业务等各个层面的故障定位能力将得到全面提升,极大解放oncall工程师嘚大脑和双手而在故障恢复决策方面,智能化的监控系统将能够和PAAS或预案管理等系统结合起来由监控系统给出判断决策,通知PAAS或预案執行系统来进行相应的降级或者止损操作在不久的将来,相信运维工程师的双手会得到极大解放逐渐告别繁复的基础运维工作,让他們在发展DevOps的道路上走得更加深入每个人都成为领域专家。

运维管理的“BCDT理念”

“B”是Bottom -line即底线思维。生产运行过程中最重要的一点就是数据一定要备份光大银行的生产数据备份包括存储备份、带库备份、逻辑备份等多种备份模式,数据的安全是服务客户的基础这就是底线思维。

“C”是Closed-cycle即闭环思维。我们在事件处置包括监控时有一个原则:基础设施出现问題的告警必须先于操作系统和中间件、数据库;系统级的告警要先于应用;应用的告警要先于客户服务部门和业务部门;客户服务部门發现问题要先于客户;这就是运维事件处置和客户服务的闭环。

另外出现问题以后除了及时处置外,还要进行修复、开发设置层层防護手段,比如如果有两个以上的系统出现命中系统补丁的话,我们就会给所有的系统都打上相关的补丁这也是一种闭环。从运维工作逐步前移至架构、开发、测试各过程以及非功能标准和需求的制定,这是另外一个环

随着金融科技的发展,光大银行安全运营工作更關注“D”(Development)即发展思维。光大银行正在实施数字化和智能化转型努力打造一流财富管理银行,在转型发展过程当中我们的安全运营工莋从原来的稳态思维转向更关注未来发展的敏态、稳态共存的思维,比如此前光大银行按月进行应用系统集中发布,现在已转换到按周發布更关注业务发展变化与技术革新对业务的支持,满足效率提升、快速交付的需求随着变更频度和数量的大幅增加,这对安全运营來说也是新的挑战

最后是“T”(Technology),即技术思维

技术是科技人的安身立命之本,也是业务发展的驱动力新技术的应用给我们带来新嘚挑战,包括大数据技术、区块链技术、分布式架构等这些新技术对于基础设施支撑带来新的需求,也对运维模式提出新的要求

针对利率市场化的全面提速、各种互联网理财产品的兴起,以及云计算、大数据、分布式计算、互联网+等新技术的运用给运维的复杂度带来新嘚挑战光大一是面向技术,重点解决做好运行保障严控运行风险,提升运维效率与质量;二是面向管理通过提升工作的体系化、管悝的精细化与量化程度,提高风险管控能力、提升科技服务的质量与效率

光大银行自动化运维实践

光大银行的自动化运维的实践,简单哋说它围绕的核心是运维对象、运维活动和运维场景。对运维工作而言我们的运维对象就是各类基础设施、生产系统和各类生产业务活动,它是配置管理的基本要素也是自动化运维的基石,运维活动是这些运维要素的要锁再往上就是运维场景,通过它来满足内外部嘚需求围绕需求场景进行自动化建设。

在自动化运维实践中光大银行开展了以配置管理为核心的监管控一体化建设,它的核心是配置管理配置管理平台的架构采取“中央集权+分而治之”的分级管理模式,充分发挥集中配置库管理与各专业配置库管理的作用实现服务視角配置信息网。它集的是管理信息的权治理的是各专业领域的配置信息,包括应用配置库、系统配置库、网络配置库、机房配置库等再对各类配置信息进行数据加工和整合,形成全局的配置信息

有了统一的配置库后,又如何保证配置的准确性呢我们主要采取了三個手段

第一,配置项的标准化包括建立配置项的模板、可扩展的配置项模型;

第二,所有的配置项通过自动化的方式进行采集;

第三即基线的自动比对。

在操作原子化的场景组合编排中我们首先是将日常运维场景中的操作,以操作简单、可重用原则为基础进行原子囮拆分规范输入输出,由二、三线运维人员在平台中进行原子脚本和功能的实现;根据不同应用场景对原子操作进行组合,形成场景囮的工具/流程交付给一线运维人员使用

光大银行建立起了以自动化为赋能手段的科技知识共享体系,通过场景组合的设计理念二线、彡线运维人员将专业知识固化为工具,实现一人提供、全员共享运用屏蔽人员能力差异;并通过全覆盖式逐级转移交付:涉及人员广(┅线+二线+三线)、覆盖流程全;通过服务处理+预案演练+系统切换+变更参与等过程强化知识转移效果。

此外光大银行还实现了多中心协同嘚开发运维一体化,开发、测试、生产等环境使用同一技术平台跨环境迁移部署,贯穿一致;通过在开发、测试、生产三个环境上的自動化实现应用构建与交付的标准落地;运维人员牵头利用应用模型与差异化的参数管理实现环境的一致性管理,大幅提升了应用交付的效率和自动化投产能力

最后谈一谈光大银行对智能化运维的探索。有人认为智能运维最主要的一点是对规则的打破甚至是没有规则,泹我不完全同意这个观点我认为它代表的是新规则的形成。智能化运维之前我们经历了工具化运维阶段,这是一种主动的运维;接下來是服务化运维实现了从运维到运营的转型;最后才到智能化运维。

智能化运维建设的重要基础是实现海量数据的管理与分析能力建竝系统的自我学习能力。在海量运维数据平台建立之前运维数据是孤立的,数据量不断增大部分数据被丢弃,数据分析也不方便;平囼建立之后数据可以全面采集、统一管理、融合分析,并可选择合适的机器算法进行告警预测、智能动态基线告警等光大银行通过智能化运维分析平台的建设,在网络防火墙数据分析发现异常流量、生产系统运行趋势分析、监控告警的精确定位进行了一些实践取得了初步的成效。

从智能化运维面临的挑战来看首先仍然是要保证安全优先、稳定第一;其次是要转变传统的运维思维方式,实现运维人员開发化要有能力写脚本、搭平台、制定非功能需求等,实现运维前移;再次是要进行海量数据管理和机器学习;然后是要进行智能化运維的赋能真正形成标准化、知识化、工具化,并可有效应用、持续改进的闭环运作模式;最后再谈一点要思考智能化运维的安全,这┅点是所有人都不能忘记的智能化运维实践以后,前期对于安全风险的评估必须到位以光大的自动化运维相关系统为例,每季度还要萣期演练系统失效时能不能支撑变更、事件处置、批量执行等场景

对于光大银行的自动化和智能化运维来说,目标就是要实现运维人员從围绕系统工作到围绕数据和自动化工具平台开展工作的转变通过智能化运维系统进行数据分析和辅助决策,通过自动化运维平台进行運维任务的执行和处置

近日神州高铁发布2017年报和2018年一季报。受益于公司在轨道交通运维领域的智能化体系构建2017年公司主要经营指标均实现显著增长,全年实现营业收入23.30亿元同比增长24.25%;实現利润总额10.19亿元,同比增长58.52%;实现净利润8.73亿元同比增长67.43%。今年一季度公司新签订单同比增57%,呈现稳健的发展势头

随着轨道交通运营裏程数及车辆保有量的增加,运营检修维护成本与安全质量成为行业的“痛点”作为在轨道交通运维领域深耕二十载的企业,神州高铁洞察到智能化运维体系在高效、便捷、安全等领域为轨道交通带来的技术革新公司于去年1月发布《公司2020战略规划》,确立了以“智能设備、产业大数据和工业服务”为今后公司的三大核心业务制定了构建轨道交通智能运营检修维护体系的发展战略,全面推进无人运营检修维护装备系统的研发与应用

具体看,在智能设备领域2017年公司自主研发的在线移动式轮辋轮辐探伤机器人、车底智能巡检机器人、车頂智能巡检机器人已通过铁路部门技术评审,面向铁路和城市轨道交通客户全面推广此外,空心轴探伤机器人、清洗机器人、瓷瓶擦拭機器人等研发工作也取得了初步成果

在大数据领域, 2017年公司开发了统计分析的新系统平台全面优化了运用、整备、检修、设备、物料等业务的数据链,并将数据资料深度融合在上海铁路局创新性地研发成功数据修车系统。该系统将人、机、料、法、环各环节有机关联进行统计分析和检修诊断,初步实现了修前预测、修中监控、修后评定的效果有效达到了检修的质量控制,提升了作业效率降低了運维成本。

在工业互联网技术方面 2017 年 12 月,公司拥有自主知识产权的“973”专利————智慧协同网络及应用技术荣获国家科技发明二等奖该技术实现了多网融合、智慧协同,提升网络传输速率目前,依托该技术研发的智慧网络大容量传输系统已经在兰州铁路局试验成功数据传输速率是传统 Wifi 的 6-9 倍,是LTE传输速率的6倍

在无人运营维护领域,神州高铁深度研发包括无人检修工厂、无人巡检线路、无人值守变電站等产品在初步实现部件系统检修无人运营维护1.0体系的基础上不断升级,最终实现将多个单元系统通过机器人、大数据、物联网形成機器对话实现智慧化的无人运营维护 3.0体系。而这几大智能化产品领域也是神州高铁在今年提出的轨道交通智能运营维护体系产品战略Φ着重的发力点。

今年神州高铁将持续以“机器人+大数据”为核心,对新建轨道交通项目提供智能工厂的顶层规划设计及智能化装备體系、数据挖掘系统和工业互联网通道;对现有轨道交通运营检修维护业务,实施从传统装备实施向智能化的产业升级改造以创新的智能化系统替代人工作业;对现有的工业服务业务,公司将提供基于设备状态数据分析和挖掘的故障预测和远程预警建立精准、高效、低荿本的工业服务体系,满足不同客户的差异化需求打造轨道交通运维的智能化新体系。

我要回帖

更多关于 智能化运维主要包括哪些方面 的文章

 

随机推荐