工业互联网平台核心技术之七:运维技术.docx
《工业互联网平台核心技术之七:运维技术.docx》由会员分享,可在线阅读,更多相关《工业互联网平台核心技术之七:运维技术.docx(9页珍藏版)》请在优知文库上搜索。
1、运维监控平台是工业互联网平台运维工作中不可或缺的一部分,如何构建适合自己的运维监控平台,每个公司的需求不一样,每个运维面对的痛点也不尽相同,但,有了监控,有了充足的数据,一切以数据说话,运维就不再是背锅侠了。运维管理是工业互联网平台使能技术之一,在平台中的地位极其重要。在工业互联网平台的运维管理中,我们经常听到关于运维的话题:“无监控,不运维。随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务,平台系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要运维管理者时刻保障核心业务稳定可用。运维管理的痛点和难点运维工程师在运维中过程中经常遇到运维工作如下的痛点和
2、难点:1、面向业务的运维,不但关心单点物理资源的运行状态,更关心整个业务系统的健康状态2、如果企业使用了大量的APl和模块化应用,那么需要关注每个接口的性能变化情况和指标3、对于运维主管及企业管理层来说,特别需要上墙的监控大屏4、运维需要每周、每月查看报告趋势分析,但传统运维工具数据导出困难5、需要第一时间转雀和快速发现故障节点,减少业务中断带来的损失运维管理(1)物理资源状态监控。提供可按照资源池、集群对物理设备的资源状态、如计算、存储、网络等运行状态进行监控。(2)故障告警及通知。支持Email或者短信、微信等告警的实时通知消息。监控点1属性信息解码设得2属性信息编码设备3属性信息视频综合
3、矩阵N属性信息解码设备2档案编码设备3档案视频综合矩阵N档案监控点1档案(3)资源库存及资产管理。支持对物理设备库存及资产管理,需要扩充及时提供运维异常上报U三三iSSl三R*修认IKit三IH三Bl收单也眇动要标曲司2t15040612500工单确认I*m*asae*三工单反馈工单反Ma三VE901*ZgMAenmufa反man同反馈确认管理人员。(4)故障分析报表。可按照故障级别、事件类别出具故障的分析报表,便于改善服务。2、业务资源监控(1)业务资源状态监控。可按照服务如虚拟主机、云数据库、块存储等进行资源状态监控。(2)业务资源容量监控。对业务资源层的资源容量进行分别监控,可设置容量告
4、警阈值提醒资源扩容。(3)运维操作记录。记录运维相关的操作日志且存档期不少于半年。运维管理一般流程和功能1.运维管理流程运维管理的一般过程如上图所示,制定云服务运维管理流程,需要包括:服务台、事件管理、问题管理、变更管理、配置管理、发布管理、知识库管理、报表管理。2、运维管理功能云服务运维管理系统应提供以下功能:(1)监控管理,通过对各种物理资源、虚拟化资源数据的监控,将资源以用户可见的资源池形式提供给上层应用。统一资源管理,支持发现其管辖范围内的物理设备以及它们的组网关系。支持将这些物理设备进行池化管理,提供给应用管理模块使用。(2)权限管理,可以创建和管理系统中管理员帐号、管理员所承担的角
5、色和管理员管理区域,实现系统的分权分域的功能。系统支持对用户进行访问控制,支持用户组、分权、分域、密码管理,便于维护团队内分职责共同有序地维护系统。(3)告警管理,是确保系统正常运行的重要活动,包括:系统故障预防设计、故障检测和处理等。告警管理是故障管理的重要部分,便于运维人员进行故障定位,保证系统稳定运行。(4)拓扑管理,提供一个可视化界面,呈现全系统的所有资源信息。支持常用设备自动发现和识别,系统还对网络类型有很好的兼容性,可以很好的发现VPN.V1.AN网络拓扑,还支持按照规则识别不同的设备类型,方便更准确的呈现拓扑。(5)日志管理包括日志记录、查看、审计。(6)软件管理,支持云操作系统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 工业 互联网 平台 核心技术 技术
