什么是乙方运维
笔者最近一直在各种忙碌,又是工作又是生活的,这两天终于能挤出点时间写文章了。
这次给大家带来运维管理
类型知识的分享,今天的主题是乙方运维项目
。
说到运维,相信大部分的小伙伴接触到的都是甲方运维
,
需要维护的业务系统、各类型设备、机房等等,都是属于企业自身的资产
。
那乙方运维
又是什么呢?
简单来说,企业
将自身的业务系统、IT 资产的运营维护工作委托给技术公司
处理。
- 甲方: 指企业自身
- 乙方: 指承接这个运维工作的技术公司
一般较多的出现在党政机关单位、国有国企或者传统企业等,自身 IT 技术力量较弱的企业。
那么笔者就以乙方运维经理
的角色,来说说如何开展乙方运维工作
。
假设有这样的场景
甲方:某党政机关单位,设立有信息化办公室,但 IT 技术力量较弱;
乙方:技术公司,为甲方提供
IT运维服务
(笔者所在的公司)汇报对象:甲方信息化办公室
笔者的角色:乙方派驻的运维经理,负责协调各类资源
运维服务的范围:
- 甲方的多个业务系统:包括单位内部使用系统、外部对社会开放的系统;
- 甲方的机房设施:包括各类自建机房内的网络设备、服务器存储设备、软硬件操作系统等;
- 甲方的云资产:包括公有云、私有云的各类 IAAS、PAAS 资产;
在前期阶段,资料收集、整理,是运维项目开展的第一步,也是最重要的的部分。
可以按照如下的思路进行梳理。
业务系统
业务系统只甲方最关心的部分,这部分要重点关注。
注意:甲方提供的资料不一定准确,有可能是历史的资料,建议各位运维经理都重新整理一遍,最好能亲自登录下系统,把相关信息绘制成表格
可以按照下面的思路来收集资料:
- 业务系统的总数量
- 系统的主要作用及重要程度,使用群体是什么等。
- 系统部署情况
部署在哪个网络环境?在外网还是内网?B/S 还是 C/S?
- 维护厂商资料
出故障找谁能解决?建立一个联系人通信录。
- 系统的模块功能情况,业务拓扑情况。
- 业务系统使用的技术栈。
使用了哪些中间件?哪种数据库?技术栈是 JAVA 还是 DotNet?
基础设施(IDC 机房与云)
假设甲方有 IDC 机房,应当收集的材料:
- 机房的地址信息,是自建机房?还是托管机房?
- 机房的网络接入情况,ISP 运营商是哪家?
电信?联通?移动?或者某个党政机关。
- 机房的出入都有哪些程序、手续?
后续很大可能会去机房的,这些都要提前知道
云资源应当收集的材料:
- 收集云资源的类型、厂商等信息。
是公有云?混合云?私有云?
- 云的部署情况,部署的机房物理位置等。
- 云的网络架构如何?都接入了哪些网络运营商等。
可以参考 IDC 机房需要了解的信息
网络架构
有信息系统,就必然有承载运行的网络环境。按作用可以分为:
- 生产环境:承载生产系统,存储的都是真实的业务数据,稳定性要求最高;
- 开发测试环境:用于系统开发、或者功能测试的环境,里面大多数是模拟数据;
- 预发布环境:介于
生产
与开发
之间的环境,用于上生产之前的功能测试、压测等。(不一定每个单位都会有的);
按部署情况可分为:
- 互联网环境:一般部署的都是对公众公开的系统,出口与互联网对接,业务系统直接或者反向代理的形式暴露到公网。
- 内网环境:一般承载公司内部系统,如 OA 系统、财务系统等具有一定敏感数据的系统,会有一定程度与互联网对接。在企业内部或者拨 VPN 才能访问。
- 政务网环境:党政机关单位特有的网络,可以理解成党政机关的大局域网,只能在党政机关内部使用,安全级别较高。
注:此次不涉及办公电脑的运维,所以暂不考虑办公网络
具体需要收集:
- 网络的类型与分类作用
可以根据上述所说的简单分类并描述
- 网络拓扑情况
ISP 的接入方式、网络拓扑图等
各类资产信息
物理设备方面
- 网络及安全设备的清单
机架位置、网络拓扑图所在位置、设备型号、作用、无备机情况
- 服务器、存储、光线交换机等计算设备的清单
机架位置、型号、作用
云及虚拟资产
IAAS 资产:
资源型号、作用、相关业务系统
- 虚拟机
- 对象存储
注意了解区域、账号
- 负载均衡器
- 弹性 IP
PAAS 资产:
版本号、作用、相关的业务系统、账号、权限、实例等
- 缓存数据库(Redis、Memorycache)
- 文档分析型数据库(MongoDB、ElasticSearch)
- 关系型数据库(Mysql、SQL Server、PostgerSQL、分布式数据库等)
- 消息队列(RocketMQ、Kafka、RabbitMQ、MSMQ 等)
- 计算框架、应用网关等(SpringCloud、腾讯阿里各类框架)
SAAS 资产:
这类资源类型各式各样,表现形式很多,主要是作用、账号等
- 各类网盘、代码托管库、WIKI 知识库等
- FTP、SFTP
- CDN、页面缓存、静态资源存储等各类加速服务
- WAF 应用防火墙
- 人脸识别、图片识别
Kubernetes 与容器化资产
K8S比较特殊,不属于上述几类资产,需要关注的点也比较多
- 私有化部署?还是厂商提供的容器引擎?
- Master、Node 节点的情况
- 网络组件种类,有无打通 K8S 内外网络环境
- 持久化存储组件情况
- Ingress、服务网格的使用情况,域名规划等
- 弹性伸缩策略
- 管理方式
最好能拿到配置文件、有权限的账号、Token等
无形资产:
- 各类平台的账号密码
- DNS 域名记录
- SSL 证书、CA 证书
- 各类系统文档
最后是各类云的账号
如果拿不到管理账号,就拿到账号的管理员联系方式。意在发生故障时能快速找到相关人员处理
组织架构及通信录
作为乙方运维经理,当然少不了给甲方爸爸汇报了。甲方的组织架构、联系方式是必不可少的工作。
其次,党政机关、国企这类的单位的运维,通常会有很多第三方 IT 服务商参与,服务商的管理也是重要的一环。
可以按照如下方式整理:
- 组织架构图
- 甲方爸爸的组织架构图
- 厂商组织架构图
- 通信录(以下是参考的表格)
组织 | 岗位 | 姓名 | 职责 | 联系电话 | 邮箱 |
---|---|---|---|---|---|
甲方爸爸 | 办公室主任 | 陈叉叉 | 办公室负责人 | 134xxxxxx | xxxx@xxx.com |
甲方爸爸 | 信息化接口人 | 李叉叉 | 汇报对象 | 134xxxxxx | xxxx@xxx.com |
乙方 | 运维经理 | 林叉叉 | 运维协调 | 134xxxxxx | xxxx@xxx.com |
腾讯 | 监理 | 王叉叉 | XXXXX | 134xxxxxx | xxxx@xxx.com |
阿里 | 项目成员 | 张叉叉 | XXXX | 134xxxxxx | xxxx@xxx.com |
日常运维工作
无论运维也好、运营也好,项目必然会接触大量的琐碎的日常工作,这部分工作甚至会占据了运维工作的超过 60%
。了解这部分的工作讨论、有什么坑,并总结出经验与规律是十分有必要的。
这里简单列举一些事项:
- 了解文档管理情况,党政机构、国企都是文档满天飞,而且都不一定会有 WIKI 之类的文档管理机制,一定要多多收集归类整理;
- 了解各类办事流程,例如资源如何申请,各类权限申请,需要与第三方协助的时候的流程、公文公函如何发;
- 了解各部门的职责,党政机关机关、国企通常部门职责划分得比较清楚,要多多的了解,遇事处理也快捷;
- 了解各类第三方厂商的运营等合作方式;
多年血与泪的经验教训啊,一定要搞好关系,不然踢皮球超级严重
- 了解各类安全方面的防护情况,有无
跳板机
、堡垒机
之类的设备; - 了解当前运维方式,如人肉、脚本、自动化等等,看看当前处于哪个阶段;
- 了解当前运维技术栈,毕竟运维技术、工具更新快,且多又杂,不一定都接触过;
- 了解以往故障,对以前运维中发生的故障如果有记录那就最好去了解,看看当时的故障表现及处理方法,如果没有记录,也可以询问同事了解;
小结
好,以上就是项目前期的工作了,这一大坨的东西也是够各位运维经理去消化了。
那项目建设阶段又有哪些事需要做呢?笔者将会留在下一篇文章给大家介绍,敬请期待。
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!