什么是乙方运维

笔者最近一直在各种忙碌,又是工作又是生活的,这两天终于能挤出点时间写文章了。
这次给大家带来运维管理类型知识的分享,今天的主题是乙方运维项目

说到运维,相信大部分的小伙伴接触到的都是甲方运维
需要维护的业务系统、各类型设备、机房等等,都是属于企业自身的资产

乙方运维又是什么呢?
简单来说,企业将自身的业务系统、IT 资产的运营维护工作委托给技术公司处理。

  • 甲方: 指企业自身
  • 乙方: 指承接这个运维工作的技术公司

一般较多的出现在党政机关单位、国有国企或者传统企业等,自身 IT 技术力量较弱的企业。

那么笔者就以乙方运维经理的角色,来说说如何开展乙方运维工作

假设有这样的场景

  • 甲方:某党政机关单位,设立有信息化办公室,但 IT 技术力量较弱;

  • 乙方:技术公司,为甲方提供IT运维服务(笔者所在的公司)

  • 汇报对象:甲方信息化办公室

  • 笔者的角色:乙方派驻的运维经理,负责协调各类资源

  • 运维服务的范围:

    • 甲方的多个业务系统:包括单位内部使用系统、外部对社会开放的系统;
    • 甲方的机房设施:包括各类自建机房内的网络设备、服务器存储设备、软硬件操作系统等;
    • 甲方的云资产:包括公有云、私有云的各类 IAAS、PAAS 资产;

在前期阶段,资料收集、整理,是运维项目开展的第一步,也是最重要的的部分。
可以按照如下的思路进行梳理。

业务系统

业务系统只甲方最关心的部分,这部分要重点关注。

注意:甲方提供的资料不一定准确,有可能是历史的资料,建议各位运维经理都重新整理一遍,最好能亲自登录下系统,把相关信息绘制成表格

可以按照下面的思路来收集资料:

  • 业务系统的总数量
  • 系统的主要作用及重要程度,使用群体是什么等。
  • 系统部署情况部署在哪个网络环境?在外网还是内网?B/S 还是 C/S?
  • 维护厂商资料出故障找谁能解决?建立一个联系人通信录。
  • 系统的模块功能情况,业务拓扑情况。
  • 业务系统使用的技术栈。使用了哪些中间件?哪种数据库?技术栈是 JAVA 还是 DotNet?

基础设施(IDC 机房与云)

假设甲方有 IDC 机房,应当收集的材料:

  • 机房的地址信息,是自建机房?还是托管机房?
  • 机房的网络接入情况,ISP 运营商是哪家?电信?联通?移动?或者某个党政机关。
  • 机房的出入都有哪些程序、手续?后续很大可能会去机房的,这些都要提前知道

云资源应当收集的材料:

  • 收集云资源的类型、厂商等信息。是公有云?混合云?私有云?
  • 云的部署情况,部署的机房物理位置等。
  • 云的网络架构如何?都接入了哪些网络运营商等。可以参考 IDC 机房需要了解的信息

网络架构

有信息系统,就必然有承载运行的网络环境。按作用可以分为:

  • 生产环境:承载生产系统,存储的都是真实的业务数据,稳定性要求最高;
  • 开发测试环境:用于系统开发、或者功能测试的环境,里面大多数是模拟数据;
  • 预发布环境:介于生产开发之间的环境,用于上生产之前的功能测试、压测等。(不一定每个单位都会有的);

部署情况可分为:

  • 互联网环境:一般部署的都是对公众公开的系统,出口与互联网对接,业务系统直接或者反向代理的形式暴露到公网。
  • 内网环境:一般承载公司内部系统,如 OA 系统、财务系统等具有一定敏感数据的系统,会有一定程度与互联网对接。在企业内部或者拨 VPN 才能访问。
  • 政务网环境:党政机关单位特有的网络,可以理解成党政机关的大局域网,只能在党政机关内部使用,安全级别较高。

注:此次不涉及办公电脑的运维,所以暂不考虑办公网络

具体需要收集:

  • 网络的类型与分类作用可以根据上述所说的简单分类并描述
  • 网络拓扑情况ISP 的接入方式、网络拓扑图等

各类资产信息

物理设备方面

  • 网络及安全设备的清单机架位置、网络拓扑图所在位置、设备型号、作用、无备机情况
  • 服务器、存储、光线交换机等计算设备的清单机架位置、型号、作用

云及虚拟资产

  • IAAS 资产:资源型号、作用、相关业务系统

    • 虚拟机
    • 对象存储注意了解区域、账号
    • 负载均衡器
    • 弹性 IP
  • PAAS 资产:版本号、作用、相关的业务系统、账号、权限、实例等

    • 缓存数据库(Redis、Memorycache)
    • 文档分析型数据库(MongoDB、ElasticSearch)
    • 关系型数据库(Mysql、SQL Server、PostgerSQL、分布式数据库等)
    • 消息队列(RocketMQ、Kafka、RabbitMQ、MSMQ 等)
    • 计算框架、应用网关等(SpringCloud、腾讯阿里各类框架)
  • SAAS 资产:这类资源类型各式各样,表现形式很多,主要是作用、账号等

    • 各类网盘、代码托管库、WIKI 知识库等
    • FTP、SFTP
    • CDN、页面缓存、静态资源存储等各类加速服务
    • WAF 应用防火墙
    • 人脸识别、图片识别
  • Kubernetes 与容器化资产K8S比较特殊,不属于上述几类资产,需要关注的点也比较多

    • 私有化部署?还是厂商提供的容器引擎?
    • Master、Node 节点的情况
    • 网络组件种类,有无打通 K8S 内外网络环境
    • 持久化存储组件情况
    • Ingress、服务网格的使用情况,域名规划等
    • 弹性伸缩策略
    • 管理方式最好能拿到配置文件、有权限的账号、Token等
  • 无形资产:

    • 各类平台的账号密码
    • DNS 域名记录
    • SSL 证书、CA 证书
    • 各类系统文档
  • 最后是各类云的账号如果拿不到管理账号,就拿到账号的管理员联系方式。意在发生故障时能快速找到相关人员处理

组织架构及通信录

作为乙方运维经理,当然少不了给甲方爸爸汇报了。甲方的组织架构、联系方式是必不可少的工作。
其次,党政机关、国企这类的单位的运维,通常会有很多第三方 IT 服务商参与,服务商的管理也是重要的一环。

可以按照如下方式整理:

  • 组织架构图
    • 甲方爸爸的组织架构图
    • 厂商组织架构图
  • 通信录(以下是参考的表格)
组织岗位姓名职责联系电话邮箱
甲方爸爸办公室主任陈叉叉办公室负责人134xxxxxxxxxx@xxx.com
甲方爸爸信息化接口人李叉叉汇报对象134xxxxxxxxxx@xxx.com
乙方运维经理林叉叉运维协调134xxxxxxxxxx@xxx.com
腾讯监理王叉叉XXXXX134xxxxxxxxxx@xxx.com
阿里项目成员张叉叉XXXX134xxxxxxxxxx@xxx.com

日常运维工作

无论运维也好、运营也好,项目必然会接触大量的琐碎的日常工作,这部分工作甚至会占据了运维工作的超过 60%。了解这部分的工作讨论、有什么坑,并总结出经验与规律是十分有必要的。
这里简单列举一些事项:

  • 了解文档管理情况,党政机构、国企都是文档满天飞,而且都不一定会有 WIKI 之类的文档管理机制,一定要多多收集归类整理;
  • 了解各类办事流程,例如资源如何申请,各类权限申请,需要与第三方协助的时候的流程、公文公函如何发;
  • 了解各部门的职责,党政机关机关、国企通常部门职责划分得比较清楚,要多多的了解,遇事处理也快捷;
  • 了解各类第三方厂商的运营等合作方式;多年血与泪的经验教训啊,一定要搞好关系,不然踢皮球超级严重
  • 了解各类安全方面的防护情况,有无跳板机堡垒机之类的设备;
  • 了解当前运维方式,如人肉、脚本、自动化等等,看看当前处于哪个阶段;
  • 了解当前运维技术栈,毕竟运维技术、工具更新快,且多又杂,不一定都接触过;
  • 了解以往故障,对以前运维中发生的故障如果有记录那就最好去了解,看看当时的故障表现及处理方法,如果没有记录,也可以询问同事了解;

小结

好,以上就是项目前期的工作了,这一大坨的东西也是够各位运维经理去消化了。
项目建设阶段又有哪些事需要做呢?笔者将会留在下一篇文章给大家介绍,敬请期待。


 目录