如何让运维工作不间断?
放假期间,一般就是人不在单位。要让运维工作不间断,那就可以通过无人值守机房方案来解决。怎么样才叫做无人值守机房呢?主要包括以下几个方面:
1、机房动环监控一个机房的设备要正常稳定运行,必须要有符合设备稳定运行的环境。比如:温度、湿度、粉尘、供电、消防、漏水。所以,无人值守机房至少有一套机房动环监控系统。这套系统可以帮助我们不用进机房也能知道机房的运行环境。该系统主要包括:
温湿度传感器:能够实时感知机房不同区域的温度,形成机房热力图;
烟雾传感器:能够实时感知烟雾,结合温度判断是否发生火灾,及时报警并通过平台软件联动启动气体消防灭火;
漏水检测绳:能够感知机房是否漏水,并及时报警;
带网管的UPS:实时感知用电电压、电流、负载;
带网管的空调:实时感知空调的风力,工作状态,温湿度等;
机房视频监控:实时监控机房内部的真实画面;
动环监控软件:这是动环监控的核心软件,它负责分析数据,展示数据,及时报警和联动各子系统。它支持远程访问。
2、系统监控系统监控是对机房的设备进行监控,它可以监控到机房里面所有的服务器、存储、网络等设备。可以实现远程查看机房IT设备的运行状态。该系统主要包括:
数据采集:通过安装客户端、或者通过snmp、wmi、syslog等网络协议来采集信息;
数据分析:通过系统监控软件,可以对手机的数据进行分类分析;
数据展现:通过归类后展示:机器的性能、告警等等,会重点突出有问题的机器;
3、远程KVM或者远程带外管理系统远程KVM:是集中控制的键盘、鼠标、显示器。你虽然不在机房,但可以和在机房一样可以操作机器的键盘、鼠标。就算服务器蓝屏了,你也可以看到蓝屏画面。
带外管理系统:IT设备一般都具备带外管理的功能,就是厂家为了管理方便单独设置的一套可以监控硬件基本状态的微型管理系统。该系统和运行系统互相隔离,单独存在于硬件中。用它管理硬件底层,就算运行系统死机,它一样也能看到硬件状态(包括风扇、电源、cpu、内存等)
4、VPN加密访问我们放假的时候一般都不在单位,需要从外面的网络来访问单位网络。为了安全起见,我们一般采用VPN设备来实现加密访问。确保我们远程网络管理的安全。
5、三维可视化资金比较雄厚的单位,可以增加三维可视化机房。这个会将机房的所有设备、管线都通过计算机三维建模给精确还原出来。同时接入各个监控系统的数据,并在三维空间中展示出来。
总结总之,要实现远程运维,以上系统是可以帮助到我们去很好的运维机房的。做到了以上系统,基本上软件故障远程都可以搞定,只有硬件物理损坏,需要派人去更换一下硬件。你也不必到现场,通过视频监控,全程监控即可。
我是数智风,用经验作答,欢迎关注评论。