青云IAAS开关机流程

IaaS集群整体关机

1、关闭集群前检查

1.1、在Console上关闭所有虚拟机及虚拟桌面。

1.2、BOSS上确认所有虚拟资源已关闭; 

1.3、BOSS操作日志中确认没有在”执行中“或”等待“的任务。


2、关闭集群
2.1、使用SSH工具(Xshell或其他)登录青云安装部署及维护平台QingCloud-firstbox”所在节点;

2.2、修改计算节点状态为"待命中(standby)" 

root@qingcloud-firstbox: /pitrix/bin/modify_hyper_status.sh hyper standby

2.3、关闭所有计算节点上的服务

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'supervisorctl stop all'

 

2.4、为了避免集群初次启动时,部分服务器还未完全的情况下触发虚拟机灾难迁移,须关闭灾难迁移服务

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'touch /pitrix/conf/disable_hyperpair_rescue'

2.5、检查缓存是否全部写入数据盘,确认所有计算节点都为 0 时可以继续关闭, 若不为0则稍等后再查看.

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'casadm -P -i 1|grep Dirty'

2.6、关闭 supervisor 服务

 root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh vm 'supervisorctl stop all'

2.7、关闭 zoocassa 相关服务

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa 'service cassandra stop'
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa '/opt/zookeeper/bin/zkServer.sh stop'
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa 'service memcached stop'
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa  'service redis_6379 stop'

2.8、关闭 pgpool 服务

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh pgpool 'service pgpool2 stop'

2.9、关闭postgresql 服务

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-pgserver 'service postgresql stop'

2.10、关闭所有虚拟管理节点

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh vm '_shutdown'

2.11、关闭所有计算节点

单独针对sds1.0 ,其他版本跳过直接执行关机命令,drbd的命令:

swapoff -a
umount /pitrix/data/container
drbdadm down tr02n26
drbdadm down tr02n27
 
drbdadm down all

关机命令:

swapoff -a
umount /pitrix/data/container
drbdadm down all
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper '_shutdown'


2.12、关闭所有物理管理节点

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ks '_shutdown'

 


3、开启集群

3.1、启动青云系统是很容易的事情,因为青云系统内部的所有服务都是随机启动的。所以一般情况下,只需要管理员启动物理服务,剩下的就是到各个节点查看提系统状态(从服务器开机自检到所有服务完全启动大约需要10-20分钟,取决于硬件性能)
3.2、等待集群启动完成后使用SSH工具登录青云安装部署及维护平台QingCloud-firstbox”所在节点
3.3、检查所有服务状态是否正常

root@qingcloud-firstbox: /pitrix/check/check.py -n all -v

3.4、查看服务是否运行中(running), 如果服务不是 running, 需要手动起一下,以下以查看和启动rabbitmq服务为示例:

#查看服务

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh zoocassa 'service rabbitmq status'

 #启动服务

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh zoocassa 'service rabbitmq start'

注释:“zoocassa”代表服务所在节点的名称(hostname)“rabbitmq”代表服务名称,请根据服务实际状态修改上述两个参数;

3.5、登录Console是否报错,创建虚拟机是否正常;

3.6、集群完全启动完成后,打开灾难迁移服务;

root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'rm /pitrix/conf/disable_hyperpair_rescue'


下一篇: