IaaS集群整体关机
1、关闭集群前检查
1.1、在Console上关闭所有虚拟机及虚拟桌面。
1.2、BOSS上确认所有虚拟资源已关闭;
1.3、BOSS操作日志中确认没有在”执行中“或”等待“的任务。
2、关闭集群
2.1、使用SSH工具(Xshell或其他)登录”青云安装部署及维护平台QingCloud-firstbox”所在节点;
2.2、修改计算节点状态为"待命中(standby)"
root@qingcloud-firstbox: /pitrix/bin/modify_hyper_status.sh hyper standby
2.3、关闭所有“计算节点”上的服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'supervisorctl stop all'
2.4、为了避免集群初次启动时,部分服务器还未完全的情况下触发虚拟机灾难迁移,须关闭灾难迁移服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'touch /pitrix/conf/disable_hyperpair_rescue'
2.5、检查缓存是否全部写入数据盘,确认所有计算节点都为 0 时可以继续关闭, 若不为0则稍等后再查看.
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'casadm -P -i 1|grep Dirty'
2.6、关闭 supervisor 服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh vm 'supervisorctl stop all'
2.7、关闭 zoocassa 相关服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa 'service cassandra stop' root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa '/opt/zookeeper/bin/zkServer.sh stop' root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa 'service memcached stop' root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-zoocassa 'service redis_6379 stop'
2.8、关闭 pgpool 服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh pgpool 'service pgpool2 stop'
2.9、关闭postgresql 服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ywyc1a-pgserver 'service postgresql stop'
2.10、关闭所有虚拟管理节点
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh vm '_shutdown'
2.11、关闭所有计算节点
单独针对sds1.0 ,其他版本跳过直接执行关机命令,drbd的命令:
swapoff -a umount /pitrix/data/container drbdadm down tr02n26 drbdadm down tr02n27 drbdadm down all
关机命令:
swapoff -a umount /pitrix/data/container drbdadm down all root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper '_shutdown'
2.12、关闭所有物理管理节点
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh ks '_shutdown'
3、开启集群
3.1、启动青云系统是很容易的事情,因为青云系统内部的所有服务都是随机启动的。所以一般情况下,只需要管理员启动物理服务,剩下的就是到各个节点查看提系统状态(从服务器开机自检到所有服务完全启动大约需要10-20分钟,取决于硬件性能)。
3.2、等待集群启动完成后使用SSH工具登录”青云安装部署及维护平台QingCloud-firstbox”所在节点
3.3、检查所有服务状态是否正常
root@qingcloud-firstbox: /pitrix/check/check.py -n all -v
3.4、查看服务是否运行中(running), 如果服务不是 running, 需要手动起一下,以下以查看和启动rabbitmq服务为示例:
#查看服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh zoocassa 'service rabbitmq status'
#启动服务
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh zoocassa 'service rabbitmq start'
注释:“zoocassa”代表服务所在节点的名称(hostname),“rabbitmq”代表服务名称,请根据服务实际状态修改上述两个参数;
3.5、登录Console是否报错,创建虚拟机是否正常;
3.6、集群完全启动完成后,打开灾难迁移服务;
root@qingcloud-firstbox: /pitrix/upgrade/exec_nodes.sh hyper 'rm /pitrix/conf/disable_hyperpair_rescue'