본문 바로가기
IT/lifekeeper

Lifekeeper failover 명령 perform_action

by 방구석꼰머 2022. 9. 27.
반응형

이번 포스팅에서는 Lifekeeper 로 이중화 구성된 시스템에서 Active – Standby 서버 간 failover가 필요할 경우 manual failover를 수행하게 하는 “perform_action” 명령어의 사용 방법에 대해 알아보도록 하겠습니다.

 

이 포스팅은 아래의 버전에서 테스트한 내용을 기반으로 작성하였습니다

Linux : Red Hat Enterprise Linux release 8.5

Lifekeeper : LifeKeeper for Linux 9.6.1


 

 

1. perform_action 명령으로 클러스터 failover 수행하기

Active, Standby 서버 확인

Failover를 진행하기 전에 어느 서버가 Active이고, 어느 서버가 Standby 인지 먼저 확인합니다.

클러스터 정보 확인 방법은 아래의 링크에서 확인할 수 있습니다.

2022.09.23 - [IT/lifekeeper] - Lifekeeper 클러스터 상태 확인하기 lcdstatus

 

Lifekeeper 클러스터 상태 확인하기 lcdstatus

이번 포스팅에서는 Lifekeeper 클러스터의 구성정보와 상태를 확인할 수 있는 “lcdstatus” 명령어의 사용 방법에 대해 알아보도록 하겠습니다. 이 포스팅은 아래의 버전에서 테스트한 내용을 기반

justdaily.tistory.com

 

lcdstatus -q 명령으로 클러스터의 정보를 확인합니다. 

1번 서버

[root@server1 ~]# lcdstatus -q
LOCAL    TAG                    ID                                    STATE     PRIO  PRIMARY
server1  pgsql-5432             server1.pgsql-5432                    ISP          1  server1
server1   /data                 /data                                 ISP          1  server1
server1    datarep-data         2606dc24-99cb-4243-824a-7f27dfbdacf0  ISP          1  server1
server1     ip-192.168.240.192  IP-192.168.240.192                    ISP          1  server1

MACHINE  NETWORK ADDRESSES/DEVICE                 STATE     PRIO
server2  TCP     192.168.240.190/192.168.240.191  ALIVE        1
server2  TCP     200.200.200.10/200.200.200.20    ALIVE        2

리소스의 STATE 가 ISP 이므로 1번 서버가 Active입니다.

 

2번 서버

[root@server2 ~]# lcdstatus -q
LOCAL    TAG                    ID                                    STATE     PRIO  PRIMARY
server2  pgsql-5432             server1.pgsql-5432                    OSU         10  server1
server2   /data                 /data                                 OSU         10  server1
server2    datarep-data         64421a84-19ee-f94a-8387-6fc303bdf6c3  OSU         10  server1
server2     ip-192.168.240.192  IP-192.168.240.192                    OSU         10  server1

MACHINE  NETWORK ADDRESSES/DEVICE                 STATE     PRIO
server1  TCP     192.168.240.191/192.168.240.190  ALIVE        1
server1  TCP     200.200.200.20/200.200.200.10    ALIVE        2

리소스의 STATE가 OSU 이므로 2번 서버가 Standby입니다.

 

복제 볼륨 동기화 상태 확인

동기화 볼륨의 동기화 상태가 100% sync 상태인지 확인합니다.

100% 동기화 상태가 아니면 failover를 진행할 수 없습니다.

동기화 상태 확인 방법은 아래의 링크에서 확인할 수 있습니다.

2022.09.25 - [IT/lifekeeper] - Lifekeeper 복제볼륨 동기화 상태 확인하기 mirror_status

 

Lifekeeper 복제볼륨 동기화 상태 확인하기 mirror_status

이번 포스팅에서는 Lifekeeper로 구성된 복제볼륨 리소스의 동기화 상태를 확인할 수 있는 “mirror_status” 명령어의 사용 방법에 대해 알아보도록 하겠습니다. 이 포스팅은 아래의 버전에서 테스트

justdaily.tistory.com

 

# mirror_status datarep-data

[root@server1 ~]# mirror_status datarep-data
Mirror Configuration:
[ ]     server1 -> server2 (200.200.200.20)
        Status: Fully Operational
        [===================>] 100%
        Type: Synchronous

Bitmap: 40956 bits (chunks), 0 dirty (0.0%)

 

반응형

 

Failover 진행하기

Active, Standby 서버 확인 및 동기화 상태 확인이 완료되면 "perform_action" 명령으로 failover를 진행합니다.

단 Standby 서버에서 명령을 수행합니다.

명령어 형식은 아래와 같습니다.

 

perform_action -t <tag> -a <action>

  • “-t” : failover를 진행할 리소스 그룹의 최상위 tag를 지정합니다.
  • “-a” : 액션을 지정하는 옵션으로 “restore” 와 “remove” 가 있으며, failover를 진행할 것이므로 restore 를 지정합니다.

 

아래의 명령을 Standby(2번) 서버에서 수행합니다.

# perform_action -t pgsql-5432 -a restore

(tag명이 pgsql-5432 인 리소스를 명령을 수행한 2번 서버에서 restore(기동) 한다는 의미)

 

명령이 수행되면 Active(1번) 서버의 최상위 리소스인 pgsql 리소스부터 중지를 시작하여 최하위 리소스까지 중지를 진행하게 되며, 1번 서버의 모든 리소스가 중지되면 2번 서버의 최하위 리소스부터 기동을 시작하여 최상위 pgsql 리소스까지 기동을 진행합니다.

2번서버에서 perform_action 수행
2번서버에서 perform_action 수행

 

Failover가 완료되면 각 서버에서 lcdstatus -q 명령을 수행하여 클러스터의 정보를 확인합니다.

1번 서버 Standby로 변경됨

[root@server1 ~]# lcdstatus -q
LOCAL    TAG                    ID                                    STATE     PRIO  PRIMARY
server1  pgsql-5432             server1.pgsql-5432                    OSU          1  server1
server1   /data                 /data                                 OSU          1  server1
server1    datarep-data         2606dc24-99cb-4243-824a-7f27dfbdacf0  OSU          1  server1
server1     ip-192.168.240.192  IP-192.168.240.192                    OSU          1  server1

MACHINE  NETWORK ADDRESSES/DEVICE                 STATE     PRIO
server2  TCP     192.168.240.190/192.168.240.191  ALIVE        1
server2  TCP     200.200.200.10/200.200.200.20    ALIVE        2

 

2번 서버 Active로 변경됨

[root@server2 ~]# lcdstatus -q
LOCAL    TAG                    ID                                    STATE     PRIO  PRIMARY
server2  pgsql-5432             server1.pgsql-5432                    ISP         10  server1
server2   /data                 /data                                 ISP         10  server1
server2    datarep-data         64421a84-19ee-f94a-8387-6fc303bdf6c3  ISP         10  server1
server2     ip-192.168.240.192  IP-192.168.240.192                    ISP         10  server1

MACHINE  NETWORK ADDRESSES/DEVICE                 STATE     PRIO
server1  TCP     192.168.240.191/192.168.240.190  ALIVE        1
server1  TCP     200.200.200.20/200.200.200.10    ALIVE        2

 

지금까지 Lifekeeper 클러스터를 명령을 통해 failover 하는 방법에 대해 알아봤습니다.

 

감사합니다.

반응형

댓글