초기 노드 장애 복구

Tableau를 설치한 첫 번째 컴퓨터인 "초기 노드"에는 몇 가지 고유한 특성이 있습니다. 라이선스 서비스(라이선스 관리자), 활성화 서비스 및 TSM 컨트롤러(관리 컨트롤러)의 세 프로세스는 초기 노드에서만 실행되며 장애 상황 이외에는 다른 노드로 이동할 수 없습니다. Tableau Server에는 TSM에 대한 전체 액세스 권한을 복구하고 Tableau Server를 실행 중인 상태로 유지할 수 있도록 이러한 프로세스를 기존의 다른 노드 중 하나로 자동으로 이동하는 스크립트가 포함되어 있습니다.

처음에 초기 노드에 포함되지만 다른 노드에 추가하거나 이동할 수 있는 다른 두 프로세스는 CFS(클라이언트 파일 서비스)와 조정 서비스입니다. 설치 시 CFS 및 조정 서비스의 구성 방법에 따라 이러한 서비스를 다시 배포하는 단계를 수행해야 할 수 있습니다.

초기 노드 장애가 발생한 경우

초기 노드에 문제가 있고 다른 노드에 중복 프로세스가 있는 경우 Tableau Server가 계속 실행된다는 보장이 없습니다.

  • Tableau Server는 초기 노드 장애 발생 후 최장 72시간 동안 계속 실행될 수 있으며, 그 이후에는 라이선스 서비스가 부족하여 다른 프로세스에 영향을 미칠 수 있습니다. 이러한 경우 사용자는 초기 노드에 장애가 발생한 후에도 계속 로그인하고 자신의 콘텐츠를 보고 사용할 수 있지만 관리 컨트롤러에 액세스할 수 없기 때문에 Tableau Server를 다시 구성할 수 없습니다.
  • ATR이 구성된 Tableau Server 2021.4.2 이하 버전을 실행하는 경우 초기 노드에 문제가 있으면 모든 서버 기능을 사용할 수 없게 됩니다. 이 문제는 노드에 문제가 있든, 시스템 수준 패치를 수행하는 경우처럼 의도적으로 노드를 중지하든 관계없이 발생합니다.

중복 프로세스로 구성된 경우에도 초기 노드에 장애가 발생한 후 Tableau Server가 계속 작동하지 않을 수 있습니다. 이는 고가용성으로 설치가 구성된 경우에도 마찬가지입니다. 즉, 가능한 한 빨리 두 고유 프로세스를 실행 중인 다른 노드로 이동해야 합니다. 예를 들어 수정할 수 있는 하드웨어 장애와 같이 비교적 짧은 시간 안에 복구 가능한 이유로 초기 노드에 장애가 발생한 경우 아래의 절차를 사용하지 말고 노드 백업을 먼저 시도해야 합니다.

참고: 이 문서의 단계를 수행하려면 서버 가동 중단이 필요하며 중단을 야기할 수 있으므로 초기 노드에 심각한 장애가 발생한 경우에만 사용되어야 합니다. 초기 노드를 다시 실행할 수 없는 경우 다음 단계를 사용하여 주요 TSM 프로세스를 클러스터의 다른 노드로 이동하십시오.

일반 요구 사항

Tableau Server 2021.1 버전은 더욱 향상된 복구 기능을 지원하도록 업데이트되었습니다. 이 항목의 절차는 Tableau Server 2021.1용으로 다시 작성되었습니다.

이전 버전의 Tableau Server에서 장애가 발생한 노드를 복구하려는 경우 해당 버전의 절차를 따라야 합니다. Tableau 도움말의 아카이브된 버전을 보려면 Tableau 도움말(링크가 새 창에서 열림)을 참조하십시오.

  • 다중 노드 Tableau Server 설치를 설정하는 과정의 일부로 조정 서비스 집합을 배포해야 합니다. 아래 프로세스에서는 초기 노드에 문제가 발생하기 전에 배포된 조정 서비스 집합이 있다고 가정합니다. 조정 서비스 집합을 배포하는 것에 대한 자세한 내용은 조정 서비스 집합 배포를 참조하십시오.
  • 이 프로세스에서는 조정 서비스를 실행하는 모든 노드에서 CFS(클라이언트 파일 서비스) 인스턴스를 구성했다고 가정합니다. CFS의 추가 인스턴스를 추가하지 않은 경우 유일한 인스턴스는 초기 노드에 있으므로 하나 이상의 CFS 인스턴스를 다른 노드에 추가해야 합니다. 또한 CFS를 다시 채워야 합니다. Tableau Server에는 하나 이상의 CFS 인스턴스가 필요합니다. 자세한 내용은 클라이언트 파일 서비스 구성Tableau Server 클라이언트 파일 서비스를 참조하십시오.

참고: 이 작업에는 TSM 명령줄을 사용해야 할 수 있는 단계가 포함되어 있습니다.

TSM 컨트롤러, 라이선스 서비스 및 활성화 서비스를 다른 노드로 이동

초기 노드에 문제가 있는 경우 TSM 컨트롤러, 라이선스 서비스 및 활성화 서비스를 다른 노드에서 시작해야 합니다. 다음 단계에 따라 제공된 move-tsm-controller 스크립트를 사용하여 다른 노드에서 TSM 컨트롤러, 라이선스 서비스 및 활성화 서비스를 작동시킵니다.

  1. 여전히 작동 중인 노드에서 컨트롤러 복구 스크립트를 실행합니다. 작동 중인 노드의 터미널 프롬프트에서 다음 명령을 입력합니다.

    sudo /opt/tableau/tableau_server/packages/scripts.<version_code>/move-tsm-controller -n <nodeID>

    여기서 "nodeID"는 TSM 컨트롤러가 실행될 노드의 ID입니다. 예를 들면 다음과 같습니다.

    sudo /opt/tableau/tableau_server/packages/scripts.10400.17.0802.1319/move-tsm-controller -n node2

  2. 노드에서 관리 컨트롤러가 실행되고 있는지 확인합니다.

    tsm status -v

  3. Tableau Server를 중지합니다.

    이 절차의 나머지 부분에는 몇 가지 명령과 함께 --ignore-node-status 옵션이 포함됩니다. --ignore-node-status 옵션을 사용하여 명령을 실행하면 지정된 노드의 상태를 고려하지 않고 명령이 실행됩니다. --ignore-node-status를 사용하려면 장애가 발생한 노드를 지정합니다.

    tsm stop --ignore-node-status <nodeID>

    예를 들어 node1에 장애가 발생한 경우 다음과 같이 명령을 실행합니다.

    tsm stop --ignore-node-status node1

  4. 노드에 라이선스 서비스를 추가합니다.

    tsm topology set-process -pr licenseservice -n <nodeID> -c 1

  5. 원래 노드에서 이전 라이선스 서비스를 제거합니다. 여기서 "nodeID"는 장애가 발생한 초기 노드의 ID입니다.

    tsm topology set-process -pr licenseservice -n <nodeID> -c 0

  6. 다음 버전 중 하나를 실행 중인 경우

    • 2023.3.0 이상

    • 2023.1.3 이상

    • 2022.3.7 이상

    • 2022.1.15 이상

    또는 이전 버전을 실행 중이고 ATR을 사용하는 경우 새 노드에 활성화 서비스를 추가합니다.

    tsm topology set-process -pr activationservice -n <nodeID> -c 1

  7. 다음 버전 이상 중 하나를 실행 중인 경우

    • 2023.3.0 이상

    • 2023.1.3 이상

    • 2022.3.7 이상

    • 2022.1.15 이상

    또는 이전 버전을 실행 중이고 ATR을 사용하는 경우 원래 노드에서 이전 활성화 서비스를 제거합니다. 여기서 'nodeID'는 장애가 발생한 초기 노드입니다.

    tsm topology set-process -pr activationservice -n <nodeID> -c 0

    중요: 클러스터에 있는 노드가 CFS의 유일한 인스턴스를 실행하는 경우 해당 노드에 장애가 발생하면 CFS로 관리되는 모든 파일이 손실되며 인증서 및 사용자 지정 이미지를 다시 가져오고 관련 구성을 변경하여 CFS를 다시 채워야 합니다.CFS로 관리되는 파일 목록은 Tableau Server 클라이언트 파일 서비스를 참조하십시오.

  8. 초기 노드에서 단일 인스턴스의 메시징 서비스가 실행된 경우 메시징 서비스를 이 노드에 추가합니다.

    tsm topology set-process -pr activemqserver -n node2 -c 1

  9. (선택 사항) 초기 노드에서 실행되고 있었지만 이 노드에서 실행되고 있지 않은 다른 프로세스를 추가할 수도 있습니다. 예를 들어 캐시 서버를 추가하려면 다음을 수행합니다.

    tsm topology set-process -pr cacheserver -n node2 -c 1

  10. 변경 내용을 적용합니다.

    tsm pending-changes apply --ignore-node-status <nodeID>

    보류 중인 변경 내용을 적용하려면 서버를 다시 시작해야 하는 경우 pending-changes apply 명령은 서버가 다시 시작됨을 알리는 메시지를 표시합니다. 서버가 중지된 경우에도 이 메시지가 표시되지만 이 경우 다시 시작은 없습니다. --ignore-prompt 옵션을 사용하여 이 메시지를 표시하지 않을 수 있지만 다시 시작 동작은 변경되지 않습니다. 변경 내용을 적용해도 다시 시작할 필요가 없는 경우 메시지 없이 변경 내용이 적용됩니다. 자세한 내용은 tsm pending-changes apply를 참조하십시오.

  11. TSM 관리자 컨트롤러를 다시 시작합니다(tableau 시스템 계정 사용).

    sudo su -l tableau -c "systemctl --user restart tabadmincontroller_0.service"

    참고: tabadmincontroller를 다시 시작하는 데 몇 분 정도 걸릴 수 있습니다. 다음 단계에서 컨트롤러가 완전히 다시 시작되기 전에 보류 중인 변경 사항을 적용하려고 하면 TSM이 컨트롤러에 연결할 수 없게 됩니다. tsm status -v 명령을 사용하여 컨트롤러가 실행 중인지 확인할 수 있습니다. Tableau Server 관리 컨트롤러가 "is running(실행 중)"으로 표시되어야 합니다.

  12. 보류 중인 변경 사항을 적용합니다(변경 사항이 나타나지 않을 수 있지만 이 단계는 필수임).

    tsm pending-changes apply --ignore-node-status <nodeID>

  13. 새 컨트롤러 노드에서 Tableau Server 라이선스를 활성화합니다.

    tsm licenses activate -k <product-key>

  14. 라이선스가 올바르게 활성화되었는지 확인합니다.

    tsm licenses list

  15. 초기 노드가 조정 서비스를 실행 중이면 해당 노드를 포함하지 않는 새로운 조정 서비스 집합을 배포해야 합니다. 3노드 클러스터가 있고 초기 노드가 조정 서비스를 실행 중이면 새로운 단일 인스턴스 조정 서비스 집합을 다른 노드에 배포한 후 이전 집합을 정리해야 합니다. 이 예에서는 조정 서비스의 단일 인스턴스가 두 번째 노드에 배포됩니다.

    tsm topology deploy-coordination-service -n node2 --ignore-node-status node1

  16. 초기 노드에서 파일 저장소 인스턴스가 실행되고 있는 경우 해당 인스턴스를 제거해야 합니다.

    tsm topology filestore decommission -n <nodeID> --delete-filestore

    여기서 nodeID 항목은 장애가 발생한 초기 노드입니다.

  17. 위에서 배포한 새 조정 서비스 집합이 단일 노드 집합인 경우 --ignore-warnings 플래그를 사용하여 보류 중인 변경 내용을 적용합니다.

    tsm pending-changes apply --ignore-node-status node1 --ignore-warnings

  18. 초기 노드를 제거합니다. 여기서 nodeID 항목은 장애가 발생한 초기 노드입니다.

    tsm topology remove-nodes -n <nodeID>

  19. 위에서 배포한 새 조정 서비스 집합이 단일 노드 집합인 경우 --ignore-warnings 플래그를 사용하여 보류 중인 변경 내용을 적용합니다.

    tsm pending-changes apply --ignore-warnings

  20. Tableau Server를 시작합니다.

    tsm start

    이 시점에서 서버가 시작되어야 하며 TSM을 사용하여 서버를 구성할 수 있게 됩니다. 다음 단계는 초기 노드를 교체하여 클러스터가 원래 노드 수를 갖게 하는 것입니다. 이 작업을 수행하는 방법은 장애가 발생한 노드를 다시 사용할지 여부에 따라 다릅니다. 장애가 발생한 이유를 식별할 수 있고 장애가 반복되지 않도록 조치를 취할 수 있는 경우에만 해당 노드를 다시 사용하는 것이 좋습니다.

  21. 원래 노드를 다시 사용할 계획이라면 먼저 Tableau를 노드에서 완전히 제거해야 합니다. 이 작업은 tableau-server-obliterate 스크립트를 실행하여 수행합니다. 이 작업에 대한 자세한 내용은 컴퓨터에서 Tableau Server 제거를 참조하십시오.

  22. 새 컴퓨터 또는 Tableau를 완전히 제거한 후 원래 컴퓨터에서 원래 설치 프로그램과 현재 관리 컨트롤러 및 라이선스 서비스를 실행 중인 노드에서 생성된 부트스트랩 파일을 사용하여 Tableau를 설치합니다. 이 경우 클러스터의 일부로 구성할 수 있는 추가 노드가 만들어집니다. 노드를 추가하는 방법에 대한 자세한 내용은 추가 노드 설치 및 구성을 참조하십시오.

    최상의 방법은 원래 노드에서 장애가 발생했을 때 손실된 모든 프로세스를 구성하여 클러스터가 완전히 이중화되게 하는 것입니다. 새 초기 노드에서 새로 추가된 노드로 프로세스를 이동하여 원래 구성을 복제할 수 있습니다. 예를 들어 초기 노드가 게이트웨이 및 파일 저장소만 실행 중이었다면 동일한 방식으로 새 초기 노드를 구성할 수 있습니다.

  23. 노드를 설치하고 필요한 방식으로 실행한 후 새로운 조정 서비스 집합을 다시 배포해야 합니다. 자세한 내용은 조정 서비스 집합 배포를 참조하십시오.

  24. 마지막으로 아직 이 작업을 수행하지 않은 경우 조정 서비스를 실행하는 모든 노드에 CFS 인스턴스를 추가합니다. 자세한 내용은 클라이언트 파일 서비스 구성을 참조하십시오.클라이언트 파일 서비스 구성

    클러스터에 있는 노드가 CFS의 유일한 인스턴스를 실행하는 경우 해당 노드에 장애가 발생하면 CFS로 관리되는 모든 파일이 손실되며 인증서 및 사용자 지정 이미지를 다시 가져오고 관련 구성을 변경하여 CFS를 다시 채워야 합니다.CFS로 관리되는 파일 목록은 Tableau Server 클라이언트 파일 서비스를 참조하십시오.

 

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!