초기 노드 장애 복구

Tableau를 설치한 첫 번째 컴퓨터인 "초기 노드"에는 몇 가지 고유한 특성이 있습니다. 라이선스 서비스(라이선스 관리자) 및 TSM 컨트롤러(관리 컨트롤러)의 두 프로세스는 초기 노드에서만 실행되며 장애 상황 이외에는 다른 노드로 이동할 수 없습니다.

처음에 초기 노드에 포함되지만 다른 노드에 추가하거나 이동할 수 있는 다른 두 프로세스는 CFS(클라이언트 파일 서비스)와 조정 서비스입니다.

초기 노드에 문제가 있고 다른 노드에 이중화 프로세스가 있는 경우 Tableau Server는 라이선스 서비스 부재로 인해 다른 프로세스가 영향을 받기 전까지 최대 72시간 동안 계속 실행될 수 있습니다. 사용자는 초기 노드에 장애가 발생한 후에도 계속 로그인하고 자신의 콘텐츠를 보고 사용할 수 있지만 관리 컨트롤러에 액세스할 수 없기 때문에 Tableau Server를 다시 구성할 수 없습니다. 즉, 가능한 한 빨리 두 고유 프로세스를 실행 중인 다른 노드로 이동해야 합니다. 예를 들어 수정할 수 있는 하드웨어 장애와 같이 비교적 짧은 시간 안에 복구 가능한 이유로 초기 노드에 장애가 발생한 경우 아래의 절차를 사용하지 말고 노드 백업을 먼저 시도해야 합니다.

참고: 이 문서의 단계를 수행하려면 서버 가동 중단이 필요하며 중단을 야기할 수 있으므로 초기 노드에 심각한 장애가 발생한 경우에만 사용되어야 합니다. 초기 노드를 다시 실행할 수 없는 경우 다음 단계를 사용하여 주요 TSM 프로세스를 클러스터의 다른 노드로 이동하십시오.

Tableau Server에는 TSM에 대한 전체 액세스 권한을 복구하고 Tableau Server를 실행 중인 상태로 유지할 수 있도록 이러한 프로세스를 기존의 다른 노드 중 하나로 자동으로 이동하는 스크립트가 포함되어 있습니다. 설치에서 CFS 및 조정 서비스를 어떻게 구성했는지에 따라 이러한 서비스를 다시 배포하는 단계를 수행해야 할 수도 있습니다.

일반 요구 사항

  • 초기 노드에서 CFS(클라이언트 파일 서비스)의 단일 인스턴스만 실행된 경우 이 프로세스를 다른 노드에 추가해야 합니다. Tableau Server에는 하나 이상의 CFS 인스턴스가 필요합니다. 자세한 내용은 클라이언트 파일 서비스 구성을 참조하십시오.
  • 다중 노드 Tableau Server 설치를 설정하는 과정의 일부로 조정 서비스 집합을 배포해야 합니다. 아래 프로세스에서는 초기 노드에 문제가 발생하기 전에 배포된 조정 서비스 집합이 있다고 가정합니다. 조정 서비스 집합을 배포하는 것에 대한 자세한 내용은 조정 서비스 집합 배포를 참조하십시오.

참고: 이 작업에는 TSM 명령줄을 사용해야 할 수 있는 단계가 포함되어 있습니다.

TSM 컨트롤러 및 라이선스 서비스를 다른 노드 이동

초기 노드에 문제가 있는 경우 TSM 컨트롤러 및 라이선스 서비스를 다른 노드에서 시작해야 합니다. 다음 단계를 수행하여 다른 노드에서 컨트롤러 및 라이선스 서비스를 작동시킵니다.

  1. 여전히 작동 중인 노드에서 컨트롤러 복구 스크립트를 실행합니다. 작동 중인 노드의 터미널 프롬프트에서 다음 명령을 입력합니다.

    sudo /opt/tableau/tableau_server/packages/scripts.<version_code>/move-tsm-controller -n <nodeID>

    여기서 "nodeID"는 TSM 컨트롤러가 실행될 노드의 ID입니다. 예를 들면 다음과 같습니다.

    sudo /opt/tableau/tableau_server/packages/scripts.10400.17.0802.1319/move-tsm-controller -n node2

  2. 노드에서 관리 컨트롤러가 실행되고 있는지 확인합니다.

    tsm status -v

  3. Tableau Server를 중지합니다.

    tsm stop

  4. 노드에 라이선스 서비스를 추가합니다.

    tsm topology set-process -pr licenseservice -n <nodeID> -c 1

  5. 원래 노드에서 이전 라이선스 서비스를 제거합니다. 여기서 "nodeID"는 장애가 발생한 초기 노드의 ID입니다.

    tsm topology set-process -pr licenseservice -n <nodeID> -c 0

  6. 초기 노드에서 CFS의 단일 인스턴스만 실행된 경우 CFS를 다음 노드에 추가합니다.

    tsm topology set-process -pr clientfileservice -n node2 -c 1

  7. (선택 사항) 초기 노드에서 실행되고 있었지만 이 노드에서 실행되고 있지 않은 다른 프로세스를 추가할 수도 있습니다. 예를 들어 캐시 서버를 추가하려면 다음을 수행합니다.

    tsm topology set-process -pr cacheserver -n node2 -c 1

  8. 변경 내용을 적용합니다.

    tsm pending-changes apply

    pending-changes apply 명령은 서버가 실행 중인 경우 명령이 Tableau Server를 다시 시작한다는 것을 알 수 있도록 메시지를 표시합니다. 서버가 중지된 경우에도 메시지가 표시되지만 이 경우 다시 시작은 없습니다. --ignore-prompt 옵션을 사용하여 이 메시지를 표시하지 않을 수 있지만 다시 시작 동작은 변경되지 않습니다. 자세한 내용은 tsm pending-changes apply를 참조하십시오.

  9. TSM 관리자 컨트롤러를 다시 시작합니다(tableau 시스템 계정 사용).

    sudo su -l tableau -c "systemctl --user restart tabadmincontroller_0.service"

    참고: tabadmincontroller를 다시 시작하는 데 몇 분 정도 걸릴 수 있습니다. 다음 단계에서 컨트롤러가 완전히 다시 시작되기 전에 보류 중인 변경 사항을 적용하려고 하면 TSM이 컨트롤러에 연결할 수 없게 됩니다. tsm status -v 명령을 사용하여 컨트롤러가 실행 중인지 확인할 수 있습니다. Tableau Server 관리 컨트롤러가 "is running(실행 중)"으로 표시되어야 합니다.

  10. 보류 중인 변경 사항을 적용합니다(변경 사항이 나타나지 않을 수 있지만 이 단계는 필수임).

    tsm pending-changes apply

  11. 새 컨트롤러 노드에서 Tableau Server 라이선스를 활성화합니다.

    tsm licenses activate -k <product-key>

  12. 라이선스가 올바르게 활성화되었는지 확인합니다.

    tsm licenses list

  13. 초기 노드가 조정 서비스를 실행 중이면 해당 노드를 포함하지 않는 새로운 조정 서비스 집합을 배포해야 합니다. 3노드 클러스터가 있고 초기 노드가 조정 서비스를 실행 중이면 새로운 단일 인스턴스 조정 서비스 집합을 다른 노드에 배포한 후 이전 집합을 정리해야 합니다. 이 예에서는 조정 서비스의 단일 인스턴스가 두 번째 노드에 배포됩니다.

    tsm topology deploy-coordination-service -n <nodeID2>

    서버가 새로운 집합으로 완전히 전환될 때까지 기다리십시오.

  14. 서버가 새 집합으로 전환하면 이전 집합을 정리하십시오.

    너무 빨리 정리해서는 안 됩니다. 정리 명령을 실행하기 전에 서버가 새 집합으로 완전히 전환될 때까지 기다려야 합니다. 그렇지 않으면 Tableau가 영구적으로 중단될 수 있습니다. 서버가 준비되었는지를 확인하기 위한 세부 지침을 포함하여 조정 서비스 집합을 배포하는 것에 대한 자세한 내용은 조정 서비스 집합 배포를 참조하십시오.

    tsm topology cleanup-coordination-service

  15. 초기 노드에서 파일 저장소 인스턴스가 실행되고 있는 경우 해당 인스턴스를 제거해야 합니다.

    tsm topology filestore decommission -n <nodeID> --delete-filestore

    여기서 nodeID 항목은 장애가 발생한 초기 노드의 ID입니다.

  16. 위에서 배포한 새 조정 서비스 집합이 단일 노드 집합인 경우 --ignore-warnings 플래그를 사용하여 보류 중인 변경 내용을 적용합니다.

    tsm pending-changes apply --ignore-warnings

  17. 초기 노드를 제거합니다. 여기서 nodeID 항목은 장애가 발생한 초기 노드의 ID입니다.

    tsm topology remove-nodes -n <nodeID>

  18. 위에서 배포한 새 조정 서비스 집합이 단일 노드 집합인 경우 --ignore-warnings 플래그를 사용하여 보류 중인 변경 내용을 적용합니다.

    tsm pending-changes apply --ignore-warnings

  19. Tableau Server를 시작합니다.

    tsm start

    이 시점에서 서버가 시작되어야 하며 TSM을 사용하여 서버를 구성할 수 있게 됩니다. 다음 단계는 초기 노드를 교체하여 클러스터가 원래 노드 수를 갖게 하는 것입니다. 이 작업을 수행하는 방법은 장애가 발생한 노드를 다시 사용할지 여부에 따라 다릅니다. 장애가 발생한 이유를 식별할 수 있고 장애가 반복되지 않도록 조치를 취할 수 있는 경우에만 해당 노드를 다시 사용하는 것이 좋습니다.

  20. 원래 노드를 다시 사용할 계획이라면 먼저 Tableau를 노드에서 완전히 제거해야 합니다. 이 작업은 tableau-server-obliterate 스크립트를 실행하여 수행합니다. 이 작업에 대한 자세한 내용은 컴퓨터에서 Tableau Server 제거를 참조하십시오.

  21. 새 컴퓨터 또는 Tableau를 완전히 제거한 후 원래 컴퓨터에서 원래 설치 프로그램과 현재 라이선스 서비스 및 관리 컨트롤러를 실행 중인 노드에서 생성된 부트스트랩 파일을 사용하여 Tableau를 설치합니다. 이 작업을 수행하는 방법에 대한 자세한 내용은 추가 노드 설치 및 구성을 참조하십시오.

    최상의 방법은 원래 노드에서 장애가 발생했을 때 손실된 모든 프로세스를 구성하여 클러스터가 완전히 이중화되게 하는 것입니다. 새 초기 노드에서 새로 추가된 노드로 프로세스를 이동하여 원래 구성을 복제할 수 있습니다. 예를 들어 초기 노드가 게이트웨이 및 파일 저장소만 실행 중이었다면 동일한 방식으로 새 초기 노드를 구성할 수 있습니다.

  22. 노드를 설치하고 필요한 방식으로 실행한 후 새로운 조정 서비스 집합을 다시 배포해야 합니다. 자세한 내용은 조정 서비스 집합 배포를 참조하십시오.

 

의견을 주셔서 감사합니다! 피드백을 제출하는 동안 오류가 발생했습니다. 다시 시도하거나 메시지를 보내주십시오.