추출을 위한 최적화

추출 일정이 높은 리소스 사용량을 유발하거나 추출 완료에 오랜 시간이 걸리는 경우 추출을 최적화하십시오.

참고: 이 항목에서는 모니터링 섹션의 샘플 성능 통합 문서를 사용합니다. 자세한 내용은 샘플 성능 통합 문서를 사용한 데이터 분석을 참조하십시오.

추출 최적화가 필요한 시점

추출 일정이 높은 CPU 사용량을 유발하는 경우

샘플 성능 통합 문서의 Background Jobs(백그라운드 작업) 대시보드를 사용하여 추출 새로 고침 작업을 비롯한 Tableau Server에서 실행되는 백그라운드 작업의 수를 확인합니다. 이 대시보드에는 백그라운드 작업이 지연된 기간도 표시됩니다. 이 기간은 백그라운드 작업이 예약된 시간과 실제 실행된 시간 간의 차이입니다. 하루 중 특정 시간에 지연 시간이 길어지거나 같은 시간에 많은 작업이 실행되는 경우 작업 일정을 서로 다른 시간으로 분산시켜 서버 부하를 줄이십시오.

또한 백그라운드 작업이 많거나 지연 시간이 길어지는 시간과 서버 CPU 사용량을 비교합니다. CPU Usage(CPU 사용량) 대시보드를 사용하여 총 CPU 사용량 백분율과 각 프로세스의 CPU 사용량 백분율을 표시합니다. 백그라운더 프로세스는 백그라운드 작업으로 실행되기 때문에 추출 새로 고침 작업이 많거나 느린 추출 새로 고침 작업이 있는 경우 우선적으로 영향을 받는 프로세스입니다. 백그라운더 프로세스의 CPU 사용량은 일정하게 변동하지만 순간적으로 100%에 도달할 수 있습니다. 이것은 반복 일정 중에 사용량이 많은 새로 고침 작업이 있다는 의미입니다.

참고: 개별 프로세스의 프로세서 사용량은 지정된 프로세서 코어에서 측정되기 때문에 개별 프로세스의 CPU 사용량 백분율을 모두 더하면 100%가 넘을 수 있습니다. 반대로, 총 CPU 사용량은 모든 프로세서 코어에 대해 측정됩니다.

추출이 실패하거나 느리게 실행되는 경우

추출용 백그라운드 작업 관리 뷰를 사용하여 실패한 추출의 수와 추출 완료에 걸린 시간을 확인합니다. 빈번한 실패는 특정 데이터 원본에 문제가 있다는 의미일 수 있습니다.

추출을 최적화하는 방법

이전에 표시한 예제와 같이, CPU 사용량이 높아지는 시기와 추출 새로 고침 일정이 일치하는 경우 추출을 최적화해야 합니다.

추출 새로 고침 일정 조정

샘플 성능 통합 문서의 Background Jobs(백그라운드 작업) 대시보드를 사용하여 추출을 실행할 수 있는 최적의 시간을 식별합니다. 피크 이외 시간에 추출을 실행하는 동시에, 추출 새로 고침을 분산시켜 동시에 발생하는 서버 부하를 최소화할 수 있습니다. 추출 새로 고침에서 지속적으로 문제가 발생하는 경우 다음과 같은 방식으로 추출 새로 고침의 빈도를 최대한 줄이십시오.

  • 서버 사용량이 많지 않은 시간에 추출을 예약합니다.

  • 새로 고침 빈도를 줄입니다.

특정 추출의 속도 개선

추출용 백그라운드 작업 관리 뷰를 사용하여 실패하는 추출과 실행에 오랜 시간이 걸리는 추출을 식별합니다.

  • 추출 크기를 줄입니다. 필터링 또는 집계를 이용하거나 사용하지 않는 필터를 숨겨 범위를 좁히는 방식으로 추출 항목의 데이터 집합을 짧게 유지하여 서버 성능을 향상시킬 수 있습니다. 이러한 변경을 수행하려면 Tableau Desktop 옵션 사용되지 않은 필드 모두 숨기기표시된 차원에 대한 데이터 집계를 사용합니다. 자세한 내용은 Tableau 도움말에서 추출 만들기를 참조하십시오.

    통합 문서 성능을 향상시키는 일반적인 팁을 보려면 Tableau 도움말에서 "성능"을 검색하십시오. Tableau Server에 게시된 후 통합 문서의 성능을 알아 보려면 성능 기록을 만들면 됩니다. 자세한 내용은 성능 기록 만들기를 참조하십시오.

  • 증분 새로 고침 작업을 사용합니다. 증분 새로 고침 작업은 추출을 처음부터 만드는 대신 기존 추출에 새 행을 추가하는 방식으로 작동합니다. 이 유형의 추출 새로 고침은 추출 새로 고침 작업이 마지막으로 실행된 이후에 추가된 데이터만 처리하기 때문에 빠르게 실행됩니다. 하지만 이 방식은 데이터 원본에 추가된 데이터만 처리하고 업데이트된 데이터는 처리하지 못합니다. 결과적으로 증분 새로 고침 작업을 실행하는 경우에는 여전히 전체 새로 고침 작업을 때때로 실행해야 합니다. 예를 들어 데이터 원본에 대한 전체 새로 고침 작업을 매일 실행하는 대신 매주 한 번이나 두 번 실행할 수 있습니다.

추출 새로 고침의 실행 모드 구성

추출 새로 고침 일정을 만들 때 새로 고침이 병렬 실행 모드로 실행되는지 확인하십시오. 일정을 병렬로 실행하는 경우 일정에 새로 고침 작업이 하나만 포함되더라도 사용 가능한 모든 백그라운더 프로세스에서 실행됩니다. 일정을 연속으로 실행하는 경우 하나의 백그라운더 프로세스에서만 실행됩니다. 기본적으로 실행 모드는 새로 고침 작업이 가능한 빠르게 완료될 수 있도록 병렬로 설정됩니다.

하지만 실행 모드를 연속으로 설정해야 할 경우도 있습니다. 예를 들어 일정이 사용 가능한 모든 백그라운더 프로세스를 사용하여 다른 일정이 실행되지 못할 정도로 큰 경우에는 실행 모드를 연속으로 설정할 수 있습니다.

백그라운더 프로세스의 수 증가

단일 백그라운드 프로세스는 특정 작업에서 단일 CPU 코어의 100%를 사용할 수 있습니다. 결과적으로, 실행해야 할 인스턴스의 총 수는 컴퓨터에서 사용 가능한 코어 수에 따라 달라집니다. Tableau Server가 클러스터 환경에 설치되어 있고 별도의 노드에서 백그라운더 프로세스를 실행하는 경우 경험적인 규칙은 백그라운더 프로세스의 수를 백그라운더 프로세스를 실행하는 컴퓨터의 코어 수 절반과 전체 코어 수 사이로 설정하는 것입니다.

프로세스 구성에 대한 자세한 내용은 노드 구성을 참조하십시오.

프로세스 격리

Tableau Server를 클러스터 환경에 설치한 경우 백그라운더 프로세스를 별도의 노드로 이동하여 리소스를 경쟁하지 않게 만드는 것이 좋습니다. 백그라운더 프로세스는 CPU를 매우 많이 사용하기 때문에 CPU를 많이 사용하는 다른 프로세스가 실행되고 있는 노드에서 백그라운더 프로세스를 실행하면 서버 성능이 저하될 수 있습니다. 예를 들어 VizQL 서버 프로세스와 데이터 엔진 프로세스는 모두 CPU를 집중적으로 사용합니다. 자세한 내용은 권장 기준 구성 항목에서 2노드 구성을 읽어보십시오.

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!